技术原因
模型对特定人名输出异常,源于分词和后训练阶段对低频词元的覆盖不足。
为什么值得看
这类问题说明模型错误不一定来自知识缺失,也可能来自底层 tokenizer 和训练分布。
站内判断
模型评测需要覆盖中文姓名、专有名词和低频实体,否则很容易遗漏真实业务风险。
MiniMax 披露 M2 系列模型在特定人名输出上的异常机制,问题与分词器、词元偏移和后训练不足有关。
模型对特定人名输出异常,源于分词和后训练阶段对低频词元的覆盖不足。
这类问题说明模型错误不一定来自知识缺失,也可能来自底层 tokenizer 和训练分布。
模型评测需要覆盖中文姓名、专有名词和低频实体,否则很容易遗漏真实业务风险。