5月19日,DeepSeek正式发布说明,就近期用户反馈的模型内容返回异常问题作出公开回应,指出该异常系特殊字符引发的模型幻觉所致,不涉及任何安全问题或用户隐私泄露,同时承诺将通过针对性训练优化模型表现,彻底解决此类问题。
DeepSeek在声明中表示,技术团队经全面排查后发现,输入“<think>”等字符触发返回异常内容,属于特殊字符引发的模型幻觉。后续将通过针对性训练增强模型对特殊字符的识别与处理能力,修复相关的已知问题,优化模型在此类场景中的表现。
此前,多位用户在社交媒体和技术论坛上反映,在使用DeepSeek网页版时遇到了问题。在新建的空白对话框中,仅输入“”或类似字符后发送,模型并不会报错或要求澄清,而是会开始输出一段段看似完整、但与当前对话上下文毫无关联的问答内容。这些内容包罗万象,涉及数学解题、物理概念解释、线性代数、命理推演乃至教育学分析等多个领域。
这些回答的措辞方式高度结构化,频繁出现“我们被问到……”或“需要询问……”等书面化、第三人称的引导句式。部分用户在测试中还看到了涉及个人生辰八字等敏感信息的生成内容,这进一步引发了用户对于“对话泄露”或“训练数据外泄”的担忧。
对此,DeepSeek技术团队将问题定性为“模型幻觉”。在人工智能领域,“幻觉”特指模型生成看似合理但事实上不正确或与输入无关信息的行为。此次事件中的特殊字符“”,在模型训练和内部推理过程中,很可能被用作一种特殊的指令标记或分隔符,用于引导模型进入“思维链”推理模式。
当普通用户在前端对话界面意外输入此字符时,模型错误地将其识别为系统指令,从而触发了一种非预期的行为模式:它可能试图补全一个它“认为”应该存在的、但用户并未实际提供的“问题”,进而从其庞大的预训练语料库中,随机抽取或生成一段结构化的问答内容进行输出。这并非调取了其他用户的实时对话记录,而是模型基于其训练数据中的概率分布所进行的“无中生有”的补全。

有技术人员在完全断网的本地部署环境中复现了相同现象,从技术上排除了“实时串入其他用户会话”的可能性。因为本地环境与外部网络及其他用户物理隔离,模型输出的内容只能来源于其本身内置的权重和参数。
“模型幻觉”是当前大语言模型行业普遍存在的技术难题。根据上海申银万国证券研究所今年1月发布的报告,大模型的幻觉主要包括无中生有、事实错误、语境误解、逻辑谬误等,其根源可能来自模型架构、训练数据质量、奖励目标设计以及上下文窗口限制等多方面因素。该报告预计,通过工程化手段如RAG(检索增强生成)技术,2026年AI模型的幻觉将得到一定程度的有效控制,在部分严肃场景下的可用性正在提升。
然而,现实数据依然严峻。国际测评数据显示,大型语言模型的幻觉率差异巨大,在一般任务中多数模型处于20%至27%的区间,但在法律、医疗等高风险领域,幻觉率可飙升至69%至88%。清华大学新闻与传播学院新媒体研究中心的一项评测也发现,市场上多个热门大模型的事实性幻觉率超过19%。
更令人担忧的是,AI幻觉正从技术缺陷演变为系统性风险。《自然》《科学》等顶级期刊在今年4月初同时发声,警告AI大模型的“幻觉”缺陷正被系统化利用,用于批量生成带有伪造数据和“幽灵文献”的科研论文,对学术诚信构成严重污染。
