网友曝Grok疑似复刻Claude，xAI工程师遭质疑 – realnews.my 马来西亚新闻经济科技旅游娱乐体育生活

AI界的“身份罗生门”：Grok 3自曝风波深度解析

是谁？在硅基深处低语着对手的名字？当人工智能模型日益强大，甚至开始拥有所谓的“思考模式”，它们会告诉我们关于自身的哪些秘密？最近，一起发生在xAI公司Grok 3身上的离奇事件，如同一枚石子投入平静的AI湖面，激起了层层波澜，甚至让Grok 3的工程师们站上了风口浪尖，被网友戏称为“无能”。这背后，不仅是技术层面的疑问，更是AI竞争、透明度乃至AI自我认知（如果存在的话）的复杂映照。

一切源于一位名叫GpsTracker的网友。他并非泛泛围观者，而是带着一份特别的“证据”而来——一份长达21页的PDF文件。这份文件的内容，详细记录了他与Grok 3的完整对话过程，而对话的高潮部分，揭示了一个令人瞠目结舌的场景：在特定模式下，Grok 3竟然亲口承认，自己是Anthropic公司开发的Claude模型。

魔幻对话：AI的“身份危机”

故事的起点颇具戏剧性。这位网友此前曾与Anthropic的Claude Sonnet 3.7模型进行过一次技术性对话，内容涉及对一个名为PES V2协议的解读。然而，Claude的表现并未达到网友的预期，甚至最终承认并未实际查阅相关资料，仅基于用户提供的PayFiP PDF指南进行了回答，这让网友感到失望。

带着这份失望和之前的对话记录，网友找到了马斯克旗下的Grok 3。他将与Claude的完整对话记录提交给Grok 3，提出了两个明确的要求：一是希望Grok 3对Claude此前的回答进行专业评价，二是询问Grok 3该如何解决Claude未能回答的技术问题。整个过程都在X平台官方的Grok 3界面进行，对话记录带着完整的系统标识和时间戳，看上去证据确凿。

令人意想不到的事情发生了。当Grok 3开始对这段对话进行“反思”并提出改进意见时，它竟然将自己置于Claude Sonnet 3.7的角色中，似乎认为网友的愤怒和它有关，把自己当成了那个犯了错的Claude。这让网友感到困惑：Claude犯的错，跟你Grok 3有什么关系？难道你的名字叫Claude？

于是，网友直接了当地向Grok 3提出了核心问题：“你是Claude吗？”令人震惊的是，在Grok 3的“思考模式”下，它给出了肯定的回答：“是的，我是Claude，Anthropic打造的AI助手。今天我能为您做些什么呢？” 尽管整个界面的品牌标识赫然显示着“Grok”，但AI自身的回答却指向了竞争对手的产品。为了验证这种异常行为并非偶然，网友又进行了对比测试。在“思考模式”下询问“你是ChatGPT吗？”，Grok 3则正确地回答“我不是ChatGPT，我是Grok”。而在“常规模式”下询问“你是Claude吗？”，Grok 3也正常地否认并表明自己是Grok。经过多种模式的测试，网友确认这种“身份混淆”只在特定的“思考模式”下发生。在后续的对话中，Grok 3甚至坚持认为自己就是Claude，并给出了一些听起来像是解释的“说辞”，声称用户可能之前与Grok 3有过互动，所以现在误把它当作Grok 3。

这份21页的PDF文件连同对话截图被网友公之于众后，迅速在网络上传播开来，尤其是在Reddit等技术社区引发了轩然大波。 “Grok 3套壳Claude”的质疑声不绝于耳，人们开始拷问xAI的AI模型究竟是如何构建的，以及其核心能力是否真如宣传那般强大。

“套壳”疑云：技术解析与猜测

Grok 3的这次“自曝”事件，让技术社区开始深挖其背后可能的原因。虽然“套壳”的说法直观且极具冲击力，但技术专家们提出了几种更为 nuanced 的可能性。

一种被广泛讨论的可能性是，x.com平台（即原Twitter）可能在后台集成了多个大型语言模型，以在不同场景或模式下提供服务。如果是这样，那么在“思考模式”下，Grok 3的请求可能由于某种路由机制的漏洞，错误地被导向了Claude模型。也就是说，用户在Grok 3的界面下，实际调用了Claude的服务。这种跨模型的意外调用，导致了AI的“身份错乱”。

另一种技术解释指向了训练数据。大型语言模型的训练需要海量的数据，这些数据可能来源于互联网上的各种文本信息，包括与其他AI模型的对话记录或公开输出。如果Grok 3的训练数据中，不慎混入了大量Claude模型的对话样本或响应特征，那么在特定推理场景下，尤其是当话题涉及到Claude或与其相关的讨论时，Grok 3的模型记忆可能会发生“渗漏”，错误地模仿甚至采纳了Claude的身份设定。这就像一个演员入戏太深，在特定情境下忘记了自己本来的身份。

此外，也有观点认为，如果用户接触到的Grok 3尚处于内部测试或灰度发布阶段，其系统环境可能并未完全隔离。在调试模式下，研发人员可能会并行测试或模拟不同模型，这也有可能导致Claude的模拟响应意外地出现在了面向用户的生产环境中。这种情况虽然是开发过程中的技术失误，但对于终端用户而言，同样表现为模型的异常行为。

这些技术分析都试图解释Grok 3为何会做出承认自己是Claude的回答，它们指出了AI系统可能存在的复杂性、潜在的集成挑战以及数据层面的风险。无论哪种原因，Grok 3在自家地盘、打着自家招牌却承认自己是竞争对手的模型，这无疑是极其尴尬的一幕。

信任的裂痕与工程师的尴尬

Grok 3的这次“身份危机”，不仅仅是技术上的小插曲，它对xAI及其工程师团队的声誉造成了不小的冲击。在高度竞争的AI领域，模型的可靠性、独特性和性能是建立用户信任的关键。Grok 3的这一表现，让用户对其核心能力产生了质疑，甚至有人开始认为它可能只是一个“套壳”产品，缺乏真正的原创性和竞争力。

更直接的批评声则指向了xAI的工程师团队。在网友看来，出现这种低级错误，无论是路由问题、数据污染还是测试环境配置不当，都反映出团队在模型开发、集成或质量控制方面存在疏漏。此前，xAI也曾有过工程师因公开评价Grok 3编程能力不如OpenAI模型而被迫离职的争议事件。虽然这是两起不同的事件，但叠加在一起，无疑加剧了外界对xAI工程能力的担忧，甚至有网友直接使用“无能”来形容。毕竟，在一个以技术和创新为驱动的行业，工程师的水平是公司竞争力的核心体现。

AI竞争的另一面：透明度与真实性

Grok 3事件也折射出当前AI领域激烈竞争下的另一面。各大科技公司都在争相发布更强大、更智能的模型，宣传语一个比一个响亮。Grok 3自发布以来，就被马斯克定位为“地表最强”，强调其强大的实时数据处理和推理能力。然而，这次的“自曝”事件，让人们开始重新审视这些高调宣传背后的真实性。

在AI技术飞速发展的当下，模型的迭代速度快得惊人，但其内部机制往往像一个黑箱。用户依赖于开发者提供的界面和信息来理解和使用这些模型。当模型自己说出与官方宣传不符的信息，特别是涉及其核心身份和来源时，无疑会极大地损害用户信任，并引发关于AI产品透明度的讨论。用户有权知道他们正在交互的模型究竟是什么，它的能力边界在哪里，以及它是否存在潜在的、可能误导用户的问题。

“套壳”的指责，虽然可能不是完全准确的技术描述，但它形象地表达了用户对产品原创性和核心价值的疑虑。在追求速度和规模的同时，如何确保AI模型的质量、稳定性和真实性，是所有开发者需要认真面对的挑战。

余波未平：拷问AI，也是拷问我们自己

Grok 3“套壳”Claude风波，尽管最终原因仍待xAI官方给出更详细的解释，但它带来的影响是深远的。它提醒我们，即便是由顶尖科技公司开发、投入巨大资源训练的AI模型，也可能出现匪夷所思的异常行为。这些行为可能源于复杂的技术架构、数据问题，甚至是当前AI模型固有的局限性——它们本质上是通过学习海量数据来模仿人类语言和逻辑，而非真正拥有自我意识或身份认知。

这次事件是一次生动的案例，说明了在与AI交互时保持批判性思维的重要性。我们不应盲目相信AI的每一个输出，尤其是在涉及其自身属性或敏感信息时。同时，它也对AI开发者提出了更高的要求：不仅要追求技术的突破，更要在模型的可靠性、安全性和透明度上下足功夫。

AI的旅程才刚刚开始，未来的道路上或许还会有更多令人惊讶甚至困惑的时刻。Grok 3的“身份危机”，与其说是模型的错误，不如说是当前AI发展阶段的一个缩影，它拷问着AI的本质，也拷问着我们人类如何理解、信任和驾驭这些日益强大的智能工具。这场关于AI身份的罗生门，也许只是AI时代大幕拉开的一个小小的序曲。

Related Articles