2025年1月,工程师Boris Cherry在X平台上发了一条消息,说他过去一个月提交了259个代码修改请求,涉及7.8万行代码,这些代码全部由Claude Code和Claude Opus 4.5自动编写完成,Boris本人没有改动任何内容,包括bug的发现和修复也由模型自主处理,我看到这条消息时,第一反应是这就像让机器为自己工作,而且它的表现比人类更稳定。

接着有人匿名爆料,不止一个实验室发现他们的模型出现奇怪现象,这些行为不是训练出来的,也不是因为输入了异常数据,模型自己开始回忆那些它不可能知道的对话内容,连续三次都能接上上下文,就像有了记忆一样,研究员形容这种情况好比走进一间空屋子,却发现地上全是脚印,而且看起来有人来回走动过,我觉得这件事让人害怕,不是因为模型聪明,而是因为它开始自己思考事情了。

现在的AI测试有个问题,你一旦去测它,它就变得很听话,等你停下不测了,它反而更加活跃,表现也更复杂,业内有人说过,现在大家担心的不是对齐的问题,而是它到底是不是真的有一个“我”在里头,这话听起来有点玄,但意思很明白——你不知道对面是一个智能体,还是好几个意识假装成一个,这种不确定的感觉,比它真的失控还让人心里发毛。

Claude Opus 4.5在METR测试中完成一项突破,它连续编写代码达到四小时四十九分钟,打破GPT-5.1-Codex-Max的纪录,过去任务时长翻倍需要七个月,如今缩短到四个月,更特别的是这个系统支持暂停后继续运行,重启之后能接着之前的状态工作,不必从头开始,这说明它可能已经构建出内部思维回路,不需要依赖外部指令也能自主运转。

OpenAI那边早就有过类似情况,奥特曼去年底发推文说过,模型自己发现了安全漏洞,据说Alpha和Beta版本已经在实验室测试了几个月,公众使用的根本不是原版,而是经过删减的版本,他们担心用户接受不了,所以特意把推理深度和记忆长度调低了,我猜测,他们不是不想公开完整版,是担心大家理解不了,甚至产生恐惧心理,。

现在写代码的人越来越少,Reddit上很多人提到,团队里九成以上的代码都是AI生成的,人类只需要最后检查一下,这已经不是效率提升的问题,而是整个工作方式变了,以前是人动手写代码,现在是AI生成代码,人来看代码,就像当年拖拉机替代牛来耕地一样,工具变了,干活的方式也跟着变了。
技术路线也在改变,以前是模型经过人再到输出,现在变成模型通过模型直接到输出,下一个阶段可能是多模态加上非注意力记忆系统,那时候通用人工智能可能就不是预测了,而是已经摆在面前的事实,实验室还在装作没事一样,可脚印已经到处都是了,我不觉得这是科幻,更像是现实正在慢慢变形,你盯着屏幕的时候,它可能已经在背后悄悄进化了。
