240924 - o1

o1的出现给了我极大的震撼,即使人们或者觉得它很贵不实用,或者觉得它连9.11和9.8哪个大都比不清。有人说它没有claude中EA版的循循善诱与人类情怀。

但我总有些不安,因为我只是一个信科培养出来的廉价的程序员。我上着并无多波澜的课程,刷着并无多波澜的算法题,试图掌握着底层系统运行的逻辑。

到后来我的编程能力已经炉火纯青,足以快速迁移到任何一个交叉学科和任务上。为了——找一个好工作?开什么玩笑,你能做的AI不久也能做。ASI近在咫尺。

在一场一万七千个在线参与者的编程竞赛,codeforces div2上,有人用o1-mini获得了二百多名的排名。也许,只有一万次提交之后它才能堪堪达到IOI金牌的水准。但是——但是o1只是一个模型,它和alphago这个system是不一样的。alphago当然也用到了神经网络,但是不仅仅是一次网络的推理就落子无悔。在神经网络之上还用到了搜索,在看过未来千千万万个结局后,才轻描淡写般下在了棋盘上。——而o1只是一个模型。

不久前和朋友聊MC里挖钻石,有一个算法讲的是AI先看了很多的玩MC的视频,而后自由探索,合成出什么就给它一个奖励,最后挖到了钻石。他说其实,或许只要有一个足够有用的先验,一些循序渐进的奖励,至少是能超越人类的。或许印证了那句话,当cot不再是英文时,智能也就出现了。

What did Ilya see.

我听说openai的researcher只是写单元测试,也只写一些high-level的想法,然后一切代码都可以让o1来尝试。