240924 - o1

2024-09-23 日记 0 Comments

o1的出现给了我极大的震撼，即使人们或者觉得它很贵不实用，或者觉得它连9.11和9.8哪个大都比不清。有人说它没有claude中EA版的循循善诱与人类情怀。

但我总有些不安，因为我只是一个信科培养出来的廉价的程序员。我上着并无多波澜的课程，刷着并无多波澜的算法题，试图掌握着底层系统运行的逻辑。

到后来我的编程能力已经炉火纯青，足以快速迁移到任何一个交叉学科和任务上。为了——找一个好工作？开什么玩笑，你能做的AI不久也能做。ASI近在咫尺。

在一场一万七千个在线参与者的编程竞赛，codeforces div2上，有人用o1-mini获得了二百多名的排名。也许，只有一万次提交之后它才能堪堪达到IOI金牌的水准。但是——但是o1只是一个模型，它和alphago这个system是不一样的。alphago当然也用到了神经网络，但是不仅仅是一次网络的推理就落子无悔。在神经网络之上还用到了搜索，在看过未来千千万万个结局后，才轻描淡写般下在了棋盘上。——而o1只是一个模型。

不久前和朋友聊MC里挖钻石，有一个算法讲的是AI先看了很多的玩MC的视频，而后自由探索，合成出什么就给它一个奖励，最后挖到了钻石。他说其实，或许只要有一个足够有用的先验，一些循序渐进的奖励，至少是能超越人类的。或许印证了那句话，当cot不再是英文时，智能也就出现了。

What did Ilya see.

我听说openai的researcher只是写单元测试，也只写一些high-level的想法，然后一切代码都可以让o1来尝试。

本文链接： http://emoairx.github.io/blog/2024/09/23/diary/diary240924/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

emoairxPKU,EECS

春天来了，冬天还会远吗~