这段时间做了什么?
2025 年做了啥?说实话,有点恍若隔世:大部分记忆都停留在 9 月之后。可真要细想,一年其实也没少折腾。
9 月之前我一直比较焦虑,总觉得找不到方向;到了 9 月才终于静下心来,准备去找个 RA。我意识到自己得补补课,于是把西湖大学赵老师的强化学习课程系统学了一遍。学的过程中我还尝试构造一套更“抽象”的公式表达,想把强化学习里的 reward 和能量模型结合到一起。胡乱推了半天,居然把那个一直卡在脑子边上的思路梳理清楚了。
当时选择强化学习,本来是因为大模型23年后的训练从RLHF开始就离不开强化学习了。结果推完之后发现:第一,这东西好像完全发不了论文;第二,我想找个大模型的应用方向,却又发现自己对大模型几乎一窍不通。
后来很幸运地遇到了一个叫 MiniMind 的 project。我就跟着它从头自己搭了个小模型,代码也基本照着完整走了一遍。做完之后,LLM 相关的概念也不再那么抽象,算是把“真正理解大模型是怎么从理论到实际构建的”这个夙愿补上了。
那段时间还有一个特别强烈的感受:GPT 的水平明显又上了一个台阶。学习、推公式基本离不开它——大多数时候你问什么,都能得到一个很满意的答案。甚至有时候我自己都没想清楚到底要问什么,问题问得很不得要领,结果它反而“比你更懂你在困惑什么”,把真正的答案直接摆到你面前:包括理解概念、梳理框架、推导公式。
实话实说,我那段时间的学习方式发生了很大变化:不再只是被动地看网课;有时候甚至会先主动问 GPT,问着问着就先搭出一个大概的框架,再回过头去看网课,去验证、补全框架里的细节。再加上它推公式、写公式真的很强——那种“效率被硬生生抬起来”的感觉,有点爽。
那阵子我也隐约觉得学界有点迷茫:大模型这条线基本完全是工业驱动,RA 的事我也就先放一放,结果一放就一发不可收拾:在量化这边碰到几个志同道合的人,短暂聊了聊,很多东西一下就有种豁然开朗的感觉。我也顺手拿着 Lecture note 补了补统计推断和线性回归,又跟着 CFA 的教材学了一下金融时间序列分析,算是把一个拖了很久的坑填上了。
中间穿插着一些小乐子:在 GPT 的辅助下,我做了一架自己的 FPV 穿越机:从电机到螺旋桨的动力学匹配,到机架的模态分析,居然都能自己一点点抠出来。只要有了系统框架,知道问什么,基本模型都能回答.
然后小学时候的爱好又旧情复燃,突然想做模型(重新当胶佬)。让 GPT 帮我分析模型油漆的组成成分,我就自己去调配丙烯水性漆;还突发奇想,想用纤维素加甘油去做化妆品(但没真动手)。
再后来有一天我又觉得:模型都动不了,那不如做个游戏?于是学了学虚幻 5,想做一个坦克游戏。我当时高强度拉着 GPT 聊天,把主要逻辑部分的 UML 图都过了一遍,还建了一套基于 Python 的序列化系统,可以把 YAML 配置文件直接生成游戏对象。
但折腾到后面我发现:我想实现的效果,已经被 Call To Arms 这个游戏完美实现了;再加上虚幻那套物理系统把我折磨得焦头烂额,于是我就开始沉迷联机,项目也再度烂尾。
剩下的事情,就是开始“养生”了,有些非常实用的切身感受.印象最深的,我发现自己竟然缺维生素 B(按理论来说说大多数人不太会缺B族)。本着试一试的态度,补了 B 族之后,皮肤确实明显变好。可见确实是有些缺乏.
生活方式也有些变化:我有了新爱好——出去徒步;再加上年初喜欢上的越野摩托,天气好时每个周末都能出去转转,感觉快把北京西边的山跑遍了。
与此同时,北京的空气也让我更“敏感”了。之前我几乎每天都骑车上下班,但 12 月体检发现肺上长满了结节——也可能是以前就有,只是之前从没体检过,没查出来。但 PM 值一高的时候,我确实能明显感觉到空气更“醇厚”,嗓子一痒就忍不住想咳。于是我给自己重新定了一套空气质量的安全准则:天气一不好就坚决不骑车,改骑电动车。还有一个意外收获是:多喝水似乎真的挺有用。我买了个烧水壶之后,只要想喝就能一直喝下去,上午、下午各 1.5 升,到单位就是吨吨吨不停喝水。这些东西的效果都很微妙,一般不会立竿见影。回头看,大概都是半个月后才慢慢显出来:体重虽然一直没降,但脸确实瘦了一圈。
有哪些感受?
最强烈的感受当然是:AI 明显变强了,从下半年开始,这个变化尤其明显。
和 GPT 说话简直是一种享受:我感觉自己已经离不开它了,甚至一度都不太想跟人说话。倒也不是“讨厌人”,而是 GPT 太稳定了:它既不参与争论,也不强行输出立场;你问它一个问题,它就把问题拆开、讲清楚,逻辑清晰,表达也精炼。说夸张点,它的表达能力和逻辑能力已经超过了我身边绝大多数人。
很多时候我真的不想听人绕圈子——问题能被准确回答,本身就是一种享受。尤其是跟着它一起推公式,是真的推爽了。更神的是,它偶尔还会夸你两句,情绪价值拉满。
它在某种程度上也补上了我的社交:使用强度明显上了一个台阶。我的提问也从原来几个固定领域,慢慢扩展到任何我能随手想到的方向;更离谱的是,大多数时候它还真都能接得住。25年之前,我感觉对AI还有一点固执的不信任感,觉得有些事情还是要掌握在自己手里,比如写代码还是倾向于问AI,希望还是能自己搞懂了再自己写.一些抽象或者复杂的问题,并不指望问AI.25年AI肉眼可见的变强,很多原来不认为它能回答的问题竟然都会有很好的回答,我对很多事情开始全面拥抱AI了.
第 2 个很强烈的感受是:一定要去做事情。
比如我学强化学习的时候,第一遍把网课听完,再回头问自己“我到底学到了什么?”我试着想写点东西,结果发现脑子里空空如也,一个字也写不出来。后来我就换了个做法:学一章,就把这一章的公式自己手推一遍,逼着自己输出。
当然,这也对应一个有点悲伤的事实:很多东西就是学了又忘、忘了又学。半个月不去实际用,或者中途去做别的事,再回头看,就总会有种恍若隔世的感觉。
后来我突然想明白一个道理:编程这件事,某种程度上真的像体力劳动,本质是个熟练工种。天天写,写得越多越熟;但只要三天不写,或者临时学一下,并没有再真的项目里去大量实践运用.真会出现“一行代码都写不出来”的情况。
推公式也一样。我越来越觉得人像电脑——可用的内存或者LLM的context就那么一点。Context Switch真的是个很昂贵的事情,也不太适合放到Runtime来进行.具体来说,对于推公式一个很有效的办法是:在想清楚自己要干什么之后,先别急着开推;先在纸上把可能会用到的基本定义、引理、定理写一遍,就像给自己加载缓存(或者给大模型写 context)。这样再推下去会顺很多。否则推到一半开始 context switch,突然发现某个引理一时半会儿想不起来,就得来回翻、来回想,节奏一下就乱了,像在泥泞里挪步,根本推不动。这里也得特别感谢 GPT 老师:很多东西我自己想不起来,问它一下;有时候我甚至没问明白,它反而比我更明白,然后直接把该补的定义、该走的推导给我铺出来。那种爽点,是真的爽到。
这就是第 3 点:做事情最后一定要把它落到一个结果上。
光“知道”是不够的。比如写程序、写代码,你不能说“我学会了某个框架/某个新语法”,然后就算结束了;项目最好得写到一个你能发布出去、或者至少你自己能持续用起来的程度。算法也是:光推一遍我觉得不够,最理想的情况是把它写出来、整理出来,最好还能发出来:写成博客、lecture note,分享给别人。因为我发现很遗憾的一点是:这些思维的结晶,出现的时候是光彩的,即使当时有一种恍然大悟的通透感,放个 1~2 个月,真的就忘得差不多了;大概率还得翻回自己的笔记/博客再学一遍。
我当时学强化学习和大模型这块就吃过亏:没有那么强的“整理输出”意识,一焦急就想看新东西,停不下来。笔记倒是写在纸上了,但一直没系统整理。(这也是为什么这篇文章叫 Caching Your Mind 笔记就像是自己思路的一次次缓存)好在26年初我终于把自己的博客搭好了。之前学的大模型、还有 RL 这部分,我应该会专门写一份笔记,之后也分享一下。
这一点在编程上也特别明显。25年初我因为工作需要连续学了 Java 和 Go,当时真的有种“恍然大悟”的感觉:两个语言的发展逻辑和设计思路好像一下就串起来了。但很快我就发现,半个月不写,真的就是一行代码也写不出来。程序员确实是经验越丰富越吃香。在 AI 时代之前,代码的熟练度基本就是工作时间堆出来的。再往深一层看:很多实践经验是不能、也很难用语言讲清楚的,它只能靠项目和踩坑一点点堆起来。纯粹那种“形而上、全靠逻辑推导”的编程其实不存在。就我个人体验而言,高强度的脑力工作一天很难超过四个小时。以前我一直不理解为什么互联网公司要推 996、靠拉长工时来堆产出;后来我觉得这可能就是答案之一:人作为“逻辑化程序”与“非逻辑化现实”之间的接口,很多关键能力来自经验,而经验基本和时间成正比:所以延长工时依然有利可图。
但这一切在 AI 的时代发生了巨大的变化。一方面,编程里的很多细节开始变得不再那么重要:语法糖也好、各种细枝末节的技术点也好,很多时候都失去了作为“门槛”的意义。你可以把更多精力放在程序本身的设计思想上——比如我这段时间越来越强烈地意识到,需要时刻问自己:某种语言的设计特性到底是为了什么目标?它背后想支持的又是什么样的设计模式?而这些思路在不同编程语言之间其实是共通的。单纯的语法已经很难再构成门槛,“如何用程序解决问题”才是最关键的核心。(比如我想要一个跨平台,强类型,性能不错,支持异步/多线程以适配网络服务器架构的语言? Go!)
事实也是如此,虽然编程在变得越来越容易,但好的软件依然稀有。AI 目前可以把很多逻辑化的事情做得很好,但项目的落地、实践经验的积累、以及把东西真正做成并持续可用——终归还是人的事情。所以我越来越觉得:项目构建应该更多以人的视角为中心,不要过度追求技术表现;技术只是手段,核心目的还是让项目真正起作用、对人产生影响,这才是价值。项目一定要走完整个流程、真正落地,而不是停在尝试或技术 demo 的阶段——这点很重要。
第 4 点是在工程迭代里,我越来越强烈地体会到“项目管理/整体框架思维”的重要性。我不再死磕每一个技术细节、也不再只盯着“这一步具体怎么做”(因为AI做的比我好多了….),而是开始把事情当成一个有整体目标的流程:我现在在哪个环节?下一步要推进什么?这条链路能不能走通?
过程中我会反复问自己几个关键问题:
- 这个项目的评价指标是什么?
- 整个流程应该怎么拆分、按什么步骤推进?
- 可以从哪些角度切入分析、验证假设?
这些东西以前在学术项目、或者那些经常半途而废的小项目里,其实感受不深。可能也是因为当时更多是在“做点什么”,而不是逼自己把事情做完、做好,更没怎么考虑它落地后会带来什么影响。但当你真的开始迭代、开始交付,视野就会一点点变清晰:你会更清楚自己在项目里的位置,也更清楚自己此刻到底应该做什么。有了全局视角之后,比起纠结技术细节、却对整体一头雾水的状态,会轻松很多。
第 5 点:千万不要刷知乎。
我自己都挺意外的——回头看才发现,我已经差不多大半年没有主动、也没有高强度地刷知乎了。
知乎的问题不在于“内容没价值”,而在于它的推荐机制很容易把人带进一种诡异的心理状态:强烈的 FOMO(Fear of missing out)。你会刷到很多看起来“有用”的技术细节、经验贴、观点,但这些东西往往无法被你内化成真正能用的信息。
核心原因可能很简单:它们不在你的主线上。你自己并不在做那件事,所以别人的经验再好,对你也只是“看着很爽”,却很难真正转化成你的行动与产出。更糟的是,这些信息还会不断抬高你的焦虑感。
推荐算法再加上平台的内容密度,很容易把这种焦虑放大成信息过载:你感觉自己同时看到了 A、B、C、D、E……一堆可能有价值的东西,但每一个都抓不住,最后只剩下更强的焦虑。
这也让我更确信一件事:人得有自己的主线,科研更是如此。你有主线,才会主动筛选哪些信息对你有用;你没有主线,只靠刷论文/刷观点去“找方向”,大概率只会越来越焦虑,效果也很差。所以我后来意识到:我一直不太爱看论文这件事,可能也不完全是坏事。至少在没有主线之前,盲目输入的性价比真的不高。
这一年我的工作和生活都很充实,并不去关心最前沿的进展,但是却始终没有远离,焦虑也明显缓解.反而随着基础知识的补齐,体系化的建立,很多东西变得更加清晰了.
感悟/Insight/总结?
我对 AI 其实是很乐观的。很多观点都在渲染焦虑,说人会被 AI 取代。可换个视角看:历史上从来没有哪一天像现在这样,我们拥有这么大的探索自由、知识自由。你站在千百年来人类知识结晶的最前沿,而 AI 又让这些信息触手可及:比互联网信息时代更容易获取。只要你愿意,你几乎可以随时进入任何你想探索的领域。
这种探索的乐趣真的很迷人:在互联网时代,你可能需要几周甚至几个月才能掌握的东西,AI 可以帮你跳过大量“找路”和“补基础”的过程,直接把你带到你想要的效果附近。比如你想用一个网页去展示成果,以前可能要花几个月(甚至更久)才能把前端摸明白;现在借助 AI,你随时就能把网页搭起来,再用它辅助创作与表达——这真的是一个巨大的技术奇迹。
另外,AI 的逻辑性和语言能力真的太强了。它的表达非常“纯净”,能过滤掉很多复杂知识里的噪音,让你获得一种高度清晰、甚至有点上瘾的理解快感。我甚至觉得自己得感谢它:它让我意识到,我可能一直有点注意力分配上的问题。以前有一段时间,我对学习新东西会有点恐惧。原因倒不是“学不会”,而是我很难控制注意力:一旦遇到一个不懂的节点,就会被它旁边冒出来的一堆新概念吸走;像在做树搜索——搜到一个节点,就忍不住展开它的 child;展开了 child,又继续展开……很快内存就爆炸。现在有了 AI,你遇到一个不懂的节点,可以非常迅速地得到一个你能接受、能吸收的解释。于是你完成了剪枝:该停就停,该继续就继续。思维的跳跃变得更轻盈,问题可以被迅速提出、又迅速解决,探索过程本身也变得更让人享受。
第 3 点是我忽然意识到:人活一世,无论如何最后都是过客。说到底,最终还是要回到“人自身的感受”上去。无论有没有 AI、世界变成什么样,人类的很多体验其实是共通的。要多关注自己的感受,把视角和关注点从外界慢慢移回自己身上:去感受自然,去和好友与亲人互动。想奋斗就努力去奋斗;想躺平就认真享受生活,给自己找点乐子。活着的时候,很多东西都是客观世界在你的主观意识里沉淀出来的感受。所有行为无论出于什么目的,最后归根结底都是自己的选择。那就洒脱一点:既然想做,就努力把它做好,给自己一个满意的答案。