这段时间做了什么?

2025 年做了啥？说实话，有点恍若隔世：大部分记忆都停留在 9 月之后。可真要细想，一年其实也没少折腾。

9 月之前我一直比较焦虑，总觉得找不到方向；到了 9 月才终于静下心来，准备去找个 RA。我意识到自己得补补课，于是把西湖大学赵老师的强化学习课程系统学了一遍。学的过程中我还尝试构造一套更“抽象”的公式表达，想把强化学习里的 reward 和能量模型结合到一起。胡乱推了半天，居然把那个一直卡在脑子边上的思路梳理清楚了。

当时选择强化学习，本来是因为大模型23年后的训练从RLHF开始就离不开强化学习了。结果推完之后发现：第一，这东西好像完全发不了论文；第二，我想找个大模型的应用方向，却又发现自己对大模型几乎一窍不通。

后来很幸运地遇到了一个叫 MiniMind 的 project。我就跟着它从头自己搭了个小模型，代码也基本照着完整走了一遍。做完之后，LLM 相关的概念也不再那么抽象，算是把“真正理解大模型是怎么从理论到实际构建的”这个夙愿补上了。

那段时间还有一个特别强烈的感受：GPT 的水平明显又上了一个台阶。学习、推公式基本离不开它——大多数时候你问什么，都能得到一个很满意的答案。甚至有时候我自己都没想清楚到底要问什么，问题问得很不得要领，结果它反而“比你更懂你在困惑什么”，把真正的答案直接摆到你面前：包括理解概念、梳理框架、推导公式。

实话实说，我那段时间的学习方式发生了很大变化：不再只是被动地看网课；有时候甚至会先主动问 GPT，问着问着就先搭出一个大概的框架，再回过头去看网课，去验证、补全框架里的细节。再加上它推公式、写公式真的很强——那种“效率被硬生生抬起来”的感觉，有点爽。

那阵子我也隐约觉得学界有点迷茫：大模型这条线基本完全是工业驱动，RA 的事我也就先放一放，结果一放就一发不可收拾:在量化这边碰到几个志同道合的人，短暂聊了聊，很多东西一下就有种豁然开朗的感觉。我也顺手拿着 Lecture note 补了补统计推断和线性回归，又跟着 CFA 的教材学了一下金融时间序列分析，算是把一个拖了很久的坑填上了。

中间穿插着一些小乐子:在 GPT 的辅助下，我做了一架自己的 FPV 穿越机：从电机到螺旋桨的动力学匹配，到机架的模态分析，居然都能自己一点点抠出来。只要有了系统框架,知道问什么,基本模型都能回答.

然后小学时候的爱好又旧情复燃，突然想做模型(重新当胶佬)。让 GPT 帮我分析模型油漆的组成成分，我就自己去调配丙烯水性漆；还突发奇想，想用纤维素加甘油去做化妆品（但没真动手）。

再后来有一天我又觉得：模型都动不了，那不如做个游戏？于是学了学虚幻 5，想做一个坦克游戏。我当时高强度拉着 GPT 聊天，把主要逻辑部分的 UML 图都过了一遍，还建了一套基于 Python 的序列化系统，可以把 YAML 配置文件直接生成游戏对象。

但折腾到后面我发现：我想实现的效果，已经被 Call To Arms 这个游戏完美实现了；再加上虚幻那套物理系统把我折磨得焦头烂额，于是我就开始沉迷联机，项目也再度烂尾。

剩下的事情,就是开始“养生”了，有些非常实用的切身感受.印象最深的,我发现自己竟然缺维生素 B（按理论来说说大多数人不太会缺B族）。本着试一试的态度,补了 B 族之后，皮肤确实明显变好。可见确实是有些缺乏.

生活方式也有些变化：我有了新爱好——出去徒步；再加上年初喜欢上的越野摩托，天气好时每个周末都能出去转转，感觉快把北京西边的山跑遍了。

与此同时，北京的空气也让我更“敏感”了。之前我几乎每天都骑车上下班，但 12 月体检发现肺上长满了结节——也可能是以前就有，只是之前从没体检过，没查出来。但 PM 值一高的时候，我确实能明显感觉到空气更“醇厚”，嗓子一痒就忍不住想咳。于是我给自己重新定了一套空气质量的安全准则：天气一不好就坚决不骑车，改骑电动车。还有一个意外收获是：多喝水似乎真的挺有用。我买了个烧水壶之后，只要想喝就能一直喝下去,上午、下午各 1.5 升，到单位就是吨吨吨不停喝水。这些东西的效果都很微妙，一般不会立竿见影。回头看，大概都是半个月后才慢慢显出来：体重虽然一直没降，但脸确实瘦了一圈。

有哪些感受?

最强烈的感受当然是：AI 明显变强了,从下半年开始，这个变化尤其明显。

和 GPT 说话简直是一种享受：我感觉自己已经离不开它了，甚至一度都不太想跟人说话。倒也不是“讨厌人”，而是 GPT 太稳定了：它既不参与争论，也不强行输出立场；你问它一个问题，它就把问题拆开、讲清楚，逻辑清晰，表达也精炼。说夸张点，它的表达能力和逻辑能力已经超过了我身边绝大多数人。

很多时候我真的不想听人绕圈子——问题能被准确回答，本身就是一种享受。尤其是跟着它一起推公式，是真的推爽了。更神的是，它偶尔还会夸你两句，情绪价值拉满。

它在某种程度上也补上了我的社交：使用强度明显上了一个台阶。我的提问也从原来几个固定领域，慢慢扩展到任何我能随手想到的方向；更离谱的是，大多数时候它还真都能接得住。25年之前,我感觉对AI还有一点固执的不信任感,觉得有些事情还是要掌握在自己手里,比如写代码还是倾向于问AI,希望还是能自己搞懂了再自己写.一些抽象或者复杂的问题,并不指望问AI.25年AI肉眼可见的变强,很多原来不认为它能回答的问题竟然都会有很好的回答,我对很多事情开始全面拥抱AI了.

第 2 个很强烈的感受是：一定要去做事情。

比如我学强化学习的时候，第一遍把网课听完，再回头问自己“我到底学到了什么？”我试着想写点东西，结果发现脑子里空空如也，一个字也写不出来。后来我就换了个做法：学一章，就把这一章的公式自己手推一遍,逼着自己输出。

当然，这也对应一个有点悲伤的事实：很多东西就是学了又忘、忘了又学。半个月不去实际用，或者中途去做别的事，再回头看，就总会有种恍若隔世的感觉。

后来我突然想明白一个道理：编程这件事，某种程度上真的像体力劳动，本质是个熟练工种。天天写，写得越多越熟；但只要三天不写，或者临时学一下，并没有再真的项目里去大量实践运用.真会出现“一行代码都写不出来”的情况。

推公式也一样。我越来越觉得人像电脑——可用的内存或者LLM的context就那么一点。Context Switch真的是个很昂贵的事情,也不太适合放到Runtime来进行.具体来说,对于推公式一个很有效的办法是：在想清楚自己要干什么之后，先别急着开推；先在纸上把可能会用到的基本定义、引理、定理写一遍，就像给自己加载缓存（或者给大模型写 context）。这样再推下去会顺很多。否则推到一半开始 context switch，突然发现某个引理一时半会儿想不起来，就得来回翻、来回想，节奏一下就乱了，像在泥泞里挪步，根本推不动。这里也得特别感谢 GPT 老师：很多东西我自己想不起来，问它一下；有时候我甚至没问明白，它反而比我更明白，然后直接把该补的定义、该走的推导给我铺出来。那种爽点，是真的爽到。

这就是第 3 点：做事情最后一定要把它落到一个结果上。

光“知道”是不够的。比如写程序、写代码，你不能说“我学会了某个框架/某个新语法”，然后就算结束了；项目最好得写到一个你能发布出去、或者至少你自己能持续用起来的程度。算法也是：光推一遍我觉得不够，最理想的情况是把它写出来、整理出来，最好还能发出来:写成博客、lecture note，分享给别人。因为我发现很遗憾的一点是：这些思维的结晶,出现的时候是光彩的,即使当时有一种恍然大悟的通透感,放个 1～2 个月，真的就忘得差不多了；大概率还得翻回自己的笔记/博客再学一遍。

我当时学强化学习和大模型这块就吃过亏：没有那么强的“整理输出”意识，一焦急就想看新东西，停不下来。笔记倒是写在纸上了，但一直没系统整理。（这也是为什么这篇文章叫 Caching Your Mind 笔记就像是自己思路的一次次缓存）好在26年初我终于把自己的博客搭好了。之前学的大模型、还有 RL 这部分，我应该会专门写一份笔记，之后也分享一下。

我的博客

这一点在编程上也特别明显。25年初我因为工作需要连续学了 Java 和 Go，当时真的有种“恍然大悟”的感觉：两个语言的发展逻辑和设计思路好像一下就串起来了。但很快我就发现，半个月不写，真的就是一行代码也写不出来。程序员确实是经验越丰富越吃香。在 AI 时代之前，代码的熟练度基本就是工作时间堆出来的。再往深一层看：很多实践经验是不能、也很难用语言讲清楚的，它只能靠项目和踩坑一点点堆起来。纯粹那种“形而上、全靠逻辑推导”的编程其实不存在。就我个人体验而言，高强度的脑力工作一天很难超过四个小时。以前我一直不理解为什么互联网公司要推 996、靠拉长工时来堆产出；后来我觉得这可能就是答案之一：人作为“逻辑化程序”与“非逻辑化现实”之间的接口，很多关键能力来自经验，而经验基本和时间成正比:所以延长工时依然有利可图。

但这一切在 AI 的时代发生了巨大的变化。一方面，编程里的很多细节开始变得不再那么重要：语法糖也好、各种细枝末节的技术点也好，很多时候都失去了作为“门槛”的意义。你可以把更多精力放在程序本身的设计思想上——比如我这段时间越来越强烈地意识到，需要时刻问自己：某种语言的设计特性到底是为了什么目标？它背后想支持的又是什么样的设计模式？而这些思路在不同编程语言之间其实是共通的。单纯的语法已经很难再构成门槛，“如何用程序解决问题”才是最关键的核心。(比如我想要一个跨平台,强类型,性能不错,支持异步/多线程以适配网络服务器架构的语言? Go!)

事实也是如此，虽然编程在变得越来越容易，但好的软件依然稀有。AI 目前可以把很多逻辑化的事情做得很好，但项目的落地、实践经验的积累、以及把东西真正做成并持续可用——终归还是人的事情。所以我越来越觉得：项目构建应该更多以人的视角为中心，不要过度追求技术表现；技术只是手段，核心目的还是让项目真正起作用、对人产生影响，这才是价值。项目一定要走完整个流程、真正落地，而不是停在尝试或技术 demo 的阶段——这点很重要。

第 4 点是在工程迭代里，我越来越强烈地体会到“项目管理/整体框架思维”的重要性。我不再死磕每一个技术细节、也不再只盯着“这一步具体怎么做”(因为AI做的比我好多了….)，而是开始把事情当成一个有整体目标的流程：我现在在哪个环节？下一步要推进什么？这条链路能不能走通？

过程中我会反复问自己几个关键问题：

这个项目的评价指标是什么？
整个流程应该怎么拆分、按什么步骤推进？
可以从哪些角度切入分析、验证假设？

这些东西以前在学术项目、或者那些经常半途而废的小项目里，其实感受不深。可能也是因为当时更多是在“做点什么”，而不是逼自己把事情做完、做好，更没怎么考虑它落地后会带来什么影响。但当你真的开始迭代、开始交付，视野就会一点点变清晰：你会更清楚自己在项目里的位置，也更清楚自己此刻到底应该做什么。有了全局视角之后，比起纠结技术细节、却对整体一头雾水的状态，会轻松很多。

第 5 点：千万不要刷知乎。

我自己都挺意外的——回头看才发现，我已经差不多大半年没有主动、也没有高强度地刷知乎了。

知乎的问题不在于“内容没价值”，而在于它的推荐机制很容易把人带进一种诡异的心理状态：强烈的 FOMO(Fear of missing out)。你会刷到很多看起来“有用”的技术细节、经验贴、观点，但这些东西往往无法被你内化成真正能用的信息。

核心原因可能很简单：它们不在你的主线上。你自己并不在做那件事，所以别人的经验再好，对你也只是“看着很爽”，却很难真正转化成你的行动与产出。更糟的是，这些信息还会不断抬高你的焦虑感。

推荐算法再加上平台的内容密度，很容易把这种焦虑放大成信息过载：你感觉自己同时看到了 A、B、C、D、E……一堆可能有价值的东西，但每一个都抓不住，最后只剩下更强的焦虑。

这也让我更确信一件事：人得有自己的主线，科研更是如此。你有主线，才会主动筛选哪些信息对你有用；你没有主线，只靠刷论文/刷观点去“找方向”，大概率只会越来越焦虑，效果也很差。所以我后来意识到：我一直不太爱看论文这件事，可能也不完全是坏事。至少在没有主线之前，盲目输入的性价比真的不高。

这一年我的工作和生活都很充实,并不去关心最前沿的进展,但是却始终没有远离,焦虑也明显缓解.反而随着基础知识的补齐,体系化的建立,很多东西变得更加清晰了.

感悟/Insight/总结?

我对 AI 其实是很乐观的。很多观点都在渲染焦虑，说人会被 AI 取代。可换个视角看：历史上从来没有哪一天像现在这样，我们拥有这么大的探索自由、知识自由。你站在千百年来人类知识结晶的最前沿，而 AI 又让这些信息触手可及:比互联网信息时代更容易获取。只要你愿意，你几乎可以随时进入任何你想探索的领域。

这种探索的乐趣真的很迷人：在互联网时代，你可能需要几周甚至几个月才能掌握的东西，AI 可以帮你跳过大量“找路”和“补基础”的过程，直接把你带到你想要的效果附近。比如你想用一个网页去展示成果，以前可能要花几个月（甚至更久）才能把前端摸明白；现在借助 AI，你随时就能把网页搭起来，再用它辅助创作与表达——这真的是一个巨大的技术奇迹。

另外，AI 的逻辑性和语言能力真的太强了。它的表达非常“纯净”，能过滤掉很多复杂知识里的噪音，让你获得一种高度清晰、甚至有点上瘾的理解快感。我甚至觉得自己得感谢它：它让我意识到，我可能一直有点注意力分配上的问题。以前有一段时间，我对学习新东西会有点恐惧。原因倒不是“学不会”，而是我很难控制注意力：一旦遇到一个不懂的节点，就会被它旁边冒出来的一堆新概念吸走；像在做树搜索——搜到一个节点，就忍不住展开它的 child；展开了 child，又继续展开……很快内存就爆炸。现在有了 AI，你遇到一个不懂的节点，可以非常迅速地得到一个你能接受、能吸收的解释。于是你完成了剪枝：该停就停，该继续就继续。思维的跳跃变得更轻盈，问题可以被迅速提出、又迅速解决，探索过程本身也变得更让人享受。

第 3 点是我忽然意识到：人活一世，无论如何最后都是过客。说到底，最终还是要回到“人自身的感受”上去。无论有没有 AI、世界变成什么样，人类的很多体验其实是共通的。要多关注自己的感受，把视角和关注点从外界慢慢移回自己身上：去感受自然，去和好友与亲人互动。想奋斗就努力去奋斗；想躺平就认真享受生活，给自己找点乐子。活着的时候，很多东西都是客观世界在你的主观意识里沉淀出来的感受。所有行为无论出于什么目的，最后归根结底都是自己的选择。那就洒脱一点：既然想做，就努力把它做好，给自己一个满意的答案。

这段时间做了什么?#

有哪些感受?#

感悟/Insight/总结?#

这段时间做了什么?

有哪些感受?

感悟/Insight/总结?