4 天写完一篇 paper:我如何用 Pairwise Reference Alignment 给大模型 Eval 加上 Error Bar
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。
Hello 大家好,好久不见,有一阵子没写笔记了。这段时间一直在忙着疯狂vibe coding——说是coding 其实不太准确,因为做了很多项目,并不完全是写代码的事。但确实有种停不下来的感觉:原本可能要花一个月甚至几天的复杂项目,现在一个下午几个小时就能出结果。然后紧接着快速迭代,继续往下做,这种节奏真的让人欲罢不能。 ...
🧭 引言 本文基于为期一周的深入调研,系统总结了AI编程Agent的技术现状与应用实践。核心研究问题是:如何有效地利用Agent进行编程开发? 同时,本文也将分享我对当前Agent技术发展的观察与思考。 ...