4 天写完一篇 paper:我如何用 Pairwise Reference Alignment 给大模型 Eval 加上 Error Bar
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。