4 天写完一篇 paper:我如何用 Pairwise Reference Alignment 给大模型 Eval 加上 Error Bar
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。
这是一篇关于 Pairwise Reference Alignment 的口述式研究随笔:从给大模型 eval 加 error bar 的直觉出发,构造 sign agreement 和 margin observable,并记录用 Agent 在 4 天内完成 idea、论文、实验和发布的全过程。
Hello 大家好,好久不见,有一阵子没写笔记了。这段时间一直在忙着疯狂vibe coding——说是coding 其实不太准确,因为做了很多项目,并不完全是写代码的事。但确实有种停不下来的感觉:原本可能要花一个月甚至几天的复杂项目,现在一个下午几个小时就能出结果。然后紧接着快速迭代,继续往下做,这种节奏真的让人欲罢不能。 ...
一篇面向实践的 TypeScript 学习笔记,从 JavaScript / TypeScript 生态、运行时与模块加载、Promise 与事件系统,到类型系统和常见语法细节,建立对 TS 的整体核心概念。
围绕 SummaryAgent 的开发实践,复盘 Vibe/Agentic Coding、测试驱动开发与 RAG pipeline 设计,并讨论如何将 RAG 按搜索引擎的方法进行模块划分、接口设计与验证。
经过大半个月高强度的 Vibe Coding,我的直观感受是:很多过去觉得门槛很高、实现成本很重的事情,现在都变得容易了许多。做项目时甚至会产生一种“随心所欲”的感觉——想到一个功能,就能把它做出来;曾经那道看似难以跨越的技术鸿沟,正在被快速填平。 ...
🧭 引言 本文基于为期一周的深入调研,系统总结了AI编程Agent的技术现状与应用实践。核心研究问题是:如何有效地利用Agent进行编程开发? 同时,本文也将分享我对当前Agent技术发展的观察与思考。 ...