Harness or not harness, it is a question

2026 年开年以来,harness engineering 这个词以病毒式传播的速度席卷了整个 AI 工程圈。Mitchell Hashimoto 给它命了名,OpenAI 用百万行零手写代码的项目给它做了广告,Stripe 每周 1300 个 AI PR 给它背了书。一时间,仿佛不谈 harness 就不配做 AI 工程师。 但热闹看完之后,有些问题值得冷静想一想。 Harness 到底是什么 Harness 这个词来自马具——缰绳、马鞍、

AI 推广、工贼与囚徒困境

一个不太体面的比喻 "工贼"这词不好听,但你仔细品品,它描述的那个角色在当下的 AI 浪潮里正在被大规模制造。 公司让你拥抱 AI,用 Copilot 写代码,用 ChatGPT 写文档,用各种 agent 搞自动化。你照做了,效率翻倍,季度汇报上你是"数字化转型标兵"。很好。但你有没有想过一个问题:你每一次漂亮的 demo,都在帮管理层完成一个论证——"看,一个人加个 AI 就能干三个人的活,我们确实不需要那么多 headcount

CLI Everything 和 AI native infra

最近"CLI 化网站"这个方向突然热了起来。港大的 cli-anything、卡比卡比写的 opencli、还有 bb-browser,三个项目实现思路各有侧重——有从前端源码逆向接口的,有通过 Chrome 插件在运行时探测网络请求的——但最终目标高度一致:把网站原本给浏览器用的 API,重新包装成给 AI 调用的 CLI。 从用户视角看,这类工具最直接的价值是打通 C 端孤岛。各个平台的数据和操作,不再被 GUI 困在浏览器里,而是能被脚本编排、被 AI

AI 巡检与 AI 排障

AI 巡检与 AI 排障 Mar 24, 2026 · 4 min read 前 AI 时代,巡检和排障都是又辛苦又烦人的体力活。 巡检需要你盯着告警和大量的监控面板,时刻思考系统是不是出什么问题了,有问题还得及时介入。之前和朋友聊天,听说国内某头部量化公司,最近一两年居然还要求 SRE 在开盘时间全程盯着监控面板,也是非常神奇。 排障则需要你对自己干活的语言做到基本精通,比如几年前在给人做培训的时候,单是性能优化这一节就做了大概 120 页 PPT,也只是简单介绍了程序员日常排查问题和做性能优化要了解的知识和工具。Systems Performance 的大部头更是让人又爱又恨,

book driven development

Book Driven Development Mar 23, 2026 · 5 min read 嗯,最近一直在测试 opus 和 gpt5.4 的能力差别,目前结论是各有千秋。 今天我们从 opus 的一个最大优势讲起。先来看两张图。 第一张是用 kafka definitive guide 第二版去问 opus: 注意看 opus 的思考过程 第二张是用同样的问题去问 chatgpt: 同样注意看