HA7CH

零 Token 设计

它不是说产品不用 AI,而是说:AI 产品不一定要在自己的 runtime 里烧 token。

以前做 AI 产品,默认逻辑是用户点一下,产品调用一次模型;用户再点一下,产品再烧一次 token。这个在 2023 年可能合理,因为用户没有自己的 AI 工作台。但现在不一样了。

Codex、Claude Code、OpenCode、Cursor 这种本地 agent workspace 已经越来越成熟。它们不只是聊天框,而是可以在用户自己的项目目录里读文件、跑命令、改代码、执行脚手架的工作台。

所以我觉得,下一代 AI 产品的默认架构应该变了。

不是每个产品都自己包一个 chatbot,然后自己承担推理成本。更好的方式是:让用户在自己的 agent workspace 里完成推理,把结果写回产品。

这和 Bring Your Own Key 不一样。BYOK 还是让用户去申请 API key、配置 key、理解 billing,本质上只是把账单转嫁给用户,体验很重。零 Token 设计不是让用户把 key 塞进我的产品,而是让我的产品进入用户已经在用的 Codex / Claude Code / OpenCode 工作台。

CV.pro 就是我理解里的零 Token AI 产品。它当然是 AI 产品,因为简历解析、JD tailoring、内容重写都需要 AI。但这些动作不应该都发生在 CV.pro 的服务器里。更自然的方式是,用户复制一段 quick start prompt,丢进自己的 agent,agent 自己去跑 npx、解析文件、处理错误、生成结构化数据,然后写回 CV.pro。

CV.pro 负责的是 schema、数据库、URL view、版本、展示和分发。

说白了就是,让 agent 去干活,让产品把结果接住。

这可能也是我现在对下一代 AI 产品的一个判断:不要急着在网页里塞一个聊天框。先想清楚,你的产品到底应该自己推理,还是应该变成一个能被 agent 操作、能沉淀结果的系统。