零 Token 设计

May 7

它不是说产品不用 AI，而是说：AI 产品不一定要在自己的 runtime 里烧 token。

以前做 AI 产品，默认逻辑是用户点一下，产品调用一次模型；用户再点一下，产品再烧一次 token。这个在 2023 年可能合理，因为用户没有自己的 AI 工作台。但现在不一样了。

Codex、Claude Code、OpenCode、Cursor 这种本地 agent workspace 已经越来越成熟。它们不只是聊天框，而是可以在用户自己的项目目录里读文件、跑命令、改代码、执行脚手架的工作台。

所以我觉得，下一代 AI 产品的默认架构应该变了。

不是每个产品都自己包一个 chatbot，然后自己承担推理成本。更好的方式是：让用户在自己的 agent workspace 里完成推理，把结果写回产品。

这和 Bring Your Own Key 不一样。BYOK 还是让用户去申请 API key、配置 key、理解 billing，本质上只是把账单转嫁给用户，体验很重。零 Token 设计不是让用户把 key 塞进我的产品，而是让我的产品进入用户已经在用的 Codex / Claude Code / OpenCode 工作台。

CV.pro 就是我理解里的零 Token AI 产品。它当然是 AI 产品，因为简历解析、JD tailoring、内容重写都需要 AI。但这些动作不应该都发生在 CV.pro 的服务器里。更自然的方式是，用户复制一段 quick start prompt，丢进自己的 agent，agent 自己去跑 npx、解析文件、处理错误、生成结构化数据，然后写回 CV.pro。

CV.pro 负责的是 schema、数据库、URL view、版本、展示和分发。

说白了就是，让 agent 去干活，让产品把结果接住。

这可能也是我现在对下一代 AI 产品的一个判断：不要急着在网页里塞一个聊天框。先想清楚，你的产品到底应该自己推理，还是应该变成一个能被 agent 操作、能沉淀结果的系统。