起点：一句模糊的需求，和一次 104 个 agent 的深度调研

目标

把一句模糊的需求变成有依据的方向判断：个人网站到底该做成什么样，才能真正向面试官证明「会用 AI」。

项目的起点，就是发给 Claude 的这两句话（原文未修饰）：

我想做一个介绍自己的网站，你觉得可以怎么做，到时候找工作的时候可以给面试官看。肯定要突出我的能力，以及我网页要有能力，就是我用ai 的能力。你有什么想法吗

我想要你去网上调研一下别人的事怎么做的，中英文世界都要

第二句触发了一次 deep-research 工作流：问题被拆成 5 个搜索角度（英文标杆案例 / 带 AI 功能的个人网站 / 中文社区实践 / 招聘方真实看法 / 技术栈与部署趋势），并行搜索后抓取 22 个来源、提取 109 条候选结论，对其中 25 条做三票交叉验证。

12 条结论通过 3-0 验证，直接塑造了本站的设计：

AI 求职分身是 2026 年被验证有效的真实做法：CNBC 报道了两位美国求职者在个人网站嵌入简历问答机器人，其中一位因此拿到多个面试与一份实习；另一位的关键洞察被本站直接采纳——「招聘经理想读你写的代码」，所以机器人要开源。
参考架构存在：开源项目 smart-portfolio（Next.js + RAG 聊天机器人）验证了技术路线可行。
案例库：GitHub 上 24.1k star 的 developer-portfolios 仓库收录约 1770 个真实个人网站，是风格灵感的主要来源。

调研跑到验证阶段时撞上了 API 会话限额：后半批 13 条结论的验证投票全部弃权，在原始报告里被标成了「refuted」。它们不是被证伪，是没来得及投票——如果不看日志只看结论字段，会把一批有效来源当成假的扔掉。处理方式：把这批来源降级标注为「已收录、未交叉验证」，继续使用但心里有数。

教训：多 agent 系统的输出要连同失败日志一起读，缺票和反对票是两回事。

调研工作流自动运行 731 秒（104 个子 agent、367 次工具调用），人工整理和解读约 10 分钟。