起点:一句模糊的需求,和一次 104 个 agent 的深度调研
2026-06-11约 25 分钟(其中调研工作流自动运行约 12 分钟)调研多agentdeep-research
目标
把一句模糊的需求变成有依据的方向判断:个人网站到底该做成什么样,才能真正向面试官证明「会用 AI」。
关键 prompt(原文摘录)
项目的起点,就是发给 Claude 的这两句话(原文未修饰):
我想做一个介绍自己的网站,你觉得可以怎么做,到时候找工作的时候可以给面试官看。肯定要突出我的能力,以及我网页要有能力,就是我用ai 的能力。你有什么想法吗
我想要你去网上调研一下别人的事怎么做的,中英文世界都要
第二句触发了一次 deep-research 工作流:问题被拆成 5 个搜索角度(英文标杆案例 / 带 AI 功能的个人网站 / 中文社区实践 / 招聘方真实看法 / 技术栈与部署趋势),并行搜索后抓取 22 个来源、提取 109 条候选结论,对其中 25 条做三票交叉验证。
结果
12 条结论通过 3-0 验证,直接塑造了本站的设计:
- AI 求职分身是 2026 年被验证有效的真实做法:CNBC 报道了两位美国求职者在个人网站嵌入简历问答机器人,其中一位因此拿到多个面试与一份实习;另一位的关键洞察被本站直接采纳——「招聘经理想读你写的代码」,所以机器人要开源。
- 参考架构存在:开源项目 smart-portfolio(Next.js + RAG 聊天机器人)验证了技术路线可行。
- 案例库:GitHub 上 24.1k star 的 developer-portfolios 仓库收录约 1770 个真实个人网站,是风格灵感的主要来源。
踩坑与纠正
调研跑到验证阶段时撞上了 API 会话限额:后半批 13 条结论的验证投票全部弃权,在原始报告里被标成了「refuted」。它们不是被证伪,是没来得及投票——如果不看日志只看结论字段,会把一批有效来源当成假的扔掉。处理方式:把这批来源降级标注为「已收录、未交叉验证」,继续使用但心里有数。
教训:多 agent 系统的输出要连同失败日志一起读,缺票和反对票是两回事。
用时与备注
调研工作流自动运行 731 秒(104 个子 agent、367 次工具调用),人工整理和解读约 10 分钟。