← 返回文章列表

Most people use Claude like a search box

摘要

大多数人用 Claude 的方式,和用搜索引擎没区别:问一个问题,扫一眼答案,关掉标签页。然后继续过自己的一天。这其实是在浪费这款工具最值钱的能力。我最近重读了斯坦福 OVAL 实验室发表在 NAACL 2024 上的那套研究系统——STORM,全称是 **Synthesis of Topic Outlines through Retrieval and Multi-perspective Que…

一个年轻研究者坐在洒满午后阳光的木质书房里,手持一只自制的万花筒,对准桌上一本普通的书。透过万花筒,同一本书折射出五种不同色彩的光谱,光谱尽头分别站着五个独特的小人物:一个戴工匠围裙手握放大镜的从业者、一个双臂交叉白胡子的怀疑论者、一个俯身查看金币与账本的经济学家、一个怀抱古老卷轴与沙漏的历史前辈、一个埋首学术论文与引注的学者。阳光从窗棂斜照进来,空气中可见细微的尘埃光束,水彩晕染的暖色调,吉卜力动画质感。

大多数人用 Claude 的方式,和用搜索引擎没区别:问一个问题,扫一眼答案,关掉标签页。然后继续过自己的一天。

一个行色匆匆的上班族坐在通勤列车座位上,漫不经心地瞥了一眼手中发着微光的小屏幕,随即满足地把它塞回口袋,视线空洞地移开。身后的车窗之外,一片辽阔而未被探索的山水正在后退——层叠的远山、未踏足的森林、隐约的古老建筑——他完全没看见。画面色彩对比强烈:屏幕冷光灰白,车窗外是水彩晕染的丰富自然色,暗示错过的深度。

这其实是在浪费这款工具最值钱的能力。

我最近重读了斯坦福 OVAL 实验室发表在 NAACL 2024 上的那套研究系统——STORM,全称是 Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking。论文经过同行评审,结果显示:STORM 生成的文章在组织度上比次优方法高出 25%,覆盖广度高出 10%。

开源。免费。MIT 协议。代码挂在 github.com/stanford-oval/storm,在线版可以直接打开 storm.genie.stanford.edu,输入一个话题,AI 当着你的面写出一篇带来源的文章。

但这不是今天这篇文章的重点。重点是:你根本不需要写代码、不需要部署、不需要懂 GitHub。斯坦福那套方法本质上是一种思维方式,而这种思维方式,可以压缩成 4 段提示词,直接贴在 Claude 里用。

从打开页面到拿到一份能用的研究报告,五分钟。

下面就是全部流程。


为什么单次提问注定失败

当你对 Claude 说"告诉我关于 X 的一切",你拿到的是主流叙事、是共识框架、是表层答案。

你拿不到的是一个每天和 X 打交道的从业者看到的细节;是一个认为整个学科方向都跑偏的怀疑论者的反驳;是一个追踪资金流向的经济学家眼中的利益结构;是一个经历过类似周期的前辈意识到的历史规律;也是一个真正啃过原始论文的学者掌握的证据冲突。

一座烛光摇曳的圆形图书馆里,五个截然不同的角色围着一本摊开的巨著,从五个方向审视同一本书。从业者戴着工作手套和护目镜,正用工具拆解书页的物理细节;怀疑论者拄着拐杖,眯着眼从侧面挑刺;经济学家手持算盘与金币,盯着脚下的影子结构;历史学家坐在时间沙漏旁,面前展开古老卷轴;学者则埋在引文与批注中。每人看到的书页内容互不相同。

这五种视角,看到的是同一个主题的不同切面。真正的博士级研究就是这么做的——不是问一次,是问五次。

斯坦福的论文用数据证明了这个直觉。多视角驱动的文章,比单视角写作组织度高 25%,覆盖度高 10%。整个系统的突破点,就在于多视角提问能抓到单次提问永远抓不到的盲区。

一个博士级别的文献研究,人工需要 40 到 60 小时。多数人掏不出这段时间。STORM 能压缩时间,而下面这 4 段提示词能把压缩再压一层。总共五分钟。


提示词 1:多视角扫描

这是整套方法的引擎。复制到 Claude,把第 1 行的 [YOUR TOPIC] 替换成你的研究主题。

I need to research [YOUR TOPIC].
Simulate 5 different expert perspectives on this topic:
1. THE PRACTITIONER: works with this daily.
What do they know that academics miss?
What practical realities are usually ignored?
2. THE ACADEMIC: has studied this for years.
What does the peer reviewed evidence actually say?
Where does the evidence contradict popular belief?
3. THE SKEPTIC: thinks the mainstream view is wrong.
What is the strongest counterargument?
What evidence do proponents conveniently ignore?
4. THE ECONOMIST: follows the money.
Who profits from the current narrative?
What financial incentives shape the research?
5. THE HISTORIAN: has seen similar patterns before.
What historical parallels exist?
What can we learn from how those played out?
For each perspective give me:
- Their core position in 2 sentences
- The strongest evidence supporting their view
- The one thing they would tell me that no other perspective would

你将拿到的是:五个截然不同的视角读同一个主题。从业者看到学者忽略的东西,怀疑论者挑战从业者的默认假设,经济学家拆解学者视而不见的利益结构,历史学家提供经济学家看不到的周期规律。

60 秒的工作量,捕捉到的是单次提问永远找不到的盲区。


提示词 2:矛盾地图

现在让 Claude 找出这 5 个视角在哪里打架。矛盾所在,就是真理解所在。

Based on the 5 perspectives above, map the contradictions:
1. Where do two or more perspectives directly contradict
each other? List each conflict with the specific
claims that clash.
2. Which perspective has the strongest evidence?
Which has the weakest? Why?
3. What is the one question that, if answered, would
resolve the biggest contradiction?
4. What does EVERY perspective agree on?
(This is likely true. Even opponents confirm it.)
5. What topic did NONE of the perspectives address?
(This is the blind spot in the whole field.
Often the most valuable finding.)

你将拿到的是:一份专家分歧地图,附带每个分歧的证据强度、最大的待解问题、五方共识点,以及整片研究领域的盲区。

一张铺满整张橡木长桌的巨型手绘地图,上面用红、蓝、灰三色丝线交织成侦探式的连线图。红色区域标记五种视角的激烈冲突点,蓝色区域是各方共识,灰色是无人问津的研究荒漠。地图边缘散落着别针、图钉、放大镜和半卷的卷宗。一只手正用红色细线将两个相距甚远的标记连起来,揭示出隐藏的矛盾。

大多数人跳过这一步。而这一步,正是把"看了一圈"变成"真懂了一件事"的分水岭。

一个小经验法则:如果 5 个视角都同意的事,大概率是真的。如果 5 个视角都没提到的事,你刚刚发现了整片研究领域的一个空缺。


提示词 3:综合简报

现在让 Claude 把所有素材整合成一份真正可用的研究简报。

Synthesize everything from the 5 perspectives and the
contradiction map into a research briefing:
1. THE ONE PARAGRAPH SUMMARY: explain this topic as if
briefing a CEO who has 60 seconds and needs nuance,
not just the headline.
2. THE 5 KEY FINDINGS: most important things I now know,
ranked by reliability. For each, note which perspectives
support it and which challenge it.
3. THE HIDDEN CONNECTION: one non obvious link between
findings that only shows up when you look at all 5
perspectives together.
4. THE ACTIONABLE INSIGHT: based on all the evidence,
what should someone in [YOUR ROLE] actually DO
differently? Be specific.
5. THE FRONTIER QUESTION: the one question that, if
answered, would change everything about how we
understand this topic.

你将拿到的是:一份任何单一专家都写不出来的简报——覆盖了每个角度、标注了矛盾、给结论排了可靠度、落到了一个具体行动上。这是博士水平的工作量,传统流程要花两天,你刚刚用了 90 秒。


提示词 4:自我同行评审

STORM 有一个被斯坦福团队自己点名的短板:系统不会自我批评,来源偏差和事实错配会悄悄混进来。下面这段提示词的作用,就是让 Claude 给自己的成果打分。

Now peer review your own research briefing:
1. CONFIDENCE SCORES: rate each of the 5 key findings
on a 1 to 10 scale for reliability. Explain each score.
2. WEAKEST LINK: which claim are you least confident in?
What specific info would you need to verify it?
3. BIAS CHECK: which perspective might be overrepresented
in your synthesis? Did one voice dominate?
4. MISSING PERSPECTIVE: is there a 6th angle I should
have included that would change the conclusions?
5. OVERALL GRADE: if a Stanford professor reviewed this
briefing, what grade would they give and why?
What would they tell me to fix?

你将拿到的是:一份关于自己研究的诚实评估——哪些论据站得住、哪些是软肋、哪种视角被过度放大了、还缺了哪一面。真正的同行评审要走几个月。你刚刚用 60 秒跑完了。


五分钟工作流

  • 第 1 分钟:跑提示词 1,拿到 5 个专家视角。
  • 第 2 到 3 分钟:跑提示词 2,拿到矛盾地图。
  • 第 3 到 4 分钟:跑提示词 3,拿到研究简报。
  • 第 5 分钟:跑提示词 4,标出可靠与不可靠的部分。

一间温馨的钟表匠工作室,墙上挂着巨大的沙漏,沙粒正在流动。房间内沿着一条时间线设了四个工位,每个工位都有不同的产出物:第一站摆着五个微缩小人偶;第二站是一张铺开的光谱图,线条交错打架;第三站是一摞整齐的研究简报,每页顶部印着不同颜色的标记;第四站是一份被打上红绿印章的最终稿。一个专注的年轻人在工位间来回穿梭,猫在旁边打盹。

总耗时 5 分钟。产出:一份带矛盾分析、综合判断、具体行动和可信度评分的多视角简报。

一个博士研究生要花 40 到 60 小时手工产出同等质量的东西。不是因为他们慢,而是从 5 个角度阅读、绘制矛盾图、做综合分析、然后自我批评,本来就是一个大脑 40 小时才能消化完的工作量。


7 个今天就能用的场景

  1. 写文章或报告之前。跑一遍 4 段提示词,你的稿子会覆盖别人没想到的角度。
  2. 重大商业决策之前。从 5 个视角看一遍——从业者告诉你现实里什么有效,怀疑论者告诉你哪里会翻车,经济学家告诉你谁在赚钱。
  3. 求职面试之前。5 分钟从 5 个角度研究目标公司,从业者视角给你内部黑话,怀疑论者视角给你犀利提问。你走进会议室时,赢面已经不一样了。
  4. 投资决策之前。看多理由、看空理由、历史类比、激励结构、学术证据,5 分钟内全部铺开。矛盾地图会直接告诉你真正的风险藏在哪里。
  5. 学习一项新技能之前。从 5 个角度扫描整个领域,从业者告诉你先学什么,学者告诉你理论框架,怀疑论者告诉你哪些内容被过度炒作。直接跳过噪音。
  6. 谈判之前。从 5 个视角研究对手,理解他们的利益结构、弱点和历史行为模式。你会带着结构性优势走进去。
  7. 任何重要汇报之前。在主题上跑一次 STORM,你的演示文稿会提前回答掉观众还没来得及提的反对意见,Q&A 环节会变得格外轻松。

写给会读到这里的人

你是那种愿意真的读完一篇文章的人。你会问难的问题。你不想要一份 200 字、读起来聪明、其实什么都没说的总结。

你想要的是真正理解一个事情。快速地、有出处地、以一个斯坦福研究生的方式。不用交六年学费。

这就是这套方法服务的对象。

如果那就是你,收藏这篇文章,用上这 4 段提示词,看看实际跑出来的效果。


一个没人愿意明说的事实

斯坦福团队在 2024 年发表了这套方法。论文经过同行评审。代码开源。在线工具免费。操作步骤只是 4 段提示词。

而几乎没人用。

我们正处在一个 18 个月的窗口期。学会用 AI 做研究的人,会和没学会的人在思考深度上拉开巨大差距。不是因为前者更聪明,而是因为前者已经在跑 5 个视角、矛盾地图、综合分析、自我评审这一整套流程,而后者还在看 Google 的第一条结果。

18 个月后,这种工作流会被写进每一款工具里。先发优势会消失。今天,它还是一个藏在公开论文里的秘密。

画面被一条蜿蜒小径一分为二。左侧是当下:一个蒙面寻宝者在幽暗的地下岩穴中举着油灯,独自发现了一块散发幽蓝光芒的奇特水晶,岩壁上是古老的论文石刻。右侧是 18 个月后:同一个水晶的设计被放大、复制,安放在阳光普照的露天广场上,建筑物外墙、行人手中、孩童玩具里都能看到它的身影,人群川流不息。

挑一个你最想研究的主题。打开 Claude。贴上提示词 1。

五分钟之后,你会比花了几天阅读的人懂得更多。

提示词在上面。斯坦福验证过方法。剩下的,就是你的事了。