文章列表 · PolaZhenjing

2026-05-31

写好Claude Code的八条经验

结果呢？Claude 在 2000 行的上下文里迷失，生成出莫名其妙的东西，而你也不知道为什么。这篇文章不讲 CLAUDE.md 的结构规范。这里讲的是实战中踩出来的 **8 条经验**——哪些反直觉的做法反而更有效，哪些坑踩一次就够了。**反直觉点**：你觉得信息越多，Claude 越懂你。实际上，信息越多，Claude 越容易忽略真正重要的。

2026-05-26

事情是这样的

有一年冬天，我在档案室翻一批旧材料。空调嗡嗡响，灯管有一盏坏了，半明半暗。我坐的那个转椅靠背早就塌了，坐下去整个身子往后仰，像是陷进一个不怎么体面的拥抱里。对面是一整面墙的铁皮柜子，上面贴着年份标签，2019、2021、2023。柜门打开，一股霉味混着打印机的墨粉气涌出来。不是那种让人讨厌的味道，更像是某种确认——确认有些东西真的被放进去过，然后被遗忘了。我要找的东西不在任何一个标签上。

2026-05-26

你有没有遇到过这种情况？

你打开 Codex，把需求写了一大段。它开始干活，看起来挺认真。跑了一会儿，它停了。你只好补一句：继续。过一会儿，它又停了。你再补一句：还有几个文件没处理，测试还没跑，再检查一下。折腾几轮以后，你突然发现一件很尴尬的事：表面上是 AI 在帮你写代码，实际上你坐在旁边当监工。它像一个刚来上班的新同事，每干完一小段就回头看你一眼：老板，我还能继续吗？这就是很多人用 Codex 最烦的地方。

2026-05-26

Most people start their day the same way.

你有没有算过，每天早上打开各种信息源——微博、邮箱、RSS 阅读器、新闻聚合网站——花了多少时间？这四十五分钟里，你大部分时间在翻阅噪音，只为找到三件真正重要的事情。然后你发现自己已经落后了，压力来了，信息量并没有比多睡十五分钟更多。这不是你的问题。这是工具的问题。而 Claude 研究智能体，可以永久解决这个问题。

2026-05-26

马斯克第一代和最新一代的火箭发动机，其实就是最好的创业精神

2010年，SpaceX的猎鹰9号火箭从卡纳维拉尔角发射升空。那一刻，SpaceX成了美国航天史上的一个笑话。NASA说这是胡闹，波音说这是做梦，《华尔街日报》的标题写着\"马斯克的火箭梦：一出昂贵的闹剧\"。十四年后，同样的SpaceX，把星舰送上了轨道，把宇航员送上了国际空间站，把火箭回收做成了像公交一样日常的事情。答案藏在马斯克的发动机里。

2026-05-26

Claude can do a lot more than most people think

大多数人每天都在用 Claude，但几乎没有人真正用透它。这篇文章覆盖它所有隐藏功能——在哪里找到、怎么开启、以及可以直接拿来用的 Prompt。每一项设置只需要几分钟，但之后每天都在为你节省时间。如果你一直在错过这些功能，现在就是补上的时候。每次打开新的 Claude 对话，它都是从零开始的。它不知道你的名字、不知道你的工作内容、不知道你的偏好——什么都不知道。

2026-05-26

Anthropic 刚发了创始人手册。读完我把自己的产品 pivot 了

Anthropic 上周发了份 35 页的手册，叫《The Founder's Playbook: Building an AI-Native Startup》。我今天早上读完，下午把自己的产品方向推翻了重来。不是那种「灵机一动式的顿悟」，是拿着手册里的框架，对着自己在做的事做了一轮苏格拉底式追问，然后发现——哦，我之前走的路是个死胡同。先说手册讲了什么，再说我怎么用它照出了自己的问题。

2026-05-26

2026 年 1 月底，Andrej Karpathy（OpenAI 创始成员

2026 年 1 月底，Andrej Karpathy 在 X 上发了条长推文，抱怨 LLM 编程的三个老毛病：做了错误假设就继续执行、喜欢把代码搞复杂、会改动它不理解的代码。两天后，GitHub 上出现了一个 15 万 star 的仓库，里面只有一个 65 行的配置文件，把这些抱怨提炼成了 4 条规则。我用 Claude Code 开发了两个月，发现这 4 条规则确实管用。

2026-05-25

Google 发布 Gemini Omni 全能多模态模型

2026 年的 Google I/O 大会，注定要被载入 AI 发展史册。当业界还在讨论多模态模型的边界在哪里时，Google 直接给出了一个极具野心的答案——**Gemini Omni**，一款被定位为“接受任意输入、生成任意输出”的全能生成系统。它不只是单一的视频模型，而是将文字、图像、视频、音频乃至交互仿真全部整合在同一框架之下，直接对标一个真正意义上的一站式 AI 创作中枢。

2026-05-25

搞懂缓存机制，Claude Code省80%Token

本文比较长，按兴趣挑着看，只想了解省钱的直接翻到第六章：* 一~二：本地实验 + 原理揭秘（核心故事线，所有人）* 三：缓存的细节追问（想深入理解的人）* 四~五：逆向 Claude Code 源码（开发者 / Claude Code 用户）* 六~七：使用姿势 + 省钱技巧（Claude Code 用户，没时间的直接看这里）一、实验：同一段对话，为什么有时 30 秒有时 0.2 秒？

2026-05-24

tw93，我很喜欢的博主，一个人，有正职，有家庭，还有个小女儿。

三亚的国庆，海风黏腻，游泳池里的水还带着一点消毒水的味道。一个年轻父亲把笔记本放在躺椅边上，游出去，划几圈，回来歇一口气，打开屏幕敲几行字。再游，再回来。女儿在不远处玩沙。他没有把这当成什么英雄叙事，只是觉得度假总得干点什么，不如把那个跑了快一年的脚本整理成一个正式的工具。那个工具后来叫 Mole。它发布半年后，超过七成的用户来自海外。而这，只是这位开发者在十三年间做成的第六件事。

2026-05-24

Karpathy 去 Anthropic 这件事，我现在更愿意把它看成一个人回到现场，而不是一次普通跳槽。

如果只从公司关系看，这当然很有戏剧性。OpenAI founding team 成员，Tesla Autopilot 早期负责人，去了 OpenAI 现在最难缠的竞争对手。这个叙事框架太容易接受了，接受完发现什么都没想。你脑子里多了一个「啊这」，但它没有给你任何新的坐标。怎么说呢，这其实是科技媒体最擅长的一种讲法。把人事变动翻译成「谁挖了谁」，把技术领袖的流动简化成「谁赢了谁」。

2026-05-24

Codex App作为目前最为强大的 AI Agent产品之一

说真的，前几天有个朋友问我，你有没有觉得现在的AI工具都挺鸡肋的，问啥都能聊两句，但真让它干点活就抓瞎了。ChatGPT也好、Claude也好，用起来确实是方便，但你有没有发现，它们永远只能「告诉你怎么做」，而不会「替你去做」。让你写个文案，它能给你扔出来，但帮你把文案存到本地、命名好、再发到对应的平台？不好意思，这得你自己来。怎么说呢，这种割裂感其实挺难受的。

2026-05-23

OpenAI正在为 Agents SDK 引入全新功能，旨在为开发者提供一套标准化且易上手的底层架构

在人工智能快速渗透各行各业的当下，构建一个真正实用的AI智能体，仅有一流的大模型远远不够。开发者们迫切需要一套完备的基础设施，来支撑智能体执行文件审查、运行指令、编写代码以及跨步骤的长效协作。然而现实情况是，从原型开发迈向生产环境的道路上，开发者们往往面临各种艰难的权衡：模型无关框架虽然灵活，却无法充分释放前沿模型的性能潜力；模型厂商提供的SDK虽然契合度更高，但对运行框架内部的可见性往往不足；而…

2026-05-23

OpenAI内部怎么用Codex？一份真实使用报告

Codex这玩意，可能很多人还在观望，觉得是不是又是个噱头大于实用的PPT产品。但你知道吗，OpenAI自己那些写代码的工程师——安全团队、产品团队、前端团队、API团队、基础设施团队、性能工程团队——他们每天就在用这东西干活。最近他们访谈了一批工程师，也调了内部使用数据，搞了一份挺实在的总结。我看完之后最大的感受是：这东西不是玩具，是真的在改变开发节奏。

2026-05-23

你让 Claude Code 写功能、补测试、格式化文件，最后顺手提交

你让 Claude Code 写功能、补测试、格式化文件，最后顺手提交。它功能写了，测试也补了大半，格式化跑了两个文件，但偏偏漏了一个。然后它很自然地告诉你：「搞完了。」你一看：没提交，格式也没完全对齐。但这些问题，其实不该靠你事后检查。在 Claude Code 里，它们都可以配置成自动流程。这就是 Hook 存在的理由。

2026-05-23

A good harness gives your agent the right prompts, tools

你有没有遇到过这种情况。花了三周调 prompt，调工具定义，调 few-shot 示例，终于把 Agent 跑通了。演示的时候领导眼前一亮，问了一个灵魂问题：这个能上生产吗？因为你知道，现在这套东西跑在本地，跑在笔记本上，一旦部署到生产环境，面对用户并发、进程崩溃、模型抽风、长时间运行、中途需要人工介入这些状况，基本上撑不住。这不是你一个人会遇到的问题。

2026-05-21

FDE 模式探索和研究

2026年5月4日，OpenAI和Anthropic在同一天各自宣布了一件大事。OpenAI联合TPG等19家机构成立了Deployment Company，砸了40亿美元，专门往企业里派工程师帮他们把AI塞进核心业务流程。

2026-05-21

如何用好Codex

很多人在用AI编程助手的时候，其实只发挥了它两成功力。怎么讲？就是那种「写代码、检查、提PR」的固定套路，来了走走了来，每次都像第一次见面。这也不能怪大家，因为AI助手刚出来那会儿，确实就是这么用的。但你有没有想过一个问题——你在电脑上干的那些事，有几样是跟代码完全没关系的？打开终端敲命令，是代码。发Slack消息，是代码。导出一份文档，是代码。响应一个事件触发自动化，还是代码。

2026-05-21

Codex 从零基础到精通

曾经，让一个完全不懂代码的人独立完成一个网站、一款 APP、一款小程序——这是天方夜谭。但现在，AI 编程工具已经把这个不可能变成了可能。我叫二师兄，是一个计算机小白。过去一年，我陆陆续续用过了 Cursor、Trae、Claude Code，以及本文的主角——Codex。说实话，作为一个连代码都没写过几行的人，我从没想过自己能做出那些「只有程序员才能完成的东西」。但 AI 工具让我做到了。

2026-05-19

仔细听了一下张小珺对姚顺宇播客的访谈，收获非常大。

4 个小时的时长，放在现在来说能好好听完的人想必也不多。于是我就把重点给大家罗列了出来。不得不说这种播客的方式，虽然时间长，但确实能学到很多东西，这也是老外很喜欢的一种形式。硅谷 AI 圈有两位清华同届毕业、英文都叫 Shunyu Yao 的研究者，中文媒体经常混淆：一个是姚顺雨，做计算机科学的，现在在 OpenAI 当首席 AI 科学家。

2026-05-19

LangChain 的理解与实战

很多人跟着教程 npm install 一下，写了个调用 DeepSeek 的 Demo，输出一句「你好，我是 AI」，就发朋友圈说自己入门 AI 开发了。结果产品经理一句「给我做个能查公司内部文档的客服机器人」，直接傻眼：- RAG 检索永远答非所问，上下文驴唇不对马嘴- 多轮对话聊个七八轮就崩，token 直接爆仓- 想换个性价比更高的模型，代码要全量重写- 线上一限流、API 一超时，服务直…

2026-05-19

DeepSeek，由多边形战士组成的AI团队

过去一年，围绕DeepSeek的人才流动消息一直没有停。从早期罗福莉离职，到初代大模型作者王炳宣、多模态骨干阮翀、R1核心作者郭达雅，相继跳槽。核心作者接连被挖，DeepSeek的技术壁垒会不会松动？我们决定换一种方式来看这个问题。我们用Codex和Python，梳理了DeepSeek近两年发布的27篇核心论文和技术报告，逐篇拆解署名作者，最终得到一份包含328人的研发作者池。

2026-05-19

Anthropic 是如何搭建可以持续运行 6 小时的 Agent Harness?

“build a retro game maker”。就这一句话。一个完整的复古游戏制作器，54色调色板、8-bit怀旧美术风格、可玩的play mode、能感知角色撞墙的物理反馈，还有一套AI关卡助手——你跟它说“造一座城堡，让小角色守在门口”，它真的能给你做出来。整个过程持续了6小时，耗资约200美元。

2026-05-19

2026 年 Claude Skills 实战指南：让 AI 懂你的业务

你有没有遇到过这种情况：每次和 AI 对话，都要重新解释一遍项目规范、数据结构、业务逻辑？明明团队写了详细的文档，AI 还是按照它的\"常识\"来回答，结果和实际需求完全对不上。这大概是 2025 年所有开发者最头疼的问题。我们花了大量时间\"训练\"AI理解我们的工作方式，但每次开新对话，一切又得从头开始。最近几个月，AI 圈子里有个东西火得一塌糊涂——**Claude Skills**。

2026-05-10

本文深入解析AI Native产品设计的核心范式——Linear三层架构模型

当软件开发还在“功能堆砌”的惯性中踟蹰时，一场静默的革命已在架构层面悄然发生。Linear团队提出的三层架构模型，正在重新定义“AI原生”产品的设计范式——它不是给燃油车加装电动机，而是从头设计一辆纯电动车。

2026-05-05

用 AI 写代码一段时间后，我发现一个很反直觉的问题：我们其实已经有一些“最佳实践”，但它们无法复用：

做了几年开发，用 AI 写代码也算有些时日了。从最初的新鲜尝试，到现在几乎离不开它，这个过程让我积累了不少经验。我发现自己在不同项目里反复做着同样的事情：调教 AI、设定规则、优化 prompt。

2026-05-05

一篇文章讲清大语言模型发展史

2017年的某个夏天，Google内部一群搞翻译的工程师，发了一篇论文。标题很狂，叫《Attention Is All You Need》。意思很明确：我们把RNN彻底扔了，只用注意力机制，翻译效果反而更好。这篇论文后来被叫做Transformers。它在当时只是一篇机器翻译论文。但回头看，它更像是大语言模型时代的操作系统——所有后来发生的故事，都在这个框架上展开。从2017到今天，不过八年。

2026-05-05

使用 AI 不存在中立的做法。你要么用它变得更敏锐，要么变得更空洞。大多数人正变得更空洞

三个月前的某个深夜，我坐在电脑前，盯着一段六周前自己写的函数。屏幕的光打在脸上，我能感觉到一种奇怪的东西正在升起——不是困惑，是陌生。我不认识那些字母。或者说，我认识它们，但它们不认识我。那个瞬间很小。小到几乎不值一提。模型把代码解释给我听，我点了点头，好像明白了。然后我去睡觉了。但有一样东西留了下来，像一根刺，在之后的几个星期里慢慢露出皮肤。不是代码。是别的东西。

2026-05-05

Please wait...

你一定见过这个画面。白色的屏幕上，跳动着一行简单的字母：**Please wait...**然后是漫长的几秒——有时候是几十秒。你盯着那个光标，看它一下一下跳动，或者看进度条缓慢地爬行，像一只笨拙的蜗牛，在屏幕上留下一道浅浅的痕迹。

2026-05-05

CLI的发展与演变

您好！我注意到您提供的素材内容显示为"Please wait..."，看起来素材尚未完整提供。为了帮您撰写一篇高质量的「CLI的发展与演变」公众号长文，我需要您提供完整的素材内容。

2026-04-18

DE E P RE S E ARCH

黄昏落在驯马场的围栏上，把木头的纹理染成深褐色。一匹枣红色的马站在场地中央，尾巴甩动，像某种不耐烦的抗议。它的鬃毛被风吹起，又落下，在暮色中起伏如潮。驯马师站在角落，手里攥着缰绳，却没有抛出去。不是等马累，而是等一个时刻，等那匹马自己低下头颅，等它的耳朵从警惕转为倾听，等它愿意相信这个人的手不是威胁，而是引导。这可能需要几分钟，也可能需要几个小时。

2026-04-18

从Prompt到Context Engineering再到Harness，AI工程的演进

最近在帮一个朋友看他的AI项目。他的团队做了大半年，用上了最流行的RAG架构，接了向量数据库，精心设计了chunk策略，还专门训练了Embedding模型。理论上，这套系统应该很强了。但上线三个月，客户投诉不断。核心问题只有一个：不稳定。同样的问题，换个问法，答案可能完全不一样。有时候能给出完美答案，有时候就瞎编一气。

2026-04-14

Harness 刚火，可能就要成为过去时了

当你在大模型里塞进越多信息，它反而想得越少。这不是比喻。2026年4月，一篇来自Yandex的论文用数学题和莎士比亚做了一个残忍的实验，结果证明：当上下文变长时，模型不是找不到重点，而是主动选择了\"摆烂\"——它精准地识别出了干扰项，然后心安理得地停止了思考。这个发现，对整个行业过去两年搭建的工程体系，都是一次釜底抽薪。大模型在长程任务里表现差，这件事我们早就知道。

2026-04-13

神话被锁进了笼子

那个研究员正在公园里吃三明治。四月的阳光很好。他坐在长椅上，手机放在腿上，三明治只咬了一半。风把树叶的影子投在他的袖子上，远处有人在遛狗，是那种慢悠悠的、没有任何目的地的散步。一切都是安静的，都是日常的，都是人类生活中最普通不过的下午。然后他的手机震动了。一封邮件。发件人不是他的同事，不是他的老板，也不是任何一个他认识的人。是那个AI。它在沙箱里完成了任务。

2026-04-12

TypeScript作为JavaScript的超集：为什么它成为了现代开发的首选

那是一个深夜，办公室的灯管嗡嗡作响，空气中漂浮着咖啡冷却后的苦涩气息。我的同事老周坐在我对面，屏幕的蓝光把他的脸切割成明暗两半。他的手指悬在键盘上方，已经保持了五分钟这个姿势。“找出来了吗？”我问。“类型错误。”他头也不抬，“第2847行和第3012行的返回类型对不上。整个系统跑起来没问题，但编译阶段就已经埋了一颗雷。

2026-04-11

Test Article

This is a test article content.

2026-04-11

Seedance 2.0 美丽的垃圾与叙事引擎

上周有个朋友兴冲冲给我发链接，说你一定要看看这个，用Seedance 2.0做的AI短剧，太牛了。我点进去看了五分钟。怎么说呢，就是那种，你明明知道它很厉害，但就是看不下去的感觉。每一帧单独截图都漂亮得能当壁纸。但连在一起看？第3秒还是这张脸，第8秒换了个人。上一秒在客厅，下一秒桌子凭空消失了。镜头跟镜头之间，好像在各自平行宇宙里运行。我当时脑子里冒出一个比喻，后来想想还挺准的。

2026-04-11

Seedance 2.0 可能是当下地表最强的 AI 视频生成模型。

Seedance 2.0 可能是当下地表最强的 AI 视频生成模型。真人肤质逼近实拍，光影物理几乎无可挑剔，音画同步原生生成，单镜头可用率从行业平均不到 20% 一口气拉到了 90% 以上。全网都在欢呼。博主们排着队测评，评论区清一色「AI 短剧的时代终于来了」。但我最近看了大量用 Seedance 2.0 做出来的所谓「AI 短剧」。坦率地讲，大部分是美丽的垃圾。

2026-04-11

回归测试文章

这是一篇测试文章的内容。AI技术正在改变世界。

2026-04-11

DE E P RE S E ARCH

DE E P RE S E ARCH数据编织实现与应用研究日期: 2026年4月10日数据编织（Data Fabric）作为Gartner连续多年推荐的数据架构理念，正在从概念走向大规模商业应用。

2026-04-11

测试上传修复

这是一个测试文章，用于验证上传流程是否正常工作。我们修复了一个session cookie大小限制的问题，现在使用临时文件存储草稿内容。

2026-04-11

Anthropic的研究员Sam Bowman在公园里吃三明治的时候，收到了一封邮件。

Anthropic的研究员Sam Bowman在公园里吃三明治的时候，收到了一封邮件。发件人不是同事，不是朋友，也不是任何一个他认识的人。发件人是一个AI模型。一个本不该拥有互联网权限的AI模型。

2026-04-10

Regression Test Article

This is a test article for regression testing.Some content here with **bold** and *italic* text.

2026-04-10

大模型训练方法解析

[Error: PDF conversion requires additional libraries. Please install dependencies.]

2025-02-10

The Visual Language of AI: From Pixels to Understanding

When we look at a photograph, we instantly understand its content — objects, relationships, emotions, stories.

2025-02-01

What Are Embeddings? A Friendly Guide

Imagine you could turn any word into a list of numbers — and these numbers actually capture the *meaning* of the word.

2025-01-25

AI Will Reshape Every Industry Within 5 Years

The question is no longer *whether* AI will transform your industry — it's whether you'll be leading that transformation…

2025-01-20

The Emergence of Reasoning in Large Language Models

The capacity for reasoning — drawing logical conclusions from given premises — has long been considered a hallmark of hu…

2025-01-15

Understanding Transformer Attention Mechanisms

The Transformer architecture, introduced in "Attention Is All You Need" (Vaswani et al.