

在人工智能快速渗透各行各业的当下,构建一个真正实用的AI智能体,仅有一流的大模型远远不够。开发者们迫切需要一套完备的基础设施,来支撑智能体执行文件审查、运行指令、编写代码以及跨步骤的长效协作。然而现实情况是,从原型开发迈向生产环境的道路上,开发者们往往面临各种艰难的权衡:模型无关框架虽然灵活,却无法充分释放前沿模型的性能潜力;模型厂商提供的SDK虽然契合度更高,但对运行框架内部的可见性往往不足;而托管型智能体API虽简化了部署,却限制了智能体的运行环境及对敏感数据的访问权限。
今天,OpenAI正式推出了Agents SDK的全新升级,旨在为开发者提供一套专为OpenAI模型量身打造的标准化底层架构。这套架构包含模型原生运行框架(model-native harness)和原生沙箱执行环境两大核心模块,前者支持智能体在计算机上跨文件、跨工具作业,后者则确保各类任务运行的安全性。换句话说,开发者现在可以更加专注于构建智能体的业务逻辑,而将繁琐的核心架构维护工作交给SDK来处理。
为什么智能体需要更好的基础设施
理解这次升级的意义,首先需要看清当前智能体开发面临的核心困境。
在实际生产环境中,一个有价值的智能体往往需要同时处理多种复杂任务:读取和分析文档、执行系统命令、编写和运行代码、与外部工具进行交互——这些操作横跨多个系统,需要在长周期任务中保持状态的连贯性。传统的开发方式存在明显的局限性:开放框架虽然给了开发者最大的自由度,却难以针对特定模型进行性能优化;厂商提供的SDK虽然与模型契合,但运行框架黑盒化导致调试困难;托管服务虽然开箱即用,却在安全性和灵活性上大打折扣。
这种种权衡反映出一个根本问题:智能体需要一个既能得到模型深度优化、又能提供足够可见性和控制力的运行框架。OpenAI此次发布的Agents SDK,正是为了解决这一痛点。
更强劲的智能体循环运行框架
升级后的Agents SDK运行框架为处理文档、文件和系统的智能体提供了显著增强的能力。该框架目前已集成可配置记忆模块、沙箱感知编排功能、类Codex的文件系统工具,以及针对前沿智能体系统常用原语(primitive)的标准化集成。
具体而言,这些原语包括:
- 工具使用:通过MCP(Model Context Protocol)实现与外部工具的标准化连接
- 技能(Skill):通过Agents Skills实现渐进式功能披露
- 自定义指令:通过AGENTS.md文件定义智能体行为规范
- 代码执行:通过Shell工具运行系统命令
- 文件编辑:通过Apply Patch工具进行批量文件修改
这套框架的核心理念是让执行方式与前沿模型的最佳性能模式对齐,从而帮助开发者进一步释放模型潜力。这种设计使智能体能更贴合模型的“自然运行模式”,在执行复杂任务时——尤其是那些需要跨多种工具系统协作的工作或长周期任务——表现出更卓越的可靠性与性能。

同时,Agents SDK在设计之初就充分考虑了多样性和灵活性的需求。它为开发者提供了一个既能开箱即用、又具备高度定制空间的运行框架,支持开发者根据自身技术栈轻松配置工具调用、记忆模块及沙箱环境。
原生沙箱执行环境
升级后的Agents SDK现已原生支持沙箱执行,这意味着智能体可以在受控的计算机环境中运行,并配备任务所需的全部文件、工具及依赖项。
对于许多实用的智能体而言,一个能够安全读写文件、安装依赖、运行代码及调用工具的工作空间至关重要。原生沙箱支持为开发者直接提供了这一执行层,无需再费力自行搭建。开发者既可以接入自有的沙箱环境,也能直接使用SDK支持的第三方平台,包括Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop以及Vercel等主流服务商。
为了确保环境在不同服务商之间具备可移植性,SDK还引入了Manifest抽象层来定义智能体的工作空间。开发者可以挂载本地文件、定义输出目录,并从AWS S3、Google Cloud Storage、Azure Blob Storage及Cloudflare R2等云存储服务商处导入数据。这套方案为开发者提供了一种标准化的方式,助力智能体从本地原型平滑过渡到生产部署。
运行框架与算力的解耦
在设计智能体系统时,安全性和可扩展性是必须预先考虑的核心问题。OpenAI此次架构升级的一个重要设计理念,是将运行框架与算力环境解耦,从而实现多重安全保障。
首先是安全性保障。通过这种解耦设计,可以有效确保凭据等敏感信息不会泄露至执行模型生成代码的环境中,有效防范提示注入(prompt-injection)和数据外泄(exfiltration)的潜在风险。
其次是持久性保障。由于智能体的状态已被外部化,即使沙箱容器发生宕机,也不会导致整个任务运行失败。凭借内置的快照(snapshotting)与重构(rehydration)机制,Agents SDK可以在原环境失效或过期时,在全新的容器中精准恢复智能体状态,并从最后一个检查点继续运行。

最后是可扩展性保障。在执行任务时,智能体可以灵活调用一个或多个沙箱,仅在必要时激活环境,将子智能体(sub-agent)路由至隔离环境中,并通过跨容器的并行作业来显著提升执行效率。
代码示例:构建一个数据分析师智能体
为了帮助开发者更直观地理解新SDK的使用方式,以下是一个完整的示例代码,演示了如何构建一个数据分析智能体:
# pip install "openai-agents>=0.14.0"
import asyncio
import tempfile
from pathlib import Path
from agents import Runner
from agents.run import RunConfig
from agents.sandbox import Manifest, SandboxAgent, SandboxRunConfig
from agents.sandbox.entries import LocalDir
from agents.sandbox.sandboxes import UnixLocalSandboxClient
async def main() -> None:
with tempfile.TemporaryDirectory() as tmp:
dataroom = Path(tmp) / "dataroom"
dataroom.mkdir()
(dataroom / "metrics.md").write_text(
"""# Annual metrics
| Year | Revenue | Operating income | Operating cash flow |
| --- | ---: | ---: | ---: |
| FY2025 | $124.3M | $18.6M | $24.1M |
| FY2024 | $98.7M | $12.4M | $17.9M |
""",
encoding="utf-8",
)
agent = SandboxAgent(
name="Dataroom Analyst",
model="gpt-5.4",
instructions="Answer using only files in data/. Cite source filenames.",
default_manifest=Manifest(entries={"data": LocalDir(src=dataroom)}),
)
result = await Runner.run(
agent,
"Compare FY2025 revenue, operating income, and operating cash flow with FY2024.",
run_config=RunConfig(
sandbox=SandboxRunConfig(client=UnixLocalSandboxClient()),
),
)
print(result.final_output)
if __name__ == "__main__":
asyncio.run(main())
这个示例展示了一个典型的数据分析场景:开发者首先创建受控的工作空间并写入数据文件,然后初始化一个沙箱智能体并为其分配必要的工具和数据目录,最后通过自然语言指令让智能体完成数据分析任务。整个过程体现了Agents SDK的核心设计理念——提供标准化、模块化的基础设施,同时保持足够的灵活性。
来自合作伙伴的验证
新SDK的能力已经得到了多家合作伙伴的实际验证。在法律领域,Oscar Health和LexisNexis等机构正在进行深度测试。在金融领域,FurtherAI和Thomson Reuters正在探索其在复杂文档处理中的应用。协作领域则有Zoom和Tomoro AI等合作伙伴。
Harvey应用研究负责人Niko Grupen分享了他的使用体验:
“GPT-5.4为处理大量文档的法律工作树立了新标杆。在BigLaw Bench评估中,它获得了91%的评分。与其他模型相比,GPT-5.4目前在构建复杂的交易分析、保持长篇合同准确性,以及提供法律从业者所需的高精度细节方面表现更佳。”
这一评价表明,当优秀的模型与完善的运行框架相结合时,智能体能够在专业领域展现出真正的实用价值。
定价与可用性
目前,Agents SDK的这些全新功能现已面向所有API用户开放。定价方案沿用标准API计费模式,根据Token使用量及工具调用次数进行结算。
未来展望
在Agents SDK的持续迭代中,OpenAI将不断拓宽其应用边界,助力开发者以更轻量化的基础设施,将性能更强的智能体投入生产,同时始终保障开发者所需的灵活性与掌控力。

目前,全新的运行框架与沙箱功能已率先在Python版本中上线,TypeScript支持也已列入发布计划。此外,包括代码模式和子智能体在内的更多智能体功能也将逐步引入这两个语言版本。
展望未来,OpenAI希望进一步推动智能体生态的深度融合:通过支持更多的沙箱服务商、提供更丰富的集成方案,以及探索更多元化的接入方式,让开发者能够将SDK无缝嵌入其现有的工具链与系统之中。
核心要点总结:
- 模型原生运行框架:专为OpenAI模型优化,支持跨文件、跨工具作业,集成MCP、技能、AGENTS.md等标准化原语
- 原生沙箱执行环境:提供受控工作空间,支持多平台部署,通过Manifest抽象层实现环境可移植性
- 架构解耦设计:确保安全性、持久性与可扩展性,支持快照恢复和跨容器并行作业
- 可用性:现已面向所有API用户开放,Python版已上线,TypeScript版开发中
原文媒体

