首頁 > 科技要聞 > 科技> 正文

OpenAI發(fā)布智能體開發(fā)套件:AI能自主操作計算機,但建議用戶“監(jiān)工”

騰訊科技 整合編輯:太平洋科技 發(fā)布于:2025-03-13 16:12

3月12日,OpenAI發(fā)布針對AI Agent打造的系列工具與API,助力開發(fā)者更便捷地創(chuàng)建可自動執(zhí)行任務的AI Agent。

--全新的Responses API:深度融合對話式API的交互簡潔性與助手API的工具調(diào)用能力,打造面向智能體開發(fā)的統(tǒng)一接口范式。該API支持動態(tài)任務解析與工具鏈自主調(diào)度,顯著降低復雜業(yè)務流程的架構復雜度。

圖片

OpenAI通過小型發(fā)布會發(fā)布Agent開發(fā)套件

--內(nèi)置工具:包括網(wǎng)絡搜索、文件搜索和計算機使用等功能。

--全新的智能體SDK:用于協(xié)調(diào)單代理和多代理工作流。

--集成的可觀測性工具:用于追蹤和檢查智能代理工作流的執(zhí)行情況。

圖片

OpenAI官方提供的Agent工作流跟蹤面板

這些新工具簡化了智能體的核心邏輯、編排和交互,極大地降低了開發(fā)者構建智能體的入門門檻。在未來幾周和幾個月內(nèi),OpenAI計劃陸續(xù)推出更多工具和功能,進一步簡化并加速在OpenAI平臺上構建智能體應用的流程。

01.Responses API技術解析

作為OpenAI面向智能體開發(fā)的基礎API組件,Responses API深度融合對話式接口的易用性與助手API的工具調(diào)度能力。該API旨在為開發(fā)者構建具備持續(xù)演進能力的智能體系統(tǒng)提供核心支撐框架。

隨著模型能力的迭代升級,Responses API將持續(xù)優(yōu)化其靈活性和擴展性,使開發(fā)者通過單次API調(diào)用即可完成多工具協(xié)同、多輪推理的復雜任務處理。

Responses API首批支持網(wǎng)絡搜索引擎、文件搜索和計算機使用等功能。這些工具旨在協(xié)同工作,將模型與現(xiàn)實世界連接起來,使其在完成任務時更具實用性。

Responses API專為需要將OpenAI模型與內(nèi)置工具無縫集成至應用系統(tǒng)的開發(fā)者設計,OpenAI默認不會將存儲于其平臺的企業(yè)數(shù)據(jù)用于模型訓練,該承諾在數(shù)據(jù)處理協(xié)議中有明確條款約束。

該API即日起面向所有開發(fā)者開放,采用標準化計費體系:Tokens與工具調(diào)用均按官網(wǎng)公示費率執(zhí)行 。

對現(xiàn)有API的影響

Chat Completions API ⁠:作為OpenAI當前市場占有率最高的接口方案,該API將持續(xù)獲得新型號模型與功能迭代支持。對于無需內(nèi)置工具調(diào)用的應用場景,建議開發(fā)者繼續(xù)沿用現(xiàn)有技術架構。

Assistants API ⁠:基于Assistants API測試版獲得的開發(fā)者反饋,OpenAI已將關鍵改進整合至Responses API,使其更靈活、更快速、更易用,未來OpenAI將棄用Assistants API,目標時間為2026年年中。

02.Responses API的內(nèi)置工具

網(wǎng)絡搜索

開發(fā)者現(xiàn)在可以通過網(wǎng)絡獲取快速、最新的答案,并附帶清晰相關的引用來源。在Responses API中,使用gpt-4o和gpt-4o-mini時,網(wǎng)絡搜索可作為工具使用,并可與其他工具或函數(shù)調(diào)用結(jié)合。

在早期測試中,開發(fā)者群體已將網(wǎng)絡搜索應用于多種用例,包括購物助手、研究代理和旅行預訂代理——任何需要及時網(wǎng)絡信息的應用場景。

圖片

演示使用OpenAI的API來生成與當天新聞相關的文本響應

GPT-4o搜索和4o-mini搜索的定價分別為每千次查詢30美元和25美元。

文件搜索

開發(fā)者現(xiàn)在可以輕松從海量文檔中檢索相關信息。升級后的文件搜索工具支持多種文件類型、查詢優(yōu)化、元數(shù)據(jù)過濾及自定義重新排序,能夠提供快速精準的搜索結(jié)果。通過Responses API,僅需幾行代碼即可完成集成。

圖片

展示如何使用OpenAI的API接口進行文檔搜索,并獲取相關問題的答案

文件搜索工具適用于多種實際場景:支持客服助手快速調(diào)取常見問題庫、協(xié)助編程助手查詢技術文檔等。定價為每千次查詢2.50美元,文件存儲費用為每GB每日0.10美元(首GB免費)。

計算機使用

開發(fā)者現(xiàn)可通過Responses API構建能夠操作計算機完成任務的智能體,該工具基于與Operator同源的計算機使用代理(CUA)模型。

圖片

展示如何使用OpenAI的API來創(chuàng)建一個響應對象

該工具能捕獲模型生成的鼠標與鍵盤操作軌跡,使開發(fā)者可將這些動作轉(zhuǎn)化為具體環(huán)境中的可執(zhí)行命令,實現(xiàn)計算機任務的自動化處理。

安全方面:內(nèi)置防御提示注入的安全檢查、敏感操作確認提示、環(huán)境隔離工具及策略違規(guī)檢測強化。OpenAI提示,建議涉及系統(tǒng)操作時保持人工監(jiān)督。

該工具現(xiàn)以研究預覽版形式向使用層級3-5的開發(fā)者開放于Responses API中,定價為每百萬輸入Token 3美元、輸出Token 12美元。

03.智能體SDK

全新開源的 智能體SDK 顯著簡化多智能體工作流管理,相較去年發(fā)布的實驗性工具Swarm⁠(已被開發(fā)者社區(qū)廣泛采用并成功部署于多個客戶場景),本次升級包含以下改進:

-- 智能體配置 :支持快速部署預置清晰指令與內(nèi)置工具的大語言模型。

-- 流程交接 (Handoffs:):實現(xiàn)智能體間控制權的動態(tài)轉(zhuǎn)移與上下文繼承。

-- 安全護欄 (Guardrails):可定制的輸入輸出驗證機制,防范有害內(nèi)容。

--追蹤與可觀測性:可視化智能體執(zhí)行軌跡以調(diào)試并優(yōu)化性能。

智能體SDK適用于多種現(xiàn)實場景,包括客戶支持自動化、多步驟研究、內(nèi)容生成、代碼審查與銷售線索挖掘。它兼容Responses API與Chat Completions API。該SDK也支持其他提供商的模型。(騰訊科技特約編譯無忌)

本文來源:騰訊科技

網(wǎng)友評論

聚超值•精選

推薦 手機 筆記本 影像 硬件 家居 商用 企業(yè) 出行 未來
二維碼 回到頂部
国产younv在线精品,先锋AV无码资源不卡,亚洲国产高清不卡在线播放,伊人久久东京av