介紹AG-UI:讓AI代理與用戶界面輕松對接的新協(xié)議
我很高兴地宣布 AG-UI,这是简化了的连接AI代理与现实世界应用的协议。
这个全新的协议由CopilotKit 推出。
请点击这里查看图片
浏览 AG-UI 的 GitHub 页面 ⭐️(点赞支持) 了解更多详情
AG-UI是什么?AG-UI 是一个开放且轻量的协议,通过标准的 HTTP 或可选的二进制通道流式传输单一的 JSON 事件流。这些事件——消息、工具调用、状态补丁、生命周期信号——在您的代理后端和前端界面之间无缝传输,保持完美的实时同步状态。
几分钟内就能开始使用我们的TypeScript或Python SDK,支持任何代理后端(如OpenAI、Ollama、LangGraph或自定义代码)。访问docs.ag-ui.com以获取规范和快速入门指南,你还可以尝试交互式演示。
"AG界面UI2"
如今的AI代理生态系统正在逐渐成熟。代理从病毒式传播的演示发展到了实际的生产使用,包括全球一些大企业在内的实际应用。
不过,生态系统大多关注后台自动化,这些流程可以独立运行,用户互动较少。自动触发的工作流或自动运行的过程,其输出结果会进一步被利用。
常见的用例包括数据迁移、研究和摘要、填表单等等。
可重复且简单的工作流程,其中准确性可以得到保证,或者80%的准确性已经足够。
这些已经大大提高了生产效率,主要是通过自动化工序那些耗时且枯燥的任务。
代理商与用户见面的地方{.lazy "点击图片查看大图"}
代码编辑器:Devin vs. Cursor
在整个生成式AI的采用过程中,编码工具就像煤矿中的预警者,而Cursor则是最佳的用户互动代理。它与用户在共享的工作空间中协同工作。
这跟Devin不一样,Devin承诺的是一个完全自主的代理,能够自动化高级任务。
对于许多最重要的使用场景,如果代理能和用户一起工作,那就很有帮助。这样用户就能看到代理在做什么,可以一起完成相同的工作,并且可以在共享的工作空间里轻松地一起修改。
面对构建用户交互型智能代理的挑战创建这些协作体验会带来重要的技术难题。
-
实时流: LLMs逐步生成token流;UI需要立即接收token流而不能阻塞等待完整响应。
-
工具编排: 现代代理程序调用函数、执行代码、调用 API 接口。界面需要显示进度和结果,有时还需要人工确认,然后继续执行——所有这些操作都不应丢失上下文。
-
共享的可变状态: 代理通常会生成逐步演变的计划、表格或代码文件夹。每次传输整个数据块会浪费带宽,发送差异则需要清晰的结构。
-
并发和取消: 用户可能会发起多个查询请求,中途取消某个查询,或者切换到其他线程。后端和前端需要线程ID、运行ID,以及一条有序的关闭方式。
-
安全性边界: 通过 WebSockets 流式传输任意数据很简单,直到你需要 CORS 策略、认证令牌和能够通过企业审核的日志。
- 框架膨胀: LangChain、CrewAI、Mastra、AG2 以及自建脚本,各自有略微不同的表达方式。没有统一的标准,每个界面都得自己重新开发适配器并处理特殊情况。
如图所示:
AG-UI 通过一个简单却强大的方法来应对这些挑战:
您的客户端向代理端点发送一次POST请求,然后监听该统一事件流(Unified Event Stream)。每个事件都有一个类型(例如TEXT_MESSAGE_CONTENT、TOOL_CALL_START 和 STATE_DELTA),并且有效负载很小。代理在事件发生时触发事件,UI根据事件作出相应反应——显示部分文本,当工具完成时渲染可视化效果,或者在状态更改时更新界面。
建立在标准的HTTP之上,AG-UI能与现有的基础设施很好地融合,同时提供一个可选的二进制序列化选项,对于对性能有严格要求的应用程序。
这能干什么?AG-UI 建立了代理和界面之间的一致的协议,消除了自定义的 WebSocket 格式和文本解析的技巧。这一统一协议实现了:
-
组件变得可以互换: 可以将 CopilotKit 的 React 组件与任何 AG-UI 一起使用
-
灵活性: 无需更改用户界面,在云和本地模型之间切换
-
多代理协调: 通过一个单一接口来协调各个专门的代理
- 增强开发能力: 在更丰富的体验和无供应商绑定的条件下,更快地开发
AG-UI 不仅仅是一个技术规范,它是下一代AI增强应用程序的基础,在这个下一代的应用程序中,人类和代理可以无缝协作。
请先查看入门指南,期待你能试试看。
请于5月16日RSVP两个活动
关注 CopilotKit 的 Twitter,打个招呼哦,如果你想做一些酷炫的项目,就来我们的 Discord 加入我们吧。
共同學(xué)習(xí),寫下你的評論
評論加載中...
作者其他優(yōu)質(zhì)文章