经过一周漫长的编程工作后,你可能会认为旧金山的建设者们会躲进湾区的山间、海滩或热闹的夜店。但实际上,一周的工作结束后,人工智能黑客马拉松就开始了。
过去几年,旧金山的人工智能黑客马拉松活动如雨后春笋般涌现。每个周六或周日,技术专家都会就人工智能、网络方面的最新进展发表演讲,最重要的是,将想法付诸实践。有时,黑客马拉松会以现金或云积分的形式提供奖品,但真正的赢家会带着初创企业的雏形离开。
Agency AI联合创始人 Alex Reibman表示:“世界上没有比旧金山更好的地方来构建你一生中最雄心勃勃的项目了。你经常会看到大量的比赛——比如黑客马拉松——但它们并不是相互竞争的。它既是竞争,也是合作。”
去年夏天,在旧金山的黑客马拉松上,雷布曼决定尝试构建能够抓取网络数据的人工智能代理。随着人工智能热潮的兴起,代理成为硅谷的热门话题。这个术语并没有精确的定义,但通常描述能够自动执行任务的人工智能机器人,使用最初并非为自动化而设计的界面和服务——一种替代过去需要人工干预的平凡任务的方法。
但雷布曼很快就遇到了问题。“他们太差劲了,”雷布曼在接受采访时说。“代理失败的几率大概是 30% 到 40%,而且经常是以意想不到的方式。”
为了解决这个问题,Reibman 的团队开发了内部调试工具来查看代理出错的地方。最终,他们让代理工作得更好一些,但调试工具本身却抢尽了风头,赢得了黑客马拉松。
“我开始在旧金山的一系列黑客马拉松和活动中展示这些工具,人们开始要求使用这些工具,”雷布曼说。“这基本上就是我需要的确认:我们不应该自己构建代理,而应该构建工具,让构建代理变得更容易。”
因此,Reibman 与联合创始人 Adam Silverman 和 Shawn Qiu 共同创办了 Agency,提供工具来观察 AI 代理的实际行为,并找出错误之处。Reibman 说,一年后,这些工具最终成为 Agency 的核心产品 AgentOps 平台,目前每月有数千个团队使用该平台。这家初创公司目前已筹集了 260 万美元的种子前资金,由 645 Ventures 和 Afore Capital 领投。
首席运营官亚当·西尔弗曼 (Adam Silverman) 说,AgentOps 就像是“代理的多设备管理”,它会分析代理所做的一切,以确保其不会失控。
“你需要了解你的经纪人是否会不守规矩,并确定你可以设置哪些限制,”西尔弗曼在接受采访时说。“在将他们投入生产之前,很多工作都是能够直观地看到你的护栏在哪里,以及经纪人是否遵守它们。”
该初创公司与人工智能模型开发商 Cohere 和 Mistral 合作,后者也提供代理创建服务,因此客户可以使用 AgentOps 的仪表板查看代理如何与世界互动,以及每个代理的成本。Agency 与模型无关,这意味着它可以与多种不同的人工智能代理框架配合使用,但可以与 Microsoft 的 AutoGen、crewAI 和 AutoGPT 等流行工具集成。
除了 AgentOps 的仪表板之外,Agency 还提供咨询服务(Reibman 之前在咨询公司 EY 任职),帮助企业开始建立代理。Agency 不愿透露任何客户的名字,但透露对冲基金、咨询公司和营销公司都在使用他们的工具。
例如,Reibman 表示,Agency 帮助创建了一个 AI 代理,该代理会撰写有关客户正在合作的公司博客文章。现在,同一个客户使用 AgentOps 仪表板来跟踪代理的绩效和成本。
OpenAI 和 Google 等主要参与者可能会在未来几个月内推出他们的代理产品,而 Agency 等人工智能初创公司必须弄清楚如何与这些进步并行不悖,而不是与之对抗。
“堆栈中有如此多的层,LLM 提供商不太可能尝试捕获所有这些层,”Reibman 说道。“OpenAI 和 Anthropic 正在构建代理构建器,但周围还有所有这些层,以确保您拥有可用于生产的代码库。”