
Fastino在廉价游戏GPU上训练AI模型,并刚刚在Khosla领投下筹集了1750万美元
科技巨头们喜欢吹嘘拥有万亿参数的AI模型,而这些模型需要庞大且昂贵的GPU集群。但Fastino却另辟蹊径。
这家位于帕洛阿尔托的初创公司表示,它发明了一种新型的人工智能模型架构,这种架构旨在缩小模型规模,并针对特定任务进行设计。Fastino 表示,这些模型非常小,因此可以使用总价值不到 10 万美元的低端游戏GPU进行训练。
这种方法正在引起人们的关注。Fastino 独家向 TechCrunch 透露,Fastino 已获得由 Khosla Ventures(OpenAI 的首位风险投资者)领投的 1750 万美元种子轮融资。
这使得这家初创公司的总融资额达到近2500万美元。去年11月,该公司在由微软风险投资部门M12和Insight Partners领投的种子轮融资中筹集了700万美元。
Fastino 首席执行官兼联合创始人 Ash Lewis 表示:“我们的模型速度更快、更准确,训练成本仅为其一小部分,同时在特定任务上的表现优于旗舰模型。”
Fastino 构建了一套小型模型,出售给企业客户。每个模型都专注于公司可能需要的一项特定任务,例如编辑敏感数据或汇总公司文档。
Fastino 尚未公布早期指标或用户数量,但表示其性能已令早期用户赞叹不已。例如,由于其模型非常小,只需一个 token 就能提供完整的响应,Lewis展示了该技术能够在几毫秒内立即提供详细答案。
现在判断 Fastino 的方法是否会流行还为时过早。企业 AI 领域竞争激烈,像 Cohere 和 Databricks 这样的公司也都在宣传能够胜任某些任务的 AI。而专注于企业的 SATA 模型制造商,例如 Anthropic 和 Mistral,也提供小型模型。企业级生成式 AI 的未来很可能是更小、更专注的语言模型,这已不是什么秘密。
时间或许能证明一切,但科斯拉的早期信任肯定不会带来坏处。Fastino 表示,目前其专注于打造一支尖端的人工智能团队。其目标客户是顶尖人工智能实验室的研究人员,他们并不执着于构建最大的模型或超越基准测试。
刘易斯说:“我们的招聘策略非常注重那些可能对当前语言模型的构建方式有相反思维过程的研究人员。”
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...