Mistral的新Devstral AI模型专为编码而设计

Mistral的新Devstral AI模型专为编码而设计

Mistral的新Devstral AI模型专为编码而设计

人工智能初创公司 Mistral 周三宣布了一种专注于编码的新人工智能模型:Devstral

Mistral 表示,Devstral 是与人工智能公司 All Hands AI 合作开发的,并根据 Apache 2.0 许可证公开提供,这意味着它可以不受限制地用于商业用途。Mistral 声称,在 SWE-Bench Verified(一项衡量编程技能的基准测试)上, Devstral 的表现优于其他开放模型,例如谷歌的 Gemma 3 27B 和中国人工智能实验室DeepSeek 的 V3 。

Mistral 在提供给 TechCrunch 的一篇博客文章中写道:“Devstral 擅长使用工具探索代码库、编辑多个文件以及驱动软件工程代理。它运行在 OpenHands 或 SWE-Agent 等代码代理框架上,这些框架定义了模型和测试用例之间的接口 […] Devstral 足够轻量,可以在单个 Nvidia RTX 4090 或配备 32GB RAM 的 Mac 上运行,使其成为本地部署和设备使用的理想选择。”

Mistral的新Devstral AI模型专为编码而设计

Mistral 对 Devstral 的内部基准评估结果

Mistral 对 Devstral 的内部基准评估结果
图片来源: Mistral
Devstral 的出现正值 AI 编程助手及其驱动模型日益普及之际。就在上个月,开发了一系列热门应用开发工具的公司JetBrains发布了其首个用于编程的“开放式”AI 模型。近几个月来,包括谷歌、Windsurf和OpenAI在内的 AI 公司也纷纷推出了针对编程任务进行优化的模型,既有公开的,也有专有的。

人工智能模型仍然难以编写高质量的软件——由于在理解编程逻辑等方面存在缺陷,代码生成人工智能往往会引入安全漏洞 和 错误。然而,它们有望提高编码效率,这正推动着企业和开发者迅速采用它们。最近的一项调查发现,去年 76% 的开发者在开发过程中使用或计划使用人工智能工具。

Mistral 此前曾凭借Codestral (一种代码生成模型)涉足辅助编程领域。但 Codestral 的发布并未获得允许开发者将其模型用于商业应用的许可;其许可明确禁止“员工在公司业务活动中进行任何内部使用”。

Devstral 被 Mistral 称为“研究预览版”,可以从包括 Hugging Face 在内的 AI 开发平台下载,也可以通过 Mistral 的 API 使用。其定价为每百万个输入令牌 0.1 美元,每百万个输出令牌 0.3 美元,令牌是 AI 模型处理的原始数据。(一百万个令牌相当于约 75 万个单词,比《战争与和平》长约 16.3 万个单词。)

Mistral 表示,他们“正在努力构建一个更大规模的代理编码模型,并将在未来几周内面世”。Devstral 本身并非小型模型,但它的参数规模较小,约为 240 亿个。(参数大致对应于模型的解决问题能力,参数较多的模型通常比参数较少的模型表现更好。)

Mistral 成立于 2023 年,是一家前沿模型实验室,旨在构建一系列人工智能服务,包括聊天机器人平台 Le Chat 和移动应用程序。该公司获得了包括 General Catalyst 在内的多家风投公司的支持,迄今已筹集超过 11 亿欧元(约合 12.4 亿美元)。Mistral 的客户包括法国巴黎银行、安盛保险和 Mirakl。

Devstral 是 Mistral 本月推出的第三款产品。几周前,Mistral 推出了一款高效的通用模型 Mistral Medium 3。大约在同一时间,该公司推出了 Le Chat Enterprise,这是一项面向企业的聊天机器人服务,提供 AI“代理”构建器等工具,并将 Mistral 的模型与 Gmail、Google Drive 和 SharePoint 等第三方服务集成。

© 版权声明

相关文章

暂无评论

none
暂无评论...