
最新的Google Gemma AI模型可以在手机上运行
谷歌的“开放”人工智能模型家族 Gemma 正在不断壮大。
在周二的Google I/O 2025开发者大会上,谷歌发布了 Gemma 3n,这款产品旨在在手机、笔记本电脑和平板电脑上“流畅”运行。据谷歌称,Gemma 3n 将于周二开始预览,可以处理音频、文本、图像和视频。
近年来,高效到可以离线运行且无需云端计算的模型在人工智能领域日益受到青睐。它们不仅比大型模型更便宜,而且无需将数据传输到远程数据中心,从而保护了隐私。
在 I/O 大会的主题演讲中,Gemma 产品经理 Gus Martins 表示,Gemma 3n 可以在内存低于 2GB 的设备上运行。他补充道:“Gemma 3n 与Gemini Nano共享相同的架构,旨在实现卓越的性能。”
除了 Gemma 3n,谷歌还通过其健康 AI 开发者基金会计划发布了 MedGemma。据该公司称,MedGemma 是其在分析健康相关文本和图像方面功能最强大的开放模型。
“MedGemma 是我们针对多模态(健康)文本和图像理解的开放模型集合,”Martins 说道。“MedGemma 在一系列图像和文本应用程序中表现出色,因此开发人员 […] 可以将这些模型应用于他们自己的健康应用程序。”
此外,即将推出的还有 SignGemma,这是一个将手语翻译成口语文本的开放模型。谷歌表示,SignGemma 将使开发者能够为聋哑和听力障碍用户创建新的应用程序和集成。
“SignGemma 是一个全新的模型系列,经过训练后可以将手语翻译成口语文本,但它最擅长的是美国手语和英语,”马丁斯说道。“它是迄今为止最强大的手语理解模型,我们迫不及待地希望你们——开发者以及聋哑和听力障碍群体——能够利用这个模型进行开发。”
值得注意的是,Gemma 因其定制的非标准许可条款而受到批评, 一些开发者表示,这 使得商业化使用这些模型变得危险。然而,这并没有阻止开发者下载 Gemma 模型,下载量高达数千万次。
太平洋时间下午 2:40 更新:添加了 Gemma 产品经理 Gus Martins 的几句引言。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...