Primate Labs 正式推出了Geekbench AI,这是一款专为机器学习和以 AI 为中心的工作负载设计的基准测试工具。
Geekbench AI 1.0 的发布标志着多年来与客户、合作伙伴和 AI 工程界的开发和协作的巅峰。该基准测试在预览阶段之前被称为 Geekbench ML,现已更名,以符合行业术语并确保其用途清晰。
Geekbench AI 现已通过 Primate Labs 网站在 Windows、macOS 和 Linux 上使用,也可在移动设备的 Google Play Store 和 Apple App Store 上使用。
Primate Labs 的最新基准测试工具旨在提供一种标准化方法来测量和比较不同平台和架构中的 AI 功能。该基准测试通过提供三个总体分数提供了一种独特的方法,反映了 AI 工作负载的复杂性和异质性。
“简单地说,性能测量真的很难,”Primate Labs 解释道。“这并不是因为难以运行任意测试,而是因为难以确定哪些测试对于您想要测量的性能最重要——尤其是在不同平台上,尤其是当每个人做事的方式都略有不同时。”
三分制系统考虑了现代 AI 实现中不同的精度水平和硬件优化。这种多维度方法使开发人员、硬件供应商和爱好者能够更深入地了解设备在不同场景中的 AI 性能。
Geekbench AI 的一个显著特点是增加了每项测试的准确度测量。该功能表明,AI 性能不仅与速度有关,还与结果质量有关。通过结合速度和准确度指标,Geekbench AI 可以更全面地了解 AI 功能,帮助用户了解性能和精度之间的权衡。
Geekbench AI 1.0 引入了对各种 AI 框架的支持,包括 Linux 和 Windows 上的 OpenVINO,以及特定于供应商的 TensorFlow Lite 代表,例如 Samsung ENN、ArmNN 和 Android 上的 Qualcomm QNN。这种广泛的框架支持可确保基准测试反映 AI 开发人员使用的最新工具和方法。
该基准测试还利用了更广泛、更多样化的数据集,这不仅提高了准确性评估,而且更好地代表了现实世界的 AI 用例。Geekbench AI 1.0 中的所有工作负载至少运行一秒钟,使设备在测试期间达到其最高性能水平,同时仍能反映现实世界应用程序的突发性。
Primate Labs 发布了 Geekbench AI 1.0 中使用的工作负载和模型的详细技术描述,强调了他们对透明度和行业标准测试方法的承诺。该基准测试与Geekbench 浏览器集成,方便进行跨平台比较和结果共享。
该公司预计将定期更新 Geekbench AI,以跟上市场变化和新兴 AI 功能的步伐。不过,Primate Labs 认为 Geekbench AI 已经达到了一定的可靠性水平,适合集成到专业工作流程中,三星和 Nvidia 等主要科技公司已经在使用该基准。