<汇港通讯> 小米集团(01810)表示,於6月8日晚上正式推出 Xiaomi MiMo-V2.5-Pro-UltraSpeed 模式,成为全球首个在通用 GPU 上推理速度突破 1000 tokens/s 的万亿参数模型,刷新旗舰模型全球推理最快速度。
由即日起至6月23日,MiMo-V2-Pro-UltraSpeed 模式将以申请制形式限时开放,通过申请的用户可透过 API 体验该服务。MiMo-V2.5-Pro-UltraSpeed API 亦同步上线,采用限时体验价,定价为 MiMo-V2.5-Pro 的 3 倍,同时提供约 10 倍的输出速度提升;目前仅支援 API 体验,不支援 Token Plan。
MiMo-V2.5-Pro-UltraSpeed 透过对模型推理系统进行全链路工程优化,在不降低模型能力的前提下,首次将推理速度提升至1000 tokens/s,并无需订制晶片,只需使用通用 GPU 即可实现。这项突破不但打破业界长期以来「快、强、通用 GPU 无法兼得」的限制,亦显示小米 MiMo 大模型在推理工程能力方面已跻身全球第一梯队。
Xiaomi MiMo-V2.5-Pro-UltraSpeed 的推出,标志着旗舰大模型正式迈向更高推理效率阶段,亦为未来更广泛的即时应用场景提供更多可能。
随着 MiMo-V2.5-Pro-UltraSpeed 将推理速度提升至 1000 tokens/s,万亿参数大模型已具备接近即时完成复杂任务的能力,智能编程、Agent 协同及高频量化交易等场景的应用门槛亦正逐步降低。
接连完成三项重要技术突破 小米 AI 进展远超预期。
自4月底以来,小米 AI 於模型能力、推理成本及推理效率三个维度接连取得突破:4月23日,MiMo-V2.5-Pro 在全球权威大模型测评平台 Artificial Analysis 上,获得综合智能指数与 Agent 指数全球开源模型并列第一;5月27日,Xiaomi MiMo-V2.5 系列模型 API 因技术优化宣布最高降价 99%,并同步调整 Token Plan 计费体系。6月8日,MiMo-V2.5-Pro-UltraSpeed 以 1000 tokens/s 创下万亿参数旗舰模型推理速度新纪录。
#AI (SY)
新闻来源 (不包括新闻图片): 汇港资讯