小米公司于8月11日在GitHub上发布了其首款大规模预训练语言模型MiLM-6B/1.3B,该模型参数高达64亿,并在C-Eval、CMMLU基准评测中表现出色。MiLM-6B在C-Eval总榜单中排名第10、同参数量级中排名第1,超过了多个竞争对手。此举标志着小米进军GPT领域,展示了其在人工智能领域的突破与创新。
小米成立AI实验室大模型团队后,积极研发大模型产品,MiLM-6B的发布是该团队的成果之一。根据消息,MiLM-6B将应用于小爱同学、loT、自动驾驶、机器人等领域,充分利用丰富的应用场景,将大模型能力与实际业务深度结合,实现技术创新与商业应用的有机融合。
尽管小米CEO雷军曾表示不会像OpenAI一样发布大模型产品,但此次MiLM-6B的发布显示出小米在大模型领域的雄心与实力。虽然尚未确认MiLM-6B是否开源以及产品是否已经落地内测,但其优异的表现和技术实力令人期待,也将为未来的人工智能发展带来新的可能性。
小米将于8月14日举行雷军年度演讲,或许会在演讲中透露更多有关MiLM-6B大模型技术的信息。然而,目前尚未有官方回复关于MiLM-6B的开源与落地情况。