小米(01810.HK)开源声音理解大模型
小米-W(01810.HK)发布和全量开源声音理解大模型MiDashengLM-7B。
据介绍,MiDashengLM-7B速度精度上实现双突破,包括:单样本首Token延迟仅为同类模型四分之一及同等显存下效率是业界先进模型的20倍以上。在22个公开评测集上刷新多模态大模型最好成绩(SOTA)。
MiDashengLM 以Xiaomi Dasheng音频编码器为核心组件,为Xiaomi Dasheng系列模型的重要升级。在目前版本的基础上,小米已著手对该模型做计算效率的进一步升级,寻求终端设备上可离线部署,并完善基于用户自然语言提示的声音编辑等更全面的功能。
关注uSMART

重要提示及免责声明
盈立证券有限公司(「盈立」)在撰写这篇文章时是基于盈立的内部研究和公开第三方信息来源。尽管盈立在准备这篇文章时已经尽力确保内容为准确,但盈立不保证文章信息的准确性、及时性或完整性,并对本文中的任何观点不承担责任。观点、预测和估计反映了盈立在文章发布日期的评估,并可能发生变化。盈立无义务通知您或任何人有关任何此类变化。您必须对本文中涉及的任何事项做出独立分析及判断。盈立及盈立的董事、高级人员、雇员或代理人将不对任何人因依赖本文中的任何陈述或文章内容中的任何遗漏而遭受的任何损失或损害承担责任。文章内容只供参考,并不构成任何证券、虚拟资产、金融产品或工具的要约、招揽、建议、意见或保证。监管机构可能会限制与虚拟资产相关的交易所买卖基金仅限符合特定资格要求的投资者进行交易。文章内容当中任何计算部分/图片仅作举例说明用途。
投资涉及风险,证券的价值和收益可能会上升或下降。往绩数字并非预测未来表现的指标。请审慎考虑个人风险承受能力,如有需要请咨询独立专业意见。