消息称罗福莉将加入小米 或领导小米大模型团队

刘峰
2024-12-21 16:12

12月21日消息,据第一财经《新皮层》消息,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。知情人士称,雷军认为小米在大模型领域发力太晚,于是亲自挖人,重金招募能够领军小米大模型的人才,支付的薪酬水平在千万元级别。

小米AI实验室正式成立于2016年年初,目前团队大约有250人,研究方向包括视觉、声学、语音、自然语言处理(NLP)、知识图谱、机器学习和大模型。

612f205db4e119ecdac0aeee64d70c0b-800.jpgf3e81128f4752f570776691fd65d304b-800.jpg

图源:新皮层NewNewThing公众号

根据公开信息,罗福莉硕士毕业于北京大学计算语言学研究所,研二时在自然语言处理领域顶级会议ACL 2019上发表8篇论文,其中两篇为一作。毕业后,罗福莉加入阿里达摩院机器智能实验室。任职期间,她主导开发的多语言预训练模型VECO(同时支持多语言理解和生成的跨语言模型),被纳入阿里达摩院深度语言模型体系AliceMind。此外,她还主导了AliceMind的开源工作。2022年,罗福莉离开阿里,在DeepSeek担任深度学习研究员,参与了DeepSeek的MoE大模型DeepSeek-V2的开发。

罗福莉的加入可能加速小米在大模型领域的研发进度。2023年4月,小米AI实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。

2023年年度演讲中,雷军宣布小米将全面拥抱AI大模型,大模型技术的主力突破方向为“轻量化”和“本地部署”。基于该原则,小米的大模型团队研发了MiLM系列模型,并于今年11月升级至第二代——MiLM2。目前,MiLM2已经在澎湃OS、小爱同学、智能座舱、智能客服中应用落地。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
小米科技有限责任公司申请注册科学仪器类“ChatMI”商标、运输工具类“小米模型”商标等。
9月7日消息,小米模型首个落地产品“小爱同学”正在持续开放邀请内测。据首批邀请内测的用户反馈,小爱模型在翻译、规划、写代码等等场景中表现良好。小米公司官微发布信息称,小爱模型拥有强悍的理解能力和丰富的知识储备,现在,可以写周报、做旅游攻略、制定健身计划,甚至写代码。
小米申请模型商标
9月1日消息,天眼查资料显示,小米科技有限责任公司近日申请注册多个“小米模型”、“MiLM-6B”商标,国际分类为科学仪器、网站服务、广告销售等,当前商标状态均为申请中。
小米科技有限责任公司申请注册多个“小米模型”“MiLM-6B”商标,商标状态均为申请中。
小米模型将逐步应用于小米公司的汽车、手机、智能家居等产品中。
5月16日消息,小米公司官方微博宣布,小米语言模型MiLM正式通过模型备案,将逐步应用于小米汽车、手机、智能家居等产品中。
小米模型首次曝光
小米语言模型MiLM-6B近日首次现身C-Eval、CMMLU两AI模型评测榜单。
雷军通过小米集团和顺为资本,注资了模型初创公司百川智能。