小米大模型首次曝光

柏纳
2023-08-11 16:21

8月11日消息,小米的大语言模型MiLM-6B近日首次现身C-Eval、CMMLU两大AI模型评测榜单。截至目前,MiLM-6B在C-Eval总榜单排名第10、同参数量级排名第1,在CMMLU中文向大模型排名第1。

在C-Eval评估中,MiLM-6B的平均分为60.2,在STEM、Social Sciences、Humanities和Others 等不同学科和难度级别上也表现出色。在CMMLU评估中,MiLM-6B在zero-shot和five-shot测试中的平均分分别为60.37和57.17,表现出良好的知识和推理能力。

format-jpg

图源:站长之家

小米在2023年一季度财报中表示,公司将积极拥抱人工智能带来的新一轮技术变革。同时,小米透露,公司在2023年4月正式组建了AI实验室大模型团队,在AI领域相关人员超1,200人。小米称,将不断挖掘AI相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。

此外,财报显示,小米研发开支由2022年第一季度的人民币35亿元增加17.7%至2023年第一季度的人民币41亿元。小米预计2023年全年的总研发投入将超过人民币200亿元。截至2023年3月31日,小米的研发人员数达到16,458人,占员工总数超过50%。

format-jpg

截自小米截至2023年3月31日止三个月之业绩公

值得一提的是,8月9日,小米创办人,董事长兼CEO雷军在其个人微博上宣布将于8月14日晚7点举办今年的雷军年度演讲,主题为“成长”。雷军表示:“这是我的第4次年度演讲,我想和大家聊聊,过去30多年,几次关键成长的经历和感悟。”

对网友关于此次年度演讲的提问,雷军回应:“和前三次最大的不同,第一次走出小米科技园,在北京的国家会议中心举办。现场可以容纳3500位观众,非常期待跟大家见面聊。”

雷军还透露,年度演讲结束后是小米年度新品发布会,将会披露小米技术探索的新进展。

format-jpg截自微博

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
小米科技有限责任公司申请注册科学仪器类“ChatMI”商标、运输工具类“小米模型”商标等。
知情人士称,雷军认为小米模型领域发力太晚,于是亲自挖人,重金招募能够领军小米模型的人才。
9月7日消息,小米模型首个落地产品“小爱同学”正在持续开放邀请内测。据首批邀请内测的用户反馈,小爱模型在翻译、规划、写代码等等场景中表现良好。小米公司官微发布信息称,小爱模型拥有强悍的理解能力和丰富的知识储备,现在,可以写周报、做旅游攻略、制定健身计划,甚至写代码。
小米模型将逐步应用于小米公司的汽车、手机、智能家居等产品中。
小米申请模型商标
9月1日消息,天眼查资料显示,小米科技有限责任公司近日申请注册多个“小米模型”、“MiLM-6B”商标,国际分类为科学仪器、网站服务、广告销售等,当前商标状态均为申请中。
小米科技有限责任公司申请注册多个“小米模型”“MiLM-6B”商标,商标状态均为申请中。
雷军通过小米集团和顺为资本,注资了模型初创公司百川智能。