首页
快讯
观察
Toggle theme
达摩院推出新型
预
训练
对话
模型
首次利用半监督学习注入知识
2022-04-12 16:43:42
今日,阿里达摩院研究人员首次利用半监督学习将标注的人类知识注入
预
训练
对话
模型
,在MultiWOZ2.1等三个国际主流
对话
数据集中均实现了最佳效果。
阿里云开源通义千问720亿参数
模型
2023-12-01 10:36:04
12月1日消息,在通义千问发布会上,阿里云开源通义千问720亿参数
模型
Qwen-72B、18亿参数
模型
Qwen-1.8B及音频大
模型
Qwen-Audio。据悉,阿里云本次开源的
模型
中除
预
训练
模型
外,还同步推出了对应的
对话
模型
,面向72B、1.8B
对话
模型
提供了4bit/8bit量化版
模型
,便于开发者们推理
训练
。
蚂蚁集团AntInsBert
模型
登顶CLUE阅读理解榜
2022-08-10 15:58:16
8月10日消息,日前,中文语言理解测评基准 阅读理解排行榜显示,蚂蚁集团保险科技团队的AntInsBert
模型
以92.475的得分,打破了CLUE阅读理解榜的历史纪录,排名第一。据悉,凭借多年来在自然语言处理方面的深耕,蚂蚁保险科技团队自主研发了
预
训练
语言
模型
——AntInsBert。此前,在第11届CCF自然语言处理与中文计算会议上,蚂蚁集团保险科技团队凭借多年来在保险领域
对话
理解的技术积累,获得“细粒度
对话
社会偏见识别”评测任务第一名。
腾讯AI大
模型
混元助手开始对外测试
2023-10-19 22:00:45
10月19日消息,腾讯AI大
模型
产品混元助手已经开始对外测试,用户在获得测试资格后将可以正式使用。腾讯混元助手是由腾讯研发的大语言
模型
的平台产品,具备跨领域知识和自然语言理解能力,实现基于人机自然语言
对话
的方式,理解用户指令并执行任务,帮助用户实现人获取信息,知识和灵感。今年9月,混元大
模型
参数规模超干亿,
预
训练
语料超2万亿tokens,已经在腾讯云、腾讯广告、微信搜一搜等多个腾讯内部业务和产品经过测试。
拉勾招聘上线AI智能招聘助手产品“HRMind”
2023-07-20 10:02:34
7月20日消息,拉勾招聘宣布上线AI智能招聘助手产品“HRMind”,这是在招聘行业内首个基于
预
训练
大
模型
实现广泛应用的招聘场景产品。据介绍,HRMind可处理
对话
聊天、智能问答等多轮交互沟通。未来,该产品还将实现帮助HR模拟面试、分析求职者简历等功能。
猎聘ChatGPT相关领域报告:人工智能职位平均年薪33.15万元
2023-02-20 15:15:09
2月20日消息,猎聘大数据研究院推出《ChatGPT相关领域就业洞察报告》,解析人工智能领域的就业趋势,以及与ChatGPT密切相关的三个分支领域——
预
训练
模型
、
对话
机器人和AIGC 的人才需求情况。数据显示,猎聘大数据研究院以2018一季度为参照点(基数),此后至2022年,以各季度的人工智能、互联网新发职位数与2018一季度新发职位数相除得到结果:五年来,互联网人才需求增长趋势平缓,人工智能人才需求在2020年之后整体迅速上升。
百度CTO王海峰:文心一言落地水到渠成,带来三大产业机会
2023-04-03 16:40:16
中国电子学会副理事长、百度首席技术官王海峰出席主论坛并做报告,阐释了大
模型
技术发展与产业模式。王海峰展示了文心一言的
对话
问答、文学创作、多模态生成等能力。王海峰表示,新一代知识增强大语言
模型
文心一言是百度多年技术积累和产业实践的水到渠成。百度自2019年开始深耕
预
训练
模型
研发,经过近4年积累和迭代,文心大
模型
已经形成了系统性的大
模型
技术体系,包括自然语言处理、视觉、跨模态、生物计算等大
模型
。
腾讯阿里华为等人机对话专利公布
2023-02-07 11:09:31
2月7日消息,多家知名互联网公司近日纷纷公布人机对话相关专利。其中,腾讯科技(深圳)有限公司申请的“人机对话方法、装置、设备及计算机可读存储介质”专利可实现人机顺畅沟通;阿里巴巴达摩院(杭州)科技有限公司申请的“人机对话及
预
训练
语言
模型
训练方法、系统及电子设备”专利可提升问答交互的准确性;华为技术有限公司申请的“人机对话方法以及
对话
系统”专利可识别用户异常行为进行回复。
阿里达摩院公开“
预
训练
语言
模型
的训练方法”专利
2022-04-27 15:49:28
阿里巴巴达摩院公开一项“
预
训练
语言
模型
的训练方法、装置、计算机设备和介质”专利。
阿里达摩院公开“基于
预
训练
服务系统的服务提供方法”专利
2022-05-07 11:47:49
阿里巴巴达摩院公开一项“
预
训练
服务系统及基于
预
训练
服务系统的服务提供方法”专利。
腾讯RoboticsX用
预
训练
模型
和强化学习提升机器狗控制
2023-06-14 15:18:59
6月14日消息,腾讯RoboticsX机器人实验室公布了智能体研究的最新进展,通过将前沿的
预
训练
AI
模型
和强化学习技术应用到机器人控制领域,让腾讯机器狗Max的灵活性和自主决策能力得到大幅提升。
百川智能发布中英文
预
训练
大
模型
baichuan-7B
2023-06-15 17:39:13
6月15日消息,搜狗创始人王小川创立的百川智能公司,宣布推出了70亿参数量的中英文
预
训练
大
模型
——baichuan-7B。目前baichuan-7B大
模型
已在Hugging Face、Github以及Model Scope平台发布。据介绍,baichuan-7B代码采用Apache-2.0协议,
模型
权重采用了免费商用协议,只需进行简单登记即可免费商用。北京大学和清华大学已率先使用baichuan-7B
模型
推进相关研究工作,并计划在未来与百川智能深入合作,共同推动baichuan-7B
模型
的应用和发展。
阿里联合清华大学发布中文多模态
预
训练
AI
模型
M6
2021-03-03 10:06:52
3月3日消息,阿里巴巴与清华大学联合发布中文多模态
预
训练
AI
模型
M6。据介绍,
预
训练
语言
模型
是让AI具备认知能力的关键技术,此次发布的M6
模型
参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型
预
训练
模型
“文汇”。该
模型
能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
滴滴公开“音频数据的
预
训练
、
模型
训练方法”专利
2021-09-06 14:20:14
滴滴关联公司北京嘀嘀无限科技发展有限公司9月3日公开一项“音频数据的
预
训练
、
模型
训练方法、装置、设备及介质”专利。
阿里巴巴达摩院发布中文社区首个表格
预
训练
模型
SDCUP
2021-12-02 16:28:11
今天,阿里巴巴达摩院深度语言
模型
体系AliceMind发布中文社区首个表格
预
训练
模型
SDCUP。
阿里达摩院实现全球最大AI
预
训练
模型
2021-11-08 15:45:18
11月8日消息,今日,阿里巴巴达摩院公布多模态大
模型
M6最新进展,其参数已从万亿跃迁至10万亿,规模远超谷歌、微软此前发布的万亿级
模型
,成为全球最大的AI
预
训练
模型
。同时,M6做到了业内极致的低碳高效,使用512 GPU在10天内即可
训练
出具有可用水平的10万亿
模型
。相比去年发布的大
模型
GPT-3,M6实现同等参数规模的能耗仅为其1%。
阿里巴巴、智源研究院等联合发布
预
训练
AI
模型
“文汇”
2021-01-12 11:58:42
1月12日消息,日前,阿里巴巴、北京智源人工智能研究院、清华大学、中国科学院等联合研究团队发布面向认知的超大规模新型
预
训练
模型
“文汇”,旨在探索解决当前大规模自监督
预
训练
模型
不具有认知能力的问题。“文汇”也是目前我国规模最大的
预
训练
模型
。据了解,该
模型
不仅能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
网易申请AI大
模型
玉
言商标
2023-08-08 10:22:03
8月8日消息,天眼查App显示,近日,网之易信息技术 有限公司申请注册“网易
玉
言”商标,国际分类为网站服务,当前商标进度为申请中。据此前媒体报道,“
玉
言”为网易伏羲实验室推出的中文
预
训练
大
模型
,其相关技术已用于网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
网易CEO丁磊:人工智能价值已经被引导到了社会生产第一线
2023-04-27 14:30:25
网易目前已自研数十个超大规模
预
训练
模型
,覆盖自然语言等多种
模型
领域。
阿里巴巴发布“通义”大
模型
系列,推动AI从单一智能向通用智能进化
2022-09-02 14:47:13
9月2日,阿里巴巴达摩院主办世界人工智能大会“大规模
预
训练
模型
”主题论坛。
‹‹
‹
1
2
›
››