阿里巴巴达摩院发布中文社区首个表格预训练模型SDCUP
宋妤
2021-12-02 16:28
12月2日消息,据天下网商消息,今天,阿里巴巴达摩院深度语言模型体系AliceMind发布中文社区首个表格预训练模型SDCUP,该模型在全球权威表格数据集WikiSQL、SQuALL上取得了业界最优效果,且模型和训练代码均已对外开源。
据介绍,表格是应用普遍的结构化数据,也是智能对话系统和搜索引擎的重要答案来源。新兴的表格问答技术,可将自然语言转换为查询语句,使用户能通过简单问句直接与表格数据库交互,具有广泛应用前景。
本次,达摩院对话智能团队提出了首个中文表格预训练模型SDCUP,其基于“模式依存”方法,通过模型直接预测自然语言与表格结构内容的关键词映射,提升了表格问答的准确率。
据达摩院资深算法专家李永彬介绍,SDCUP模型是达摩院表格对话技术系列研发的一部分,后续将持续对外开源。其相关技术先后在四大国际公开数据集WikiSQL、Spider、SParC、CoSQL上取得第一。
值得注意的是,目前,该技术完成了产品化,已通过阿里云智能客服为政务、金融、零售等行业客户提供表格问答和数据库自然交互服务。
值得一提的是,近来阿里巴巴达摩院在新产品研究方面取得了许多成果。10月下旬,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合语音产品“听悟”。
据介绍,相比只能逐字转写的上一代语音产品,“听悟”是面向未来会议的AI助理,其集成了达摩院最新语音及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。
声明
1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
宋妤
0