阿里云数据库NL2SQL技术获国际权威评测第一名

电商报
2022-09-30 10:53

日前,阿里云数据库参加耶鲁大学Spider数据集评测,以78分的成绩排名榜单第一。这一成绩证明了阿里云数据库在NL2SQL技术上的国际领先性。据了解,Spider是业界公认的大规模跨领域复杂NL2SQL转换效果的评测榜单。

format-jpg

NL2SQL(Natural Language to SQL)是一项将用户的自然语句转为数据库可执行 SQL 语句的技术,对改善用户与数据库之间的交互方式有很大意义。Spider数据集是耶鲁大学提出的一个较大规模的NL2SQL数据集,包含了10000多条自然语言问句,内容覆盖了100多个不同的领域,贴近真实场景,难度非常高。

format-jpg

日前,阿里云数据库团队研发的CatSQL技术参加评测,并获得Spider数据集评测第一名的好成绩。78分的成绩,显著超过第二名0.4分,尤其是模型规模仅为第二名的1/7,且计算速度提升10倍以上。

达摩院智能数据库实验室负责人谭剑介绍:为提升NL2SQL转换效果,现阶段业界的一个趋势是使用越来越大的模型,而在这次测评中,阿里云数据库团队另辟蹊径,采用了小模型,在获得了几乎一个数量级的吞吐率提升的同时,还取得了更好的准确率;该方法也开辟了NL2SQL的一个新思路,即把自然语言技术与数据库领域知识紧密结合,从SQL语义的角度提升NL2SQL的准确性,也更加保证了在实际商用场景中的有效性。

谭剑表示,“最新的成绩说明,NL2SQL技术已经日臻成熟,在准确性和实用性上逐渐达到了部分复杂场景的商用要求。”

据透露,阿里云数据库团队在NL2SQL方向上已经进行了两年多的自研工作,并已经把这些前沿技术在相关数据库产品中落地使用,有效的简化了用户查询数据库的方式。比如,阿里云数据库的一站式数据管理平台DMS上,就采用了自研CatSQL技术,通过自然语言交互的方式帮助客户更高效的进行数据资产管理。

据了解,阿里云自成立以来就十分重视数据库前沿技术研究,并为此成立专门的研究机构——达摩院数据库与存储实验室。过去几年,阿里云数据库团队有50多篇论文被国际顶级会议和期刊收录,获得了近千项国内外专利,并实现自研数据库拥有存储计算分离、三层解耦、多主架构、HTAP、Serverless、一体化分布式、全加密、智能与自治化等创新能力。

公开资料显示,阿里云拥有国内最丰富的云数据库产品家族,云数据库市场份额位居国内第一。据国际权威机构Gartner年度全球云数据库魔力象限评估报告,阿里云作为中国唯一的科技公司代表,于2020年和2021年连续两年进入领导者(LEADERS)象限。这标志着中国数据库40年来首次进入全球顶级数据库行列。

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
据报道,阿里宣布,因疫情推动全球企业计算和数据库的使用,企业销售额同比增长,预测数据库产品收入同比增长超过50%。
在2022栖大会上,阿里巴巴集团副总裁、阿里数据库产品事业部负责人李飞飞发表《一站式、全场景数据管理与服务》主题演讲。
9月1日消息,数据库国际顶会VLDB近日在加拿大温哥华举行,来自阿里、达摩院合作者的论文共入选17篇,其中工业赛道 收录阿里7篇文章,均刷新中国企业纪录。
3月24日消息,在阿里瑶池数据库峰会上,阿里巴巴集团副总裁、阿里数据库产品事业部负责人李飞飞指出,数据库正在快速向“四化”方向演进,在接下来的5-10年,这种演进将进入一个波澜壮阔的新阶段。在李飞飞看来,四化分别指的是原生化、平台化、一体化以及智能化。“未来只有一种原生数据库,集中式、分布式的数据库形式都将过时。”
1月17日消息,据报道,阿里宣布,因疫情推动全球企业计算和数据库的使用,企业销售额同比增长,预测数据库产品收入同比增长超过50%。阿里数据库产品系列目前为全球15万家客户提供服务,涵盖航空、保险、物流、零售、金融科技、制造、游戏、教育等关键垂直领域。阿里收入增长主要得益于互联网、公共部门金融行业客户收入增长推动,预计未来收入结构将进一步多样化。
12月28日消息,阿里发布消息称,近日,市场咨询机构Gartner公布2021年Gartner全球数据库魔力象限评估结果,阿里作为唯一进入领导者象限的中国公司,再次入选领导者象限。据悉,Gartner数据库魔力象限是业内最权威的评估之一。在本次评估中,Gartner的评估标准涵盖了战略前瞻性和市场执行力两大维度,共15个核心指标以及200多项细则。
10月29日消息,2024年度“CCF科技成果奖”正式揭晓,阿里原生三层解耦Serverless数据库关键技术与应用”项目获2024年度中国计算机学会(CCF)科技进步一等奖。