蚂蚁集团顾进杰:正式开源国内首个医疗专科推理数据集

周兴
2023-12-29 09:13

12月29日消息,由中国信通院主办的“虹桥之源”大模型驱动数字经济新生态峰会日前在上海召开。会上,蚂蚁集团商业机器智能部总经理顾进杰介绍,蚂蚁正式开源国内首个医疗专科推理数据集,这将提升大模型在医疗领域的专业性。

据透露,蚂蚁集团与上海仁济医院泌尿科专家团队联合研发,基于医生团队临床经验,通过构造模拟病例数据的方式,推出了首个中文医疗专科问答推理数据集RJUA-QA,这也是业内首个临床专科数据集。

数据集由训练、验证、测试三部分组成,包含2132个问答对,每个问答对由医生根据临床经验编写的问题、专家提供的回答以及用于帮助推理的上下文构成,病种覆盖了97.6%以上的泌尿科就医人群,能真实复刻诊疗场景。数据集能提高大模型在医疗诊断推理方面的能力,并作为在严肃可控场景下应用的评测基准。

format-jpg

“虹桥之源”大模型驱动数字经济新生态峰会现场 图源:蚂蚁集团公众号

顾进杰进一步介绍了蚂蚁百灵大模型在医疗领域的技术进展,“专业性、可控性、轻量化是大模型技术在医疗行业落地的三个重要挑战和机会。”

专业性上,由于医疗行业有超百个科室,每个专科和疾病,都需要专业的调试。蚂蚁集团联合医疗专家共同研发了多模态医疗知识引擎,进一步推动中国专业医疗数据集的构建与开放。

在可控性方面,百灵大模型结合知识图谱技术,让大模型的每一个回答都有据可依。“生成内容可以满足不同医院、不同科目的定制需求,包括风格与调性等”,顾进杰说。蚂蚁集团在超大规模图学习和知识图谱技术长期积累,今年联合OpenKG发布的OpenSPG开源项目,重新定义了工业界的知识图谱语义架构,知识检索增强技术也是大幅提升大模型正确性与可控性的重要课题。

医疗行业有数据隐私、专业知识和系统自主性的需求,考虑到机构的算力成本与便捷部署,百灵大模型还攻坚了轻量化技术。在12月份开源的模型轻量化框架(PIA)中,集成了模型剪枝、压缩、量化、推理加速等全链路环节的优化,具备开箱即用、功能无损、低代码接入等优点,可在天级别完成10倍以上压缩比。

format-jpg

蚂蚁集团商业机器智能部总经理顾进杰 图源:蚂蚁集团公众号

目前,蚂蚁百灵大模型在中英文的医疗考试以及基准测试达到或超过了GPT4水准,例如,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩;在国际医疗问答榜单PubMedQA中,以80.6%的准确率取得了前五的成绩,而且是前十中参数量最小的模型,更适合被机构部署和使用。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
3月18日消息,据报道,美国公募巨头先锋集团蚂蚁集团支持的“先锋领航投”公布数据显示,上线一年时间,“帮你投”服务用户已突破100万,是目前国内最大的在线基金投产品。知情人士称,截至今年2月底,“帮你投”管理的资产较去年底跃升60%,至69亿元人民币。公开资料显示,“帮你投”业务于2020年4月推出,目前提供全委托选基、配置、调仓等服务,它会在评估用户风险偏好和投资范围后,从6000支公募基金中建议一个投资组合。
12月12日消息,近日举办的全球AI顶级会议NeurlPS大会上,蚂蚁集团20篇论文被收录。覆盖计算机视觉、自然语言处理、图神经网络、图像处理等多个人工智能和机器学习前沿,七成以上论文聚焦AIGC领域。据蚂蚁集团方面透露,过去五年,蚂蚁集团在国际顶级学术期刊和学术会议上发表论文500篇,其中AI领域论文300余篇,80%以上聚焦AI领域。
业内人士表示,拿到4张金融牌照,意味着字节跳动有了和蚂蚁集团身互搏的底气。2020年,随着国内对金融科技行业监管规则的调整以及互联网金融环境的收紧,开展相关金融业务的互联网企业纷纷遭受了不同程度的“滑铁卢”,先有蚂蚁集团被叫停上市,后有京东数科撤回上市申请。再加上,微信支付与支付宝共同占领了国内移动支付市场的90%以上的市场份额,在移动支付领域形成双寡头格局。尽管如此,仍有互联网企业涌入互联网金融赛道。
蚂蚁集团大模型研发团队透露将投入20%的技术人员建设科技伦理,还与8所高校机构开展共建科技伦理知识体系。
8月14日消息,蚂蚁集团在北京的自有园区——蚂蚁T空间近日正式启用,蚂蚁集团创新科技总部正式落地北京。该园区聚集了超过3000名员工,其中技术人才占比80%。蚂蚁集团计划利用北京的人才和科创优势,加大科技投入,特别是在人工智能和数据要素领域。蚂蚁T空间的启用体现了蚂蚁集团在北京的技术和人才布局,未来十年将聚焦于人工智能和数据技术的发展。
12月22日消息,在蚂蚁集团科技伦理顾问委员会2023年度会议上,蚂蚁集团大模型研发团队透露将投入20%的技术人员建设科技伦理,还与8所高校机构开展共建科技伦理知识体系,打造负责任的AI。今年2月,蚂蚁集团在设立公司内部科技伦理委员会的基础上,正式成立科技伦理顾问委员会,由7名外部专家构成,为蚂蚁集团科技伦理建设给予方向性、战略性、针对性的指导建议。
今日,在中国文化产业协会牵头下,30家机构联合发起《数字藏品行业自律发展倡议》。
6月28日消息,第十四届夏季达沃斯论坛近日在天津召开,来自全球100个国家和地区的1500多名政商精英及学者参会。作为本次“夏季达沃斯论坛”的重要环节,世界经济论坛披露了加入“全球植万亿棵树领军者倡议-中国行动”的企业名单。据了解,蚂蚁集团计划在2030年前的十年间开展植树造林、养护和抚育等生态项目26万公顷,相当于种植、保护和恢复3.4亿棵树,助力中国实现在2030年前种植、保护和恢复700亿棵树的目标。