度小满CTO许冬亮:金融行业是大模型落地应用的高潜场景
8月25日消息,在“北大光华-度小满金融大模型技术与应用论坛”上,度小满CTO许冬亮表示,金融行业是高价值行业,数字化基础好,高度依赖数据和技术,也是大模型落地应用的高潜场景。
现阶段,如何在金融领域发挥大模型的能力,许冬亮认为还有三个挑战需要解决:第一个挑战是通用模型能力不能满足金融场景需要。首先是通用大模型本身精度不够,当前大模型原生的幻觉问题、可控性问题和可解释性问题都限制了生成内容的准确性和可控性,而金融又是一个对精准性、可控性要求很高的行业;其次是通用大模型金融知识的缺失;再次是大模型更新迭代困难,金融是高时效的,模型必须能够实时跟踪金融市场的变化和趋势。
图注:度小满CTO许冬亮
(图源度小满官方公众号)
第二个挑战是大模型如何高效植入现有业务场景。一个团队既要懂业务场景的know-how,又要理解大模型的使用方法,而且还需要具备比较强的工程能力,这样才有可能选择出适合应用大模型的场景,高效的将大模型嵌入到实际业务流程。
第三个挑战是大模型应用于金融业中产生的安全合规和隐私保护问题。金融本身是一个高合规要求的行业,大模型又是具有颠覆性的新技术,我们对它的风险还没有完全了解,随着大模型落地的不断推进,如何平衡大模型落地收益和潜在合规风险,会是一个越来越突出的问题。
(图源度小满官网截图)
如何解决大模型在金融行业落地应用的这些难题,许冬亮认为每家机构独立去解决这些问题既是不现实的,也是不经济的,科技公司和金融机构在金融大模型上的合作非常有必要。
大模型训练需要大数据,但是金融数据非常宝贵。许冬亮具体解释,“大模型训练非常依赖底层的生产资料,也就是数据,但金融行业数据的分布实际上比较分散,通用智能化数据主要集中在科技公司手上,金融数据则分散在各个金融科技公司手上,而对于金融机构而言数据是核心竞争力也不太可能进行分享,其他还有监管、数据安全、隐私保护等因素存在,所以注定未来这个行业高质量数据的分布也会是分散的状态。”
许冬亮表示,未来从合作模式上来说,应该会是科技公司提供不同类型的通用大模型,金融科技公司在通用大模型的基础上提供金融行业大模型,将领域内的知识、know-how进一步整合,以私有化的形式部署到金融机构内部,而不是以云端API的方式提供服务,科技公司和金融机构未来会是深度合作的模式。
图注:度小满数据智能部总经理杨青
(图源度小满官方公众号)
度小满数据智能部总经理杨青透露,度小满轩辕大模型2.0版本将在10月份发布。2.0版本在对话和金融理解等场景下的能力大幅提升。在增量预训练和指令微调阶段,该版本加入了海量金融数据,对金融问题回答更加专业、准确;在对话能力上,“轩辕2.0”的上下文长度扩充至8k,能够处理更长的金融报告、研究和分析。
今年5月份,度小满开源了国内首个千亿级中文金融大模型“轩辕”。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
