京东言犀携手NLPCC 2022举办多模态商品摘要挑战赛
林月
2022-03-22 10:19
3月22日消息,据京东云消息,近年来AI技术取得了巨大的进步,尤其是在自然语言处理的文本生成领域,具有十分广泛的产业化应用前景,不仅可以基于文本,还可以基于图片等多模态信息生成文案。
京东已在自身业务中大规模应用了文本生成技术,可以在短时间内为用户撰写商品摘要文案,并根据用户喜好推荐给用户“种草”。
京东言犀基于领域预训练K-PLUG的商品文案生成模型已经覆盖了京东的3000+个三级品类,人工审核通过率90%以上,累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等,累计带来超过3亿元GMV。此外,言犀还拥有写诗、写春联、书法创作等多种AI能力。
据了解,商品摘要文案的挑战主要来源于三个方面,首先,信息的来源丰富,包含标题、商品规格、产品海报等信息;其次,需要处理多模态和结构化的信息,包含文字和图像各类信息,以及商品规格参数等结构化信息;再次,AI系统必须要足够智能,能够充分挖掘商品的卖点信息,并在合适的时间,千人千面的推荐给恰当的用户。
基于此,京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办多模态商品摘要挑战赛。该任务旨在为一个指定商品生成一段凝练的文本摘要,给定的输入包括商品详细文本描述、商品知识图谱和商品图片。
该任务的数据集来自于京东脱敏数据,每个样本包含商品文本描述、商品知识图谱、商品图片、商品摘要。数据集分为箱包、家电、服饰三个子集。
赛事组织方将提供基线模型:K-PLUG模型及其扩展的多模态版本,为广大参赛者提供参考(K-PLUG模型是电商领域的预训练语言模型)。测评方法包括自动测评ROUGE、人工测评。人工测评指标含忠实度、可读性、非冗余性、重要性。
声明
1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn

林月
0
推荐阅读