值得买科技CTO王云峰分享AI应用开发路径及产品规划
8月31日消息,在“什么值得买”上线多款AIGC应用之际,值得买科技CTO王云峰接受媒体采访,畅谈了AI技术演进历程之外,也介绍了集团应用开发路径以及具体的产品规划。
“一项新技术的出现,总会伴有大量的不确定性因素,这个不确定性是需要通过预研的方式消弭的。AIGC最终应用的路径尚不清晰,这时候,就需要投入专门的资源,做对应的研究和尝试。”王云峰介绍。
在“专注于垂直模型产品”的既定路线下,目前,值得买科技通过与业内优秀大模型厂商的合作,在“消费内容大模型”训练和具体应用层面,均已取得相应进展。
图注:值得买科技CTO王云峰
(图源值得买科技公众号,下同)
王云峰表示,已发展60多年的AI技术,并不一个新事物。ChatGPT的惊艳之处在于,实现了从“识别”到“生成”的扩展,也即生成式AI——AIGC。但相比大众对AIGC“拥有无限可能”的期待,王云峰指出,AIGC的“应用”目前仍面临诸多限制。“大模型的通用的学习和适应能力都很强,在一些富有创造力、想象力的话题上,往往能够输出看上去很新奇、无所谓对错的答案,但它也有一定的局限。模型本身的特性决定了,原始的语料是什么样的,它学到的知识就是什么样的。如果大模型没有覆盖到某些垂直领域的原始知识,而用户的提问相对聚焦时,它的效果可能就不是很理想。”
王云峰举例说,比如,用户提问“怎么挑选茶叶”,模型只会泛泛地告诉你要注意什么,并不能真正帮助消费者进行决策。而在现实生活中,卖茶叶的导购在与消费者对话时,通常会很细致地回答你的细节问题,也会通过和你的对话来了解你更多的需求。
在垂直领域和真实消费场景下应用AIGC,正是王云峰和他的团队努力的方向。“通用模型和垂类模式各有各的市场,但垂类模型的开发难度并不比通用模型小,因为垂类领域的要求更高。”
2023年初,在AIGC新技术浪潮席卷之时,值得买科技已敏锐洞察了这一创新机遇,并快速明确了自身的创新路径:利用十多年来积累的消费内容和消费数据,开发辅助用户消费决策的垂直模型产品。据王云峰介绍,目前,在模型训练层,值得买科技已在60亿参数的模型基座上完成了全参数的Post-Training,同时正在130亿参数的模型基座上开展全参数的训练。
图注:“AI购买建议”工具
算力,通常被视为大模型训练的最大难点。但在王云峰看来,最稀缺的还是人才。“我们目前储备的训练的算力还是比较理想的。但人才问题,不是用钱就能解决得了的。”为了满足AIGC应用开发对人才的需求,2023年初,值得买科技从现有的各团队中抽调出一部分人员,成立了AI Lab团队,率先开展了内容应用层面的研究。与此同时,值得买科技还和大量外部机构,包括创业公司和高校实验室,开展了广泛的合作。
除了人才和技术,此前十余年积累的海量消费内容和消费数据,则是值得买科技推进AIGC应用开发的核心优势。值得买科技刚刚发布2023年半年报显示,目前,其商品数据库已收录近22万个品牌、1123万聚合商品,而仅仅2023年上半年,“什么值得买”的内容发布量就已高达1200多万。
近日“什么值得买”正式上线“AI评论机器人”、“AI购买建议”等多款AI工具,通过加速优质内容生产,一方面提升用户决策效率,另一方面提升平台运营效率。王云峰表示,后续还将持续探索基于AIGC的新产品与新场景,全面赋能业务发展和管理运营。
其中,“AI评论机器人”能够自动生成对用户购买决策有价值的评论,并与用户进行互动。“AI购买建议”则针对具体商品,为用户提供“优势、劣势、选购建议”等决策支持,并可以基于用户反馈不断提升精度。
图注:“AI评论机器人”工具
在平台运营上,“什么值得买”也已充分利用 AI 来进行社区治理和内容质量控制,净化社区环境氛围,优化社区互动体验,持续为用户提供优质、真实的原创消费内容。此外,AI技术业已深度应用于平台内容发布流程,在大幅缩减运营审核环节的成本投入的同时,也提升了UGC内容发布的时效,优化了创作者的发布体验。
据王云峰介绍,除了上述已上线的应用,值得买科技还在同步开展多模态的工作,具体包括:包括“图生图”和“文生图”的模型,短视频脚本的生成,短视频的自动生成,以及直播数字人等,包括可供内容创作者使用的创作辅助工具也在推进研发之中。
作为AIGC最具商业化空间的应用领域之一,整个消费行业正在经历这场技术革命的冲击。“我们的应对措施就是,拥抱它,赶紧投入力量去做,脚踏实地地去做。”王云峰最后表示。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn