阿里声音弹幕专利获授权 可播放目标声音弹幕

宋妤
2022-09-13 11:59

9月13日消息,天眼查信息显示,近日,阿里巴巴集团控股有限公司一项“声音弹幕的应用方法、装置、设备及可读存储介质”专利获授权,授权公告号CN111726696B,申请日期为2019年4月11日。

format-jpg

专利摘要显示,本发明公开了一种声音弹幕的应用方法、装置、设备及可读存储介质。该方法包括:根据在当前视频的播放过程中接收的用户声音数据,生成对应的目标声音弹幕;在当前视频的视频播放窗口中,展示与目标声音弹幕对应的声音弹幕波形;根据接收的声音弹幕播放指示,播放目标声音弹幕。  

专利信息显示,此前,该公司一项公开一项“弹幕展示方法、设备、系统及存储介质”专利,申请公布号CN112995740A,申请日期为2019年12月13日。

format-jpg

专利摘要显示,本申请实施例提供一种弹幕展示方法、设备、系统及存储介质。在本申请实施例中,在目标视频播放过程中,对于目标视频中包含目标对象的指定部位的视频图像,可在视频图像的指定部位的相邻区域展示针对目标对象的弹幕数据。这样,一方面,弹幕在展示时避开视频画面中的指定部位,可提高用户观看体验;另一方面,对于包含同一目标对象的指定部位的相邻多帧视频图像,在播放过程中,弹幕数据可跟随该目标对象的移动而移动,实现弹幕数据跟随目标对象展示的效果。这样,用户可同时观看视频和弹幕,无需在弹幕和视频之间来回切换,有助于进一步提高用户体验。

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
9月13日消息,天眼查App显示,9月9日,阿里巴巴集团控股有限公司“声音弹幕的应用方法、装置、设备及可读存储介质”专利获授权。
通过训练AI模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,AI将为该声音找到“主人”。在“1对N”的匹配实验中,AI还能对声音归属人脸的“可能性”进行排序。据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。
阿里巴巴集团副总裁、双11集团技术总指挥汤兴透露,2020年双11期间,淘宝直播单个直播间同时在线人数超过200万人,“这意味着,我们能够在1秒之内,把主播的声音和画面,以及商品信息,同步给分布在全国各地的200万消费者。”
11月26日消息,阿里巴巴近日宣布连任Java全球管理组织JCP最高执行委员会委员,任期从今年12月4号开始,为期两年。阿里表示,这意味将有更多中国开发者的声音被引入Java规范的制定中。公布的名单显示,一同当选的还有高盛集团、JetBrains等企业组织。JCP全称Java Community Process,是Java技术的最高决策机构。
9月11日消息,日前,阿里巴巴于其官方微信公众号发布全员公开信称,2015年,阿里巴巴集团管理团队决定,9月10日不仅仅是阿里的生日,也将成为阿里“客户日”。阿里巴巴表示,无论是过去的22年,还是未来的80年,“客户第一”的初心不改。同时,阿里巴巴向所有员工发出号召,拿出一小时,倾听客户真实的声音
7月21日消息,阿里王帅今日发布微博表示,在阿里巴巴内网,任何问题都可以讨论。这是阿里文化的底色,也是员工和管理者非常高效的沟通平台。阿里巴巴不需要一派和气,而在于倾听和表述真实的自己,鲜明的态度,这就是阿里内网的独特存在。我们永远不会删除刺耳的声音声音越刺耳,观点越尖锐,讨论就越深刻,反思则越透彻。
9月7日消息,日前,第六届阿里巴巴95公益周正在火热进行中,夸克联合阿里巴巴公益,公布了9组老年用户最关心的网络流行语。据悉,“益起读”项目自2020年9月上线以来,累计超过1500万人次参与公益声音朗读,为全国8个省市的乡村儿童兑换超60余万册图书,捐赠以夸克用户命名的实体图书角和夸克图书馆260余个。
4月19日消息,阿里巴巴达摩院今日发布超大规模语言模型PLUG,该模型参数规模达270亿,是目前全球规模最大的中文纯文本预训练语言模型。通过训练AI模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,AI将为该声音找到“主人”。据介绍,在语音识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端语音识别框架,提升计算效率的同时,还将高难度场景中的语音识别错误率降低近三成。
2月13日消息,阿里巴巴旗下本地生活服务平台口碑今年推出了一种全新的春节红包玩法。据悉,口碑App今年将投入一亿元红包,上线“喊红包”玩法,这些红包都是一条条特定的祝福语或者口令,用户对着App喊出口令,后台识别正确之后就会有红包出现,声音越大红包越大,活动时间为2月13日-16日。