阿里达摩院公开“文本合并方法、装置”专利
云合
2022-03-22 11:34
3月22日消息,天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司3月22日公开一项“文本合并方法、装置、设备及存储介质”专利,申请公布号为CN114219876A,申请日期为2022年2月18日。
该专利摘要显示,本公开涉及一种文本合并方法、装置、设备及存储介质。本公开通过获取目标图片,并从所述目标图片中获取至少一个文本行中每个文本行的位置信息和包含所述文本行的子图片。进一步,根据所述每个文本行的位置信息和包含所述文本行的子图片,确定无向图,所述无向图包括的至少一个节点和所述至少一个文本行一一对应,该无向图可以作为预测模型的输入,通过预测模型可以预测得到有向图。
由于该有向图中有向边两端的节点之间的关联性较强,并且这两个节点之间还存在着先后顺序,该先后顺序与该有向边的方向相关,因此,将这两个节点分别对应的文本行按照该先后顺序拼接后可以构成一个语义完整的句子。从而可以避免后续的文本理解或处理出错。
近日,阿里巴巴达摩院(杭州)科技有限公司还公开“图像中的文本识别方法、装置、设备及存储介质”、“测试器件以及采用测试器件进行测试的测试方法”、“文本识别方法、图像矫正方法、电子设备和存储介质”等多项专利。
天眼查资料显示,阿里巴巴达摩院(杭州)科技有限公司成立于2017年11月7日,法定代表人为周明,注册资本1000万人民币,经营范围包括:技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;专业设计服务;翻译服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。
股权穿透图显示,阿里巴巴达摩院(杭州)科技有限公司由阿里巴巴(中国)有限公司全资持股,认缴金额1000万人民币。
声明
1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
云合
1