阿里研发AI技术0.15秒识别拦截外语脏话图

田宁
2021-09-27 15:03

9月27日消息,阿里安全算法团队宣布,其研发用于网络脏话的AI(OCR)技术,已能识别近30种语言,包括嵌入图片中的英文、阿拉伯、俄语、法语、西语、日语、韩语、泰语、越南语、波斯语、孟加拉、尼泊尔、僧伽罗、朝鲜、苏丹、德语、荷兰语,以及马来语、塔加洛语、土耳其语、意大利语、印尼语等国语言,甚至还包括三种中国少数民族语言。

format-jpg

据了解,在部分国际平台中,“买家”在商品评论中以英语评论图骂人,或者在交互场景中,买卖双方以俄语脏话图片对阵。国际平台风控团队和算法团队复盘了很多案例,发现除了多语种脏话,多语种垃圾广告以及不良信息也会暗藏在图片中,试图对抗风控。

阿里安全高级算法工程师沄帆介绍,要识别多语种文字,就要了解各个语言文字特点,以及影响算法识别的问题。每种文字体系都有自己的字体,不同字体会导致同一字符出现字形上的差异,相同的单词在不同的语种里也可能有不同的含义。

format-jpg

除此之外,还有脏话图以置换正常字符顺序,对抗风控的情况出现,即使调换字符顺序,人还是可以轻而易举地判断单词的含义,但这种“攻击”试图以打乱字母顺序的方式骗过机器识别。

通过一年多努力研究,阿里安全算法团队对这些点进行了逐个突破,通过改进多语言样本生成方案与多语种识别模型框架,在多种图片语言的识别上做到了高识别率,以及做到识别1张脏话图只需0.15秒的速度。

目前该技术也已应用在阿里多项国际业务中,总体识别准确率可达95%以上,并对各种艺术字体、复杂背景以及手写图进行了针对性识别优化。

format-jpg

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
近日,国际权威研究机构Gartner公布《AI开发者服务关键能力报告》,报告显示,在语言AI领域,阿里巴巴排名第二。
8月11日消息,阿里巴巴集团日前公布新一季度业绩,阿里收入增长4%至251.23亿元,阿里巴巴集团董事会主席兼CEO、阿里智能集团董事长兼CEO张勇表示,新一代人工智能发展带来的模型训练和推理场景,对AI服务的需求非常旺盛,但是由于短期内GPU在中国市场供应的紧缺,使得这样的需求只得到了部分满足,AI相关服务所带来的增量机会刚刚开始得到释放。
12月26日消息,阿里官宣成为2025年央视春晚计算AI独家合作伙伴,将支持全球华人上看春晚,这是央视春晚史上首次引入技术合作伙伴。12月2日,中央广播电视总台在北京举办了2025年春晚版权文创与广告合作签约发布会。在此次活动现场,阿里巴巴宣布成为2025年央视春晚独家电商互动平台。
9月20日消息,中金发布研究报告称,维持阿里巴巴-SW“跑赢行业”评级,目标价109港元。管理层在阿里栖大会上表示,看好生成式AI的发展,认为数位世界与物理世界会逐步被AI重塑,其中自动驾驶和机械人产业是重要应用。中金指,阿里致力AI时代实现计算体系全面升级,相信其可通过“一多芯”等技术创新,弥补供给短板,更能彰显领先的厂商价值。
8月15日消息,阿里巴巴发布2024年六月底止季度财报。该季度阿里巴巴收入2432.36亿元,同比增长4%;归属于普通股股东的净利润为242.69亿元,净利润为240.22亿元,同比下降27%。电商、两大核心业务继续取得积极进展:淘天集团线上GMV保持稳定增长,阿里聚焦“公共+AI”,公共业务收入双位数增长、AI相关产品收入三位数增长。
3月6日消息,阿里巴巴旗下的阿里宣布将面向日本企业推广基于生成式AI基础模型的商业提案,并与当地咨询公司和系统开发公司合作。阿里日本服务公司的区域总经理与谢野正宇表示,计划在未来三年内将使用该公司模型的项目增加到1000个以上。
10月20日消息,在2021栖大会上,阿里巴巴集团副总裁、阿里计算平台事业部负责人贾扬清发布统一AI平台“阿里灵杰”,集成阿里整体AI能力对外开放,开发者可“开箱即用”。同时阿里还首次提出AI平台的“4S”标准,为人工智能行业发展提供借鉴。据透露,基于“阿里灵杰”的分布式训练优化技术,达摩院多模态大模型M6已升级至全球首个突破10万亿参数的AI模型,规模超越此前谷歌发布的1.6万亿Switch Transformer模型。
8月29日消息,在德勤中国全国合伙人大会上,阿里巴巴集团董事会主席兼CEO、阿里智能集团董事长兼CEO张勇谈道,AI时代一定会出现新的领军企业,是全新生态形成的过程。新一代AI将在两个层面带来极大改变,一方面对企业来说,AI将极大提升生产力和效率,另一方面对用户来说,有可能出现下一代搜索、社区等新物种的爆发。
阿里巴巴集团公布新一季度业绩,阿里收入增长4%至251.23亿元,经调整EBITA利润增长106%至3.87亿元。AI热潮带来的算力和模型服务需求,正在推动阿里重回增长。
展望未来,张勇表示,阿里巴巴决定未来将所有产品接入AI大模型。
田宁
电商脉搏,媒体前沿洞察。