1. 京东关联公司北京京东世纪贸易有限公司10月12日公开一项“一种文本数据确定方法和装置”专利。
  2. 3月17日消息,谈到近日大热的GPT-4,京东云相关负责人告诉澎湃新闻编辑,相较于GPT-3.5及ChatGPT主要处理文本数据,GPT-4是一个大型的多模态模型,提高了大模型的多模态处理能力。从算法层面,GPT-4使用对抗性测试和基于ChatGPT的经验教训对GPT-4进行迭代优化。京东方面表示,京东云长期布局多模态领域。在文本生成领域,一直以来是通过图片信息+文本信息生成的营销文案。
  3. 2月19日消息,据报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。
  4. 2月28日消息,Shopify升级ShopifyQL Notebooks功能,全新升级的ShopifyQL Notebooks将提供Liquid参考、文本块/代码块重新排序、保存历史状态等功能。商家可以通过点击“一键运行”按钮,快速实现数据故事化。具体来说,Liquid参考功能,通过ShopifyQL Notebooks中的Liquid参考功能,商家可以使用Shopify的语言模板Liquid来创建多元数据故事。目前,通过文本块的便捷功能,商家可以快速参考ShopifyQL代码块的数据元素,还可以对其增加标签与筛选器,创建多种条件逻辑。
  5. 6月11日消息,在“2021全球人工智能技术大会”上,蚂蚁集团首席AI科学家漆远在会上首次提出了“可信AI”的技术架构体系,其包含了“数据隐私保护”“鲁棒性”“可解释性与因果分析”和“公平性”四个方面的技术架构体系。据悉,今年2月,阿里安全图灵实验室涉及文本变异对抗、图像、视频内容风控以及AI小样本研究的4个团队,分别与中国科学技术大学、浙江大学、华中科技大学等知名高校研究人员合作。
  6. 6月21日消息,国际权威研究机构IDC于近日发布《中国人工智能软件及应用市场研究报告-2020》。IDC数据显示,阿里AI在语音语义领域增长态势最为迅猛,市场规模年增长率达96.6%,超过百度59.8%的增幅及科大讯飞24.3%的增幅,在中国主要语音语义厂商中排名第一,同时,阿里AI总营收跻身中国前二。据悉,阿里语音语义技术已深入各行业,包括金融、法律、电商、交通等,广泛应用于会议、客服、IoT、搜索、文本分析等场景。
  7. 4月4日消息,有网友近日展示了利用阿里大模型技术生成脱口秀演员“鸟鸟”AI嘴替的技术,高度模仿了鸟鸟的语调、声音以及文本风格,并介绍了该技术用于智能终端领域的可行性。对此,新浪科技向阿里方面求证获悉,“天猫精灵和达摩院一直在紧密合作,其中包括推进大语言模型、声学模型、语音AI等综合应用”。据悉,天猫精灵的技术内核是AliGenie智能交互系统。2022年7月数据显示,其自研设备的月交互次数超过80亿。
  8. 12月27日消息,Shopify近日升级,在退货工作流程中添加了退货/退款原因结构化分析,以改善店内退货的数据采集流程,助商家深入了解产品、客户偏好和退货效率低下等问题。现在,商家可以点击选择原因以查看可针对退货进行选择的选项列表。如果商家在退货原因屏幕之后点击下一步,则系统会提示商家接受“未知”退货原因。有未发货商品的订单不会显示退货原因,系统将改为提供一个可自由填写的文本字段来用于输入退款备注。
  9. 3月17日消息,天眼查资料显示,携程关联公司携程计算机技术 有限公司3月16日公开一项“语音通话的质检方法、系统、设备及存储介质”专利,公开号为CN112509582A,申请日期为2020年11月24日。本发明通过在语音识别架构中引入了异步带同步的QMQ机制确保了语音通话数据获得过程的稳定性,并通过对语音通话数据进行自动语音识别处理得到对应的转写文本,基于转写文本完成质检处理,从而解决了语音通话质检效率较低、实时性不够和成本较高的问题。
  10. 6月1日消息,度小满今日与哈尔滨工业大学宣布共同成立“哈尔滨工业大学-度小满人工智能 联合研究中心”。双方还将共同培养生成式人工智能技术领域的领军人才,推动前沿技术的产业化应用加速。据了解,双方联合研究的课题包括大模型的思维链能力来源的探索、大模型长上下文建模、大模型快速适配声音、图像、文本等多模态数据、不同场景下大模型输出决策的可解释性等。
  11. 3月15日消息,天眼查知识产权信息显示,3月15日,淘宝软件有限公司申请的“基于数字人的视频生成与交互方法、设备、存储介质与程序产品”专利公布。摘要显示,本申请实施例基于用户的声音特征和情感标签进行文本转语音处理,以及基于用户的声音特征和表情系数之间的映射关系进行语音转表情处理,并基于语音信号和表情系数渲染数字人模型,以得到数字人模型的视频数据
  12. 天眼查信息显示,7月23日,北京小米移动软件有限公司公开一项“商品描述文本生成方法、装置及存储介质”发明专利,公开号为CN113157910A,申请日期为2021年4月28日。
  13. 滴滴关联公司北京嘀嘀无限科技发展有限公司8月3日公开一项“文本聚类方法、装置、存储介质和电子设备”专利。
  14. 阿里巴巴达摩院公开一项“逆文本标准化方法和装置”专利。
  15. 阿里巴巴达摩院公开一项“文本识别方法、图像矫正方法、电子设备和存储介质”专利。
  16. 阿里巴巴达摩院3月22日公开一项“文本合并方法、装置、设备及存储介质”专利。
  17. 阿里巴巴达摩院公开一项“评论文本的情感信息提取方法、装置、计算机设备和介质”专利。
  18. 阿里巴巴达摩院3月25日公开一项“视频文本识别方法、装置、电子设备及可读存储介质”专利。
  19. 阿里巴巴达摩院4月8日公开一项“文本数据处理方法、设备和存储介质”专利。
  20. 近期敦煌网会对商品文本信息违规行为进行严格治理。