1. 京东言犀开放了京东真实场景的脱敏数据,携手NLPCC 2022举办模态商品摘要挑战赛
  2. 3月17日消息,谈到近日大热的GPT-4,京东云相关负责人告诉澎湃新闻编辑,相较于GPT-3.5及ChatGPT主要处理文本数据,GPT-4是一个大型的模态模型,提高了大模型的模态处理能力。从算法层面,GPT-4使用对抗性测试和基于ChatGPT的经验教训对GPT-4进行迭代优化。京东方面表示,京东云长期布局模态领域。在文本生成领域,一直以来是通过图片信息+文本信息生成的营销文案。
  3. 12月30日消息,支付宝推出新一代AI视觉搜索产品“探一下”,基于自研的模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物,就能让AI通过摄像头,识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等,还能趣味解读萌宠照、宝宝照等,晒图不愁配文案。目前该产品已上线支付宝,在首页点击“扫一扫”后左划即可找到它,在支小宝App也能快速访问。
  4. 京东集团成为唯一同时获项目奖和个人奖的企业。据悉,京东云言犀团队在知识指导的模态可控对话生成、对话推理与决策技术、智能行为感知与数字外观重建三大核心技术领域取得突破,关键指标均达国际领先水平。言犀已累计服务数十万商家,超5.8亿终端消费者,沉淀了覆盖超过1000万种自营商品的电商知识图谱,保障可用、可控、可信的智能对话体验。
  5. 阿里巴巴达摩院(杭州)科技有限公司日前公开一项“模态对话方法、装置、设备及存储介质”专利。
  6. 3月25日消息,天眼查资料显示,3月24日,阿里巴巴达摩院 科技有限公司申请的“模态对话方法、装置、设备及存储介质”专利公布。该申请使得用户可以通过多种模态信息对同一问题和该问题针对的目标对象进行描述,使得人机对话系统可以从多个模态理解同一问题,并生成一个或多个回复信息,如果是多个回复信息,则多个回复信息的模态不同,从而实现了模态对话,使得用户和人机对话系统之间的对话方式灵活多样,提高了用户体验。
  7. 滴滴关联公司北京嘀嘀无限科技发展有限公司7月2日公开一项“基于模态数据的驾驶预警方法、设备、介质及程序产品”专利。
  8. 蚂蚁集团模态研究成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
  9. 2月28日消息,蚂蚁集团推出20亿参数模态遥感基础模型SkySense。官方数据显示,SkySense在17项测试场景中指标均超过国际同类产品。SkySense可用于地貌、农作物观测和解译等,辅助农业生产和经营。目前该成果已应用于支付宝五福节AI大规模互动、蚂蚁医疗数字人等场景。
  10. 3月3日消息,阿里巴巴与清华大学联合发布中文模态预训练AI模型M6。据介绍,预训练语言模型是让AI具备认知能力的关键技术,此次发布的M6模型参数规模达到1000亿,其理解和生成能力超越传统AI。《电商报》获悉,日前,阿里巴巴还与智源研究院、清华大学等联合研究团队发布面向认知的超大规模新型预训练模型“文汇”。该模型能提升AI的理解能力,还可基于常识实现AI创作,未来将应用于文本理解、人机交互、视觉问答等场景。
  11. 针对360智慧生活的相关话题,360视觉云业务线总经理孙浩发表了自己的观点。
  12. 3月23日消息,华为任余承东介绍,华为带来全新智慧搜图功能,基于模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。智慧搜图功能将于2023年5月陆续上线,支持搭载HarmonyOS 3.1及以上版本的手机或平板电脑。
  13. 4月7日消息,天眼查App显示,4月7日,腾讯科技 有限公司申请的“一种智能互动方法、装置、计算机设备和存储介质”专利获授权。本申请可以在对话过程中,用文本搭配模态内容等来回复用户,丰富了虚拟用户与用户的对话形式,极大地增加了聊天的趣味性和对用户的吸引力。
  14. 8月25日消息,阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。
  15. 12月13日消息,齐心集团近日在互动平台表示:公司目前暂未投入模态技术研发,公司十分注重前沿技术的发展及应用,将密切关注新技术、新趋势的发展。
  16. 2月29日消息,据报道,字节跳动正在AI大模型领域秘密研发多个产品,其中包括模态数字人产品以及AI生图、AI生视频产品等。一位知情人士透露,其在去年下半年见到了字节跳动模态数字人产品的demo,整体感觉还不错。另据了解,字节跳动旗下剪映已在数月前组建封闭团队,秘密研发AI产品。目前,该团队仍处于严格保密阶段,研发的产品还未上线。对此消息,字节跳动方面尚未回应。
  17. 3月28日消息,钉钉AI助理升级,上线图片理解、文档速读、工作流等产品能力,率先探索模态、长文本与RPA技术在AI应用的落地。基于阿里通义千问大模型,升级后的钉钉 AI 助理拥有更强的视觉推理能力和长文本速读能力,甚至可以通过多轮交互进一步做智能问答。
  18. 2月7日消息,字节跳动旗下一站式AI创作平台即梦AI将上线模态视频生成模型OmniHuman,仅需一张图片与一段音频便可生成一条AI视频,该模型为字节自研闭源模型。即梦AI相关负责人透露,该模型未来会进行小范围内测,官方也会对这一功能设置严格的安全审核机制,并对输出的视频标注水印以作提醒。
  19. 8月31日消息,在“什么值得买”上线多款AIGC应用之际,值得买科技CTO王云峰接受媒体采访,他谈到除了已上线的应用,值得买科技还在同步开展模态的工作,具体包括:包括“图生图”和“文生图”的模型,短视频脚本的生成,短视频的自动生成,以及直播数字人等,包括可供内容创作者使用的创作辅助工具也在推进研发之中。
  20. 12月19日消息,上海钢联近期接受投资者调研时称,“小钢”数字智能助手已经具备简单的模态能力,主要处理文字和语言类模态数据,难度相对较低。未来公司计划进入工业场景,模态将更应用于视觉方面,如钢厂制造中的全方位数据流监控。在工业生产过程中,公司将实时转换模态数据流为结构化数据,输入大模型进行分析和判断,提供生产意见,如良品和质检等场景。