首页
快讯
观察
Toggle theme
阿里
推出会议
AI
助理“听悟” 可秒速生成智能会议纪要
2021-10-22 15:24:31
10月22日消息,在杭州云栖大会上,阿里巴巴达摩院发布软硬件结合
语音
产品“听悟”。据介绍,“听悟”是面向未来会议的
AI
助理,集成了达摩院最新
语音
及自然语言处理技术,不仅“听”得准,且“悟”性高,可秒速生成智能会议纪要及待办。
阿里
云与北京西城区人民政府在智慧城市等方面达成战略合作
2023-07-05 20:42:30
7月5日消息,2023全球数字经济大会近日在京举办,阿里巴巴达摩院
语音
实验室负责人鄢志杰、
阿里
云智能瓴羊区域发展负责人杨霄凡等人出席论坛并发表演讲。在“人工智能高峰论坛”上,阿里巴巴达摩院与北京工业大学计算机学院、北京集智未来人工智能产业创新基地签署合作协议。此外,北京市西城区人民政府与
阿里
云计算有限公司等单位签订战略合作框架协议。未来西城区将与
阿里
云在智慧城市、产业升级等多方面展开更深度的合作。
阿里
云推出数字人视频生成工具Live Portait
2023-08-16 15:14:23
8月16日消息,
阿里
云推出数字人视频生成工具Live Portait,上传一张照片和一段文本或
语音
可生成一段开口说话的数字人视频,可应用于视频直播、聊天机器人、企业营销等场景。目前,该工具已在魔搭社区创空间开放体验。
阿里
达摩院“字幕机顶盒”入驻聋人家庭及社区
2021-02-20 12:58:44
2月20日消息,春节前夕,首批由中国聋人协会指导研发、阿里巴巴达摩院免费提供精准
语音
技术及算力的字幕机顶盒,入驻全国上百个聋人家庭及社区。同时,第三方评测显示,达摩院
语音
AI
对新闻节目识别准确率高达,在同类技术中处于领先水平。阿里巴巴达摩院
语音
实验室负责人鄢志杰表示,达摩院将持续输出最先进的
语音
技术帮助听障群体消除与外部世界的信息鸿沟,为他们实现无障碍沟通、生活、工作提供长期公益支持。
阿里
回应天猫精灵接入GPT大模型:是个性化大模型技术DEMO
2023-04-05 02:30:05
阿里
方面回应,“天猫精灵和达摩院一直在紧密合作,其中包括推进大
语言
模型、声学模型、
语音
AI
等综合应用”。
阿里
CCO推出智能外呼服务 日均外呼量逾百万
2021-07-16 15:02:13
7月16日消息,近日,阿里巴巴客户体验事业群 推出智能外呼服务。区别于智能在线客服,智能外呼服务会预判消费者可能遇到的问题,及时用
语音
电话的方式,提醒、帮助消费者。目前,
阿里
CCO智能外呼服务已应用于华为、欧莱雅、宝洁等3000多天猫商家,涵盖商超、旅行、医药等200+场景,日均外呼量逾百万。
阿里
云推出全新人工智能会议助理“听悟”
2021-10-21 17:44:44
10月21日消息,
阿里
云今日于云栖大会上展示全新人工智能会议助理“听悟”,同时发布云电脑的升级性能,以满足市场对自动化办公系统的需求。据了解,“听悟”由阿里巴巴旗下达摩院
语音
实验室研发,能将会议的
语音
内容实时转化为书面会议纪录,普通话识别准确率高达98%,有效提升了会议内容整理效率。
阿里
云智能发布音视频
AI
通义听悟 6月1日正式公测
2023-06-01 10:35:57
6月1日消息,
阿里
云智能于今日发布通义听悟,6月1日正式公测。
阿里
云智能CTO周靖人表示,通义听悟是依托通义千问大模型和音视频
AI
模型的
AI
助手,可进行实时
语音
识别,实现对话的实时记录、多
语言
翻译、发言总结、提取PPT、内容规整等。
阿里
达摩院新专利可提升声纹特征提取准确性
2023-06-13 10:38:10
6月13日消息,天眼查APP显示,近日,阿里巴巴达摩院 科技有限公司“声纹特征提取方法、说话人识别方法、模型训练方法及装置”专利公开。专利摘要显示,主要技术方案包括:获取包含
语音
的音频段;提取音频段的频谱特征输入声纹提取模型。本申请能够提升声纹特征提取的准确性。
阿里
通义千问大模型入驻钉钉 提供文图视频等多模态服务
2024-01-09 15:51:14
1月9日消息,
阿里
云通义千问大模型入驻钉钉服务号,成为首个通过办公应用开放服务端口的大模型。用户在搜索“通义千问”就可找到对话窗口,通过文字或
语音
交互,让大模型提供文生文、文生图、图像理解等多模态服务。
阿里
推出“通义听悟高校公益计划”
2024-03-19 11:22:12
3月19日消息,
阿里
推出“通义听悟高校公益计划”,所有中国大陆高校师生通过教育邮箱认证后,均可直接免费获赠500小时音视频转写时长,存储空间从20G拓展至200G。
AI
转写可通过
语音
识别技术将音视频快速转为文本,是许多高校学生日常学习科研的刚需功能。作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有上百万用户,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。
阿里
通义开源音频
语言
模型Qwen2-Audio
2024-08-13 11:17:32
8月13日消息,
阿里
通义大模型继续开源,Qwen2系列开源家族新增音频
语言
模型Qwen2-Audio。Qwen2-Audio可以不需文本输入,直接进行
语音
问答,理解并分析用户输入的音频信号,包括人声、自然音、音乐等。该模型在多个权威测评中都显著超越先前的最佳模型。通义团队还同步推出了一套全新的音频理解模型测评基准,相关论文已入选本周正在举办的国际顶会ACL 2024。
阿里
达摩院发布超大规模
语言
模型PLUG
2021-04-19 12:00:16
4月19日消息,阿里巴巴达摩院今日发布超大规模
语言
模型PLUG,该模型参数规模达270亿,是目前全球规模最大的中文纯文本预训练
语言
模型。通过训练
AI
模型,研究表情和声音的关系。给定一段声音和仅有一张正确人脸的若干张图片,
AI
将为该声音找到“主人”。据介绍,在
语音
识别方面,达摩院提出SAN-M网络结构及基于SCAMA的流式端到端
语音
识别框架,提升计算效率的同时,还将高难度场景中的
语音
识别错误率降低近三成。
阿里
云物联网平台上线增值服务中心
2022-03-18 15:47:39
3月18日消息,据了解,
阿里
云物联网平台近日正式上线增值服务中心,以提供多种特色服务,在帮助设备快速上云的同时,具备符合场景需求的功能。此次发布的增值服务包含千里传音、智能声码、音视频通信等
语音
服务。
阿里
云专家表示,新上线
语音
服务都具有低成本,易运维,高效率的优势。
阿里
眼镜设备及数据处理专利获授权
2022-08-30 15:13:39
8月30日消息,天眼查App显示,近日,阿里巴巴集团控股有限公司申请的“眼镜设备以及数据处理方法、装置、电子设备”专利获授权。摘要显示,该眼镜设备包括:镜架主体和显示组件,镜架主体与显示组件通过可拆卸的方式电连接。控制器用于通过通信组件从数据源设备中获取与
语音
信号对应的图像数据,将图像数据传输至显示组件进行显示。
阿里
达摩院上线“文本生成视频大模型”
2023-03-22 16:46:02
3月22日消息,
阿里
达摩院已在
AI
模型社区“魔搭”ModelScope上线了“文本生成视频大模型”。根据介绍,整体模型参数约17亿,目前只支持英文输入。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。据了解,“魔搭”是
阿里
达摩院联手CCF开源发展委员会在2022云栖大会推出的
AI
模型社区,首批开源模型超过300个,包括视觉、
语音
、自然语言处理、多模态等
AI
主要方向。
阿里
回应天猫精灵已接入GPT大模型:是个性化大模型技术DEMO
2023-04-04 15:27:16
4月4日消息,有网友近日展示了利用
阿里
大模型技术生成脱口秀演员“鸟鸟”
AI
嘴替的技术,高度模仿了鸟鸟的语调、声音以及文本风格,并介绍了该技术用于智能终端领域的可行性。对此,新浪科技向
阿里
方面求证获悉,“天猫精灵和达摩院一直在紧密合作,其中包括推进大
语言
模型、声学模型、
语音
AI
等综合应用”。据悉,天猫精灵的技术内核是AliGenie智能交互系统。2022年7月数据显示,其自研设备的月交互次数超过80亿。
阿里
、360、百度、腾讯通过国家大模型标准符合性测试
2023-12-23 11:57:18
12月23日消息,国内首个官方“大模型标准符合性评测”结果公布,据了解,首批仅360、百度、腾讯、
阿里
通过。该测试由工信部中国电子技术标准化研究院发起,评测围绕多领域多维度模型评测框架与指标体系,从大模型的通用性、智能性、安全性等维度开展,涵盖
语言
、
语音
、视觉等多模态领域,旨在建立大模型标准符合性名录,引领人工智能产业健康有序发展。
IDC报告:
阿里
云再次进入领导者象限,市场份额及战略愿景两项第一
2022-11-17 17:54:03
11月17日消息,国际权威研究机构IDC近日发布报告《IDC中国新一代智能客服厂商评估Marketscape》,
阿里
云再次进入领导者象限,并在市场份额和战略愿景两大维度斩获第一,这是云计算企业的对话式
AI
市场份额首次超过传统
语音
公司。报告显示,以
阿里
通义大模型体系为基础的自然语言对话技术在任务型对话、表格型对话、文档型对话、多模态情感感知、多模态对话等方向取得了关键突破。
IDC报告:
阿里
云连续四年排名中国
AI
公有云服务市场份额第一
2023-08-01 17:17:51
8月1日消息,国际数据公司 发布2022年中国
AI
公有云服务市场份额报告,
阿里
云
语言
AI
市场份额连续四年排名第一,领跑中国市场。IDC将
AI
公有云服务市场定义为“部署在公有云服务上的
AI
能力”,其细分市场包括计算机视觉、对话式
AI
、智能
语音
、自然语言处理、机器学习平台等五大类。
‹‹
‹
1
2
3
›
››