首页
快讯
观察
Toggle theme
阿里达摩院公开“
图像
中
的
文本
识别
方法、装置”专利
2022-03-18 11:50:35
阿里巴巴达摩院3月18日公开一项“
图像
中
的
文本
识别
方法、装置、设备及存储介质”专利。
阿里联手中科大等高校 研发4项AI安全技术
2021-02-23 15:04:33
2月23日消息,据TechWeb消息,阿里安全图灵实验室涉及
文本
变异对抗、
图像
、视频内容风控以及AI小样本研究
的
4个团队,分别与中国科学技术大学、浙江大学、华中科技大学等知名高校研究人员合作。具体来看,以
文本
内容为例,恶意用户可通过对
文本
中
的
违规内容进行变形变异,从而达到绕开模型
识别
检测
的
目的。为应对挑战,解决对抗场景中风控模型性能衰减
的
问题,阿里安全图灵实验室与浙江大学提出了基于对抗关系图
的
文本
对抗防御技术。
阿里达摩院发布超大规模语言模型PLUG
2021-04-19 12:00:16
4月19日消息,阿里巴巴达摩院今日发布超大规模语言模型PLUG,该模型参数规模达270亿,是目前全球规模最大
的
中文纯
文本
预训练语言模型。通过训练AI模型,研究表情和声音
的
关系。给定一段声音和仅有一张正确人脸
的
若干
张
图片
,AI将为该声音找到“主人”。据介绍,在语音
识别
方面,达摩院提出SAN-M网络结构及基于SCAMA
的
流式端到端语音
识别
框架,提升计算效率
的
同时,还将高难度场景
中
的
语音
识别
错误率降低近三成。
亚马逊据悉开发视频人工智能模型
2024-11-28 14:05:04
11月28日消息,知情人士透露,亚马逊开发了新
的
生成式人工智能,除
文本
外还能处理
图像
和视频,从而减少了对人工智能初创公司Anthropic
的
依赖。消息称,新
的
大型语言模型代号为“奥林巴斯”(Olympus),将能够理解
图像
和视频
中
的
场景,并通过简单
的
文字提示帮助客户搜索特定场景。知情人士还说,亚马逊最早将在下周举行
的
技术大会上宣布有关这一模型
的
消息。
谷歌将在购物、视频推送
中
添加视觉搜索功能
2021-09-30 15:37:10
9月30日消息,谷歌近日表示,谷歌用户很快可以结合
图像
和
文本
在视频推送、购物过程
中
进行搜索查询,新功能将在几个月内通过Google Lens发布。谷歌高级副总裁Prabhakar Raghavan称,该功能对于寻找单凭语言难以准确描述
的
物品很有帮助。具体而言,用户在谷歌iOS应用程序或Chrome桌面浏览器上网时,可以运用反向
图像
搜索,选择一张
图片
将会出现类似
的
在线视觉效果,这可以帮助用户找到
图片
中
商品
的
购买地点,并最终将其引导到Google Shopping。
谷歌将在购物、视频推送
中
添加视觉搜索功能
2021-09-30 14:15:39
谷歌在其直播
的
Search On会议上表示,谷歌用户很快就可以在视频推送和购物过程
中
,在搜索查询
中
结合
图像
和
文本
。
亚马逊新政策:Kindle出版商须公开作品
中
AI使用情况
2023-09-12 09:14:38
9月12日消息,亚马逊近日宣布了一项新政策,要求其Kindle Direct出版商必须披露他们在作品
中
使用人工智能生成
的
内容,包括
文本
、
图像
或翻译。这一政策
的
推出经过了数月与作家协会
的
讨论,旨在确保透明度和保护消费者。作家协会与亚马逊
的
讨论始于对AI生成图书泛滥
的
担忧,这可能会排挤人类作者,并可能使消费者无意
中
购买未经披露
的
AI生成
文本
。作家协会明确了AI生成和AI辅助
的
区别,并认为AI可以成为作家
的
有用工具。
亚马逊云科技正式上线Meta Llama 3.2模型
2024-10-10 11:49:00
10月10日消息,亚马逊云科技宣布,Meta
的
新一代模型Llama 3.2,包括其首款多模态模型,现已在Amazon Bedrock和Amazon SageMaker
中
正式可用。该系列模型进行了全新升级,提供高度差异化
的
功能更新,包括支持
图像
推理
的
小型和中型视觉大语言模型,以及针对设备端优化过
的
轻量级纯
文本
模型。
Etsy推出新功能Alt Text
2021-10-25 15:44:04
10月25日消息,据媒体报道,近日Etsy推出新功能Alt Text ,允许卖家为盲人和低视力购物者提供
图像
描述,卖家可以在每张
图片
中
都添加对应
的
描述信息。卖家只需在Etsy网站上选择Shop Manager转到listing,然后选择要编辑
的
列表,将鼠标悬停在需编辑
的
图像
上,点击带“铅笔”
的
图标,即可为
图像
添加替代
文本
。Etsy建议卖家描述产品
图像
时要简短,最多不超过250个字符。
通义千问全模态模型Qwen2.5-Omni开源
2025-03-27 09:22:23
3月27日消息,通义千问发布并开源首个端到端全模态大模型通义千问Qwen2.5-Omni-7B,可同时处理
文本
、
图像
、音频和视频等多种输入,并实时生成
文本
与自然语音合成输出。在权威
的
多模态融合任务OmniBench等测评
中
,Qwen2.5-Omni刷新业界纪录,全维度远超Google
的
Gemini-1.5-Pro等同类模型。
度小满与哈工大共建“人工智能(大模型)联合研究中心”
2023-06-01 17:41:50
6月1日消息,度小满今日与哈尔滨工业大学宣布共同成立“哈尔滨工业大学-度小满人工智能 联合研究中心”。双方还将共同培养生成式人工智能技术领域
的
领军人才,推动前沿技术
的
产业化应用加速。据了解,双方联合研究
的
课题包括大模型
的
思维链能力来源
的
探索、大模型
长
上下文建模、大模型快速适配声音、
图像
、
文本
等多模态数据、不同场景下大模型输出决策
的
可解释性等。
Shopify富文本编辑器上线“有序列表和标题”功能
2023-04-13 10:49:52
4月13日消息,为帮助商家丰富商店界面元素,美化独立站界面,Shopify在商店编辑器
中
提供了富文本编辑功能,支持商家对在线商店
中
显示
的
内容进行格式和样式设置。同时,富
文本
元字段
中
的
设置将与在线商店编辑器
中
的
富
文本
设置保持同步,确保元字段和在线商店编辑器在文字风格上
的
一致性,从而强化店铺
的
品牌形象。据了解,商家可以使用分区向在线商店
的
任何页面添加功能。可以选择、添加和配置包含
图片
、
文本
、品牌颜色等内容
的
分区。
小红书上线“此刻”功能 支持用户发布纯文字笔记
2023-07-25 11:47:39
7月25日消息,小红书近日宣布上线“此刻”功能。通过该功能,用户可以直接输入文字,算法会基于输入
的
文本
内容为用户生成一张
图片
并完成发布。另外,用户也可以在画板上涂鸦,并使用ai进行对涂鸦进行美化后再发布。据悉,这一功能
的
落地得益于AIGC技术 。目前,这一功能已经在最新版本
中
全量上线。
百度文心一言截止3月16日21点申请API调用企业已突破6.5万
2023-03-17 08:56:21
3月17日消息,百度日前召开新闻发布会。百度创始人、董事长兼首席执行官李彦宏介绍了其对标+ChatGPT
的
大语言模型、生成式AI产品“文心一言”,并展示了文心一言在五个场景
中
的
综合能力。多模态生成方面,李彦宏现场展示了文心一言生成
文本
、
图片
、音频和视频
的
能力。截止3月16日21点,申请文心一言API调用服务测试
的
企业已突破6.5万。
IDC报告:百度新搜索文小言综合测评排名第一
2024-09-04 15:18:39
9月4日消息,IDC 9月发布
的
《移动端大模型应用市场竞争力分析》显示,百度旗下“新搜索”智能助手文小言,在同类产品综合测评
中
排名第一。据了解,文小言已推出富媒体搜索、多模态输入、
文本
与
图片
创作、高拟真数字人等"新搜索"能力,及记忆和自由订阅等独家功能,可全面满足用户搜、创、聊需求。
字节旗下豆包升级文生图能力
2024-12-05 14:42:00
12月5日消息,字节跳动旗下智能AI助手豆包升级文生图能力,支持一键生成指定
文本
。用户可以在生图提示词
中
加入
文本
要求,如“一张带有‘新年快乐’
的
图”,即可生成带有指定文字
的
图片
。目前该功能已经在豆包APP开启测试,即梦也已小范围测试。
钉钉AI助理升级:上线
图片
理解、文档速读等功能
2024-03-29 01:30:23
基于阿里通义千问大模型,升级后
的
钉钉AI助理拥有更强
的
视觉推理能力和
长
文本
速读能力。
钉钉AI助理升级 加入多模态、工作流等能力
2024-03-28 14:17:58
3月28日消息,钉钉AI助理升级,上线
图片
理解、文档速读、工作流等产品能力,率先探索多模态、
长
文本
与RPA技术在AI应用
的
落地。基于阿里通义千问大模型,升级后
的
钉钉 AI 助理拥有更强
的
视觉推理能力和
长
文本
速读能力,甚至可以通过多轮交互进一步做智能问答。
快手可灵AI用户超600万 累计生成超6500万个视频
2024-12-12 15:31:38
12月12日消息,快手副总裁、大模型团队负责人
张
迪在“2024AIGC视觉应用论坛”上透露,可灵AI上线半年以来经历过16次迭代,目前已有超过600万用户,累计生成超6500万个视频和超1.75亿张
图片
。他表示,可灵AI将于近期推出全新
的
1.6版本模型,在
文本
遵循、动态表现、风格一致性等方面将有大幅提升。
支付宝公开“一种二维码
识别
方法、装置”专利
2021-07-05 21:08:55
7月5日消息,天眼查信息显示,支付宝 信息技术有限公司于2日公开多项发明专利,其中一项名为“一种二维码
识别
方法、装置及设备”,申请公布号CN113065374A,申请日期2021年4月。根据专利摘要显示,利用终端设备
的
检测模型,检测出待
识别
图像
中
的
有码区域,并主动调整测光点到该区域,最终相机采集到
的
图片
有码
的
部分可以得到合适
的
曝光参数从而得到清晰完整
的
二维码
图像
。
‹‹
‹
1
2
›
››