蚂蚁集团、腾讯、百度等联合编制大模型安全国际标准正式发布
4月17日消息,第 27 届联合国科技大会(the 27th UN CSTD Annual Meeting)正在瑞士日内瓦召开。大会期间,世界数字技术院(WDTA)发布了两项国际标准:《生成式人工智能应用安全测试标准》、《大语言模型安全测试方法》。
这两项国际标准是由 OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等数十家单位的多名专家学者共同编制而成。蚂蚁集团牵头编制《大语言模型安全测试方法》,并参与制定了《生成式人工智能应用安全测试标准》。
图源:蚂蚁集团公众号
这次发布的两项标准是大模型及生成式 AI 应用程序方面的安全性测试标准,有助于行业构建安全、可靠的人工智能生态系统。
《生成式人工智能应用安全测试标准》由 WDTA 作为牵头单位,蚂蚁集团等多家单位共同参与。这项标准为测试和验证生成式 AI 应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。它定义了人工智能应用程序架构每一层的测试和验证范围,包括基础模型选择、嵌入和矢量数据库、RAG 或检索增强生成、AI 应用运行时安全等等。
《大语言模型安全测试方法》由蚂蚁集团作为牵头单位。这项标准则为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。它提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并率先给出了四种不同攻击强度的攻击手法分类标准,系统地提供了大语言模型抗攻击测试的评估指标、能力分级、测试数据集构建要求和测试流程等。
WDTA 官网发布《大语言模型安全测试方法》标准 图源:蚂蚁集团公众号
蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强表示,生成式 AI 将释放巨大的生产力,但也要对它带来的新风险高度警惕。大型科技公司应在促进生成式 AI 安全和负责任的发展中有所担当,利用其资源、专业知识和影响力推动最佳实践,构建一个优先考虑安全、隐私、可靠和伦理优先的生态系统。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn