字节跳动开源大模型训练框架veGiantModel

林月
2022-03-17 17:59

3月17日消息,据IT之家消息,近日,字节跳动应用机器学习团队开源了一款名为veGiantModel的大模型训练框架,主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的性能提升6.9倍,大幅降低训练系统的压力。

目前,字节跳动旗下的企业级技术服务平台火山引擎已在其机器学习平台上原生支持了该框架,该平台正在公测中。

format-jpg

据了解,自然语言处理是人工智能研究的一个重要领域,旨在帮助计算机理解、解释和运用人类语言,可应用于机器翻译、个性化推荐和信息提取等领域。

些年,自然语言处理在应用方面取得了较为显著的突破,主要归功于深度学习以及相关技术的发展,尤其是Bert、GPT、GPT-3等大规模预训练语言模型的普及。

针对现有训练系统在大模型训练场景下的显存压力、计算压力和通信压力挑战,字节跳动应用机器学习团队提出了大模型训练框架veGiantModel。大规模训练模型可以包含更多数据,表示更多信息,算法表现更加出众。

format-jpg

与主流开源训练框架的对比测试显示,veGiantModel的性能表现最好、受网络带宽影响最小,在Tesla V100上较Megatron、DeepSpeed有1.2倍到3.5倍的提升,在Ampere A100上最高可提升6.9倍。

据报道,近年来,字节跳动持续推动技术开源。2021年,字节跳动技术团队陆续开源了微服务中间件CloudWeGo、LightSeq训练加速引擎等30余个重要项目。

字节跳动相关技术负责人表示,推广科技创新成果的应用并推行技术开源一直是公司所倡导的,技术团队将持续通过科技创新为行业发展提供更多动力,助力科技更好地造福社会。

format-jpg

1、该内容为作者独立观点,不代表电商报观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
2月9日消息,《科创板日报》获悉,字节跳动人工智能实验室 有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。对此,PICO方面负责人回应称,此消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。公开资料显示,字节AI Lab成立于2016年,其主要研究重点是开发为字节跳动内容平台服务的创新技术,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。
2月9日消息,《科创板日报》获悉,字节跳动人工智能实验室 有开展类似ChatGPT和AIGC的相关研发,未来或为PICO提供技术支持。据知情人士透露,PICO目前的业务发展不及预期,为此字节AI Lab将在VR内容生成上开展更多探索。据悉,字节AI Lab成立于2016年,研究领域主要涉及自然语言处理、数据挖掘、机器学习、语音与音频等。
10月11日消息,据Tech星球报道,字节跳动的视觉技术负责人王长虎已于近期离职。据悉,王长虎于2017年加入字节跳动人工智能实验室,任科学家、技术总监。其主要研究方向包括计算机视觉、视频理解、多媒体检索和机器学习等。今年1月,王长虎担任字节跳动的视觉技术负责人。视觉技术团队的业务包含:通用与垂直业务的多模态内容理解、内容生态、热点理解与挖掘等。
8月18日消息,字节跳动旗下LLM人工智能机器人“豆包”现已开始小范围邀请测试,用户可通过手机号、抖音或者Apple ID登录。据了解,“豆包”是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能。“豆包”软件及相关服务系由北京春田知韵科技有限公司开发并运营,天眼查资料显示,该公司由字节旗下的北京抖音信息有限公司100%控股。
TikTok母公司字节跳动和微软合作开展一个被称为KubeRay的人工智能项目,该项目旨在帮助企业更有效地管理和运行人工智能应用程序。
12月13日消息,北京大学-字节跳动“豆包模型系统软件联合实验室”签约仪式暨“面向模型的智能化软件技术与生态”学术研讨会日前在北京大学英杰交流中心举行。与会专家们一致认为,推动产学研深度融合对促进人工智能核心技术突破具有重要意义,此次联合实验室的成立是校企协同创新的重要里程碑,将依托双方优势,共同推进模型系统软件的技术创新与应用发展。
10月22日消息,一位知情人士称,字节跳动旗下BytePlus正在考虑明年在泰国建立一个数据中心,以提供云计算和人工智能服务。
12月4日消息,据报道,字节跳动正在开发一个开放平台,允许用户创建自己的聊天机器人。“机器人开发平台”将于本月底推出公开测试版。该公司的通知称,此举符合公司的新战略愿景,即“探索新的生成式人工智能产品以及它们如何与现有产品集成”。
9月19日消息,火山引擎在其举办的“V-Tech数据驱动科技峰会”上宣布,火山引擎数智平台VeDI推出“AI助手”,通过接入人工智能模型,帮助企业提升数据处理和查询分析的效率。目前,VeDI相关数据产品已启动邀测。
3月15日消息,据全天候科技,阿联酋人工智能公司G42被曝入股字节跳动,对后者估值约2200亿美元。有接近字节跳动的人士表示:“字节近期没有新融资行为和计划。”