京东云推出vGPU池化方案

柏纳
2023-08-15 20:39

8月15日消息,京东云全新发布vGPU池化方案,提供一站式GPU算力池化解决方案,GPU利用率最高提升70%,大幅降低大模型推理成本。

京东云自主研发的混合多云操作系统云舰,在原有支持混合多云CPU算力池化能力基础上,针对大模型训练所需的泛算力池化能力,进一步增加了针对AI应用所需的调度管理能力,包括卡管理、节点管理、异构资源调度管理等,为包括大模型训练在内的多种AI应用,提供一站式算力池化解决方案,从而全面提升资源利用率。

具体而言,包括四大核心优势:支持任意比例切分和动态调整机制,可实现按显卡算力、显存做细粒度切分,一张物理卡可供多个容器使用,与整卡算力相比,性能衰减在2%以内;支持灵活的配额管理,按显卡型号/label 配额,有效保障资源按需分配,提升推理稳定性和训练性能;适配主流CUDA版本和不同GPU芯片适配,支持TensorFlows、Pytorch等行业主流的AI训练框架;支持节点虚拟分组和节点组指定应用使用,全面提升大模型训练效率。

format-jpg

截自京东云公众号

针对使用大模型算力的成本和效率问题,京东云vGPU池化解决方案,支持本地+远端的GPU资源调用,基于多活能力提升训练任务可靠性,并与现有云平台打通,实现CPU、GPU云算网协同,并在京东自身大模型场景进行打磨,大幅降低大模型推理成本。

在使用场景中,开发者可以根据卡型号申请资源,按算力和显存切分,统一由控制器根据用户指定的调度策略调整。仅在训练、微调和推理任务启动时进行动态分配,在任务结束即可以释放,支持多任务算力隔离和任务冷启动。

从实践效果看,通过GPU异构资源池化,AI运行效率显著提高,整体GPU利用率提升70%。结合任意切分和按需分配,在同等GPU数量的前提下,实现了数倍业务量扩展和资源共享,降低了硬件采购成本,使用更少的AI芯片支撑了更多的训练和推理任务。

format-jpg

图源:京东云公众号

据悉,在7月13日举行的2023京东全球科技探索者大会暨京东云峰会上,京东全面推出言犀大模型、言犀AI开发计算平台、升级支撑大模型落地行业的产品及解决方案。据介绍,京东大模型“源于产业、服务产业”,融合70%通用数据与30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。

京东制定了大模型“三步走”的明确规划。目前,京东云已经基于内部实践构建了通用大模型;到今年年底这段时间,京东将经由高复杂场景大规模锤炼,迭代出扎实的产业服务;预计在2024年初,会将大模型能力向外部严肃商业场景开放。

format-jpg

图源:京东云公众号

1、该内容为作者独立观点,不代表电商派观点或立场,文章为作者本人上传,版权归原作者所有,未经允许不得转载。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
相关阅读
8月15日消息,京东宣布,全新发布vGPU方案,提供一站式GPU算力解决方案,GPU利用率最高提升70%,大幅降低大模型推理成本。
2月13日消息,为了更好地为金融、企业、政府等客户提供数据不出域的私有化模型推理服务,在京东(中原)算力中心已经上线的业界领先的vGPU AI算力平台的基础上,实现本地化部署DeepSeek,使用户不会受主站流量限制和美国封锁,实现客户数据私有化不出域,满足企业级场景使用。
京东通信京东服务+5G消息赋能一站式生活服务解决方案》项目获5G应用征集大赛5G消息专题赛一等奖。
今年元宵节,京东联合工商银行等企业为参与元宵晚会上之旅的用户陆续送出微信红包,京东也为央视元宵晚会上之旅提供技术支持。
报告显示,京东平台解决方案业务快速发展,2022年上半年市场份额达11.1%,同比增速达45%。
在2022京东城市峰会南昌站上,京东江西区域服务中心正式落成。
今日,在京东产业融合新品发布会-金融科技专场上,京东首次发布京东供应链金融科技平台。
据了解,京东联合浙江清华大学长三角研究院打造的台州玉环市泵阀产业大脑入选浙江首批行业产业大脑建设试点,位列全省产业前三,并获评2021年数字经济系统优秀细分行业产业大脑。京东产业大脑在整体结构设计中有针对性的设计了三大组成部分。
今日凌晨,京东发布618当日首份战报。数据显示,在今日凌晨爆发期,每秒用户访问峰值较去年同期提升152%。