您现在的位置是:暗月寺淑兰网 > 焦点
大模型算力荒?浪潮信息也来“掘金卖铲”87岁晚节不保,这次再多的名和利,都救不了“自毁前程”的魏纪中
暗月寺淑兰网2025-02-24 15:50:20【焦点】1人已围观
简介图片来源@视觉中国刚刚过去的一周,浪潮信息发布新品OGAIOpen GenAI Infra)元脑生智,意在为大模型业务提供AI算力系统环境部署、算力调度及开发管理能力的软件栈。浪潮信息作为一家以服务器
图片来源@视觉中国刚刚过去的掘金卖铲一周
,浪潮信息发布新品OGAI(Open GenAI Infra)元脑生智
,大模多的的魏意在为大模型业务提供AI算力系统环境部署
、型算信息算力调度及开发管理能力的力荒浪潮利都软件栈。浪潮信息作为一家以服务器为主营业务的也岁企业,受到来自生成式AI带来的晚节算力牵引潜力 ,下游客户需求旺盛,不保但另一方面,次再在英伟达、名和英特尔等供应商出口限制的救不纪中影响下,人工智能芯片普遍短缺,自毁做软件
,前程也是掘金卖铲增强市场竞争力的多一种选择。浪潮信息高级副总裁刘军告诉钛媒体 ,大模多的的魏当前阶段仍处于大模型开发阶段,型算信息除了缺算力外 ,基础模型能力还没有足够高的提升
,最终呈现出来的效果也不见得会真正能投入使用 。刘军认为,算力供给解决到一定程度,基础大模型的开发能力提升到一定程度
,就具备了商业化能力,进而在各类场景、应用的落地通道也就打开了。而在中国,现阶段能真正达到GPT-4的模型的还没有 ,这就意味着将应用创新能力都寄托在OpenAI上也是明显不可能,也是不现实的
。大模型也需要生产力工具据公开信息,2021年9月,浪潮信息就已经在研发大模型,面向大模型场景解决方案 ,支持AI芯片、服务器
,以构建低时延的分布式系统 。浪潮信息发布参数量为2457亿的中文大语言模型“源1.0”
。在“源”大模型的研发过程中 ,浪潮信息的AI团队逐步建立了完整的从公开数据爬取到数据清洗 、格式转化、数据质量评估的完整流程和工具链,并完成了5TB高质量中文数据集的清洗工作 。“源”大模型的数据集和清洗经验和帮助国内不少AI团队提升了其大模型的性能表现。在这个过程中 ,浪潮信息遇到了很多大模型研发应用中的问题,例如公共算力调度问题、数据清洗问题 、大模型分布式训练性能不佳等等。为此,浪潮信息团队从三个层面进行优化:一是系统全栈性,对于涉及多团队 、多环节
、多流程的业务,需要系统性架构和全栈解决方案;二是兼容适配性,由于模型训练需要大量的开源工具、组件,但存在兼容和性能方面的问题;三是性能优化的挑战,一个大的集群系统涉及的组件数以千计
,怎样优化性能是问题。举个例子,针对于提升大模型分布式训练的计算效率 ,特别是在实际的AI集群环境中
,可能存在GPU之间的互联带宽受限,或者AI服务器之间的网络互联带宽有限的情况,浪潮信息自2022年以来为客户将大模型训练的GPU峰值效率从30%左右提升到50%,提升GPU利用率。而在“源”大模型研发过程中 ,针对千卡规模算力的高效调度问题,浪潮信息通过对云原生的调度系统进行了改造来大幅加速其启动速度
,并重点解决了RDMA网络在容器中的接入和适配优化
,从而采取构建满足大模型需求的算力调度系统;针对训练任务的长期稳定运行问题
,浪潮信息还引入了多种对集群性能的监控手段和性能数据分析方法。客户最关心什么但实现AIGC的能力,除了算力资源的限制外 ,仍存在诸多技术难点,包括在模型的训练
、效果测评 、落地场景应用方面兼具挑战性 ,对普通开发者和中小企业来说更是可望不可及。整体来看,OGAI(Open GenAI Infra)元脑生智软件栈由5层架构组成
,从L0到L4分别对应于基础设施层的智算中心OS产品 、系统环境层的PODsys产品 、调度平台层的AIStation产品
、模型工具层的YLink产品和多模纳管层的MModel产品
。L0层智算中心OS的定位是面向智算中心等公共算力服务平台 ,面向多租户场景 ,提供灵活多样的以裸金属为主的AI算力服务。L1层PODsys聚焦于AI集群部署场景,提供了包括基础设施环境安装、环境部署
、用户管理 、系统监控和资源调度一整套工具链,旨在打造一个易用、高效、开放、兼容的智算集群系统环境部署方案。L2层AIStation聚焦于AI开发场景,通过云原生技术对集群系统中的计算资源、存储资源和网络资源进行统一的接入和纳管,提供了易于使用的开发环境和作业管理界面,并基于内置算力调度系统和训练稳定保障系统来实现易于接入
、按需分配
、弹性扩展和高效稳定的AI研发应用支撑平台。L3层YLink聚焦于大模型的开发过程 ,通过集成整合浪潮信息在大模型研发过程中的工具和开源工具,为用户提供高效、便捷与标准化的大模型开发与优化流程。L4层MModel定位于多模型管理与服务平台 ,帮助客户更好地管理和评估模型 ,加速模型的部署和应用 。浪潮信息人工智能与高性能应用软件部AI架构师Owen ZHU还告诉钛媒体,“现在企业面临的最大挑战是
,需要用大规模硬件的基础设施才能够训练一个类似于ChatGPT同等能力的模型,这个复杂性是固有的。”他解释,OGAI技术栈是从L0到L4层是分层解耦设计和实现的,也就是说并不用把整个OGAI技术栈提供给用户 ,才能够实现大模型开发
,而是对应需要实现的层级功能进行选择。如果用户只需要提供算力多租户的裸金属方案
,可能只需要L0层智算中心OS,不用关心最终用户会怎样进行大模型开发;如果用户需要模型开发相关工具链
,可以按需选择L3层YLink提供的各类工具进行研发生产。关于发布OGAI的初衷,Owen ZHU指出 ,“浪潮信息做这件事情 ,是先行者,这是由视角决定。浪潮信息服务了全球客户 ,包括国内也是最主要的AI应用客户群体,能够第一时间感知到大模型市场在缺什么,遇到了哪些问题
。”从用户的角度来看
,更强的算力基础设施也会倒逼需求侧进一步升级 。“做模型的不懂算力
,做算力的不懂模型”,这种情况长期存在 ,但很多算法的创新与硬件的发展是相辅相成
,两者又需要共同发展 。浪潮信息的这一做法是否切实可行,仍需市场来验证。(本文首发钛媒体APP,作者 | 杨丽)
很赞哦!(368)
相关文章
- 15胜4负登顶联盟第一!森林狼加入西部争冠行列?25+2!19+3!压哨加盟太阳,从替补到第三巨头,你真的被低估了
- 港股公告掘金 | ASML延长DUV光刻机出货利好晶圆厂扩产女子怀孕12月未生产,肚重60公斤惨遭丈夫抛弃,医生:还能挽救
- 原创 记者:阿森纳不想让尼古拉斯·佩佩自由离开,并要求特兰宗体育
- 原创 关于鹈鹕阵容最后一季,鹈鹕伤病叠加中,锡安守住健康很关键
- 乌杰里点名,猛龙太阳最新交易引爆球坛!
- 长春亚泰3比1胜沧州雄狮,谭龙梅开二度,仍有争夺亚冠机会被虞书欣一身红甜到了!甜美妆容配饰耀眼蝴蝶结发带,俏皮又出众
- 里弗斯谈卡塞尔:绿军想签他要赶紧入手 否则就会被他人签走
- 乾坤壹号副总张洋年仅34岁已经跳槽3次 财政职员降生如今受重用
- 体坛联播|高亭宇速滑世界杯夺金,拜仁曼联阿森纳集体输球澎湃新闻2023-12-10 09:23澎湃新闻2023-12-10 09:23
- 比恒大更强的雷霆爆发!
热门文章
站长推荐
狂胜50分,独行侠不留情面!爆砍40+10+11,东契奇追击哈登明着吃软饭?结婚27年被拿捏死,17次上春晚竟然全是老婆的功劳
茶颜悦色招供IPO风闻:当初不上市妄想,不凋谢加盟
申花又上“头条”了!私生活混乱?这一次,再多的名和利都救不了65岁的赵本山!
黄仁勋亮相鸿海科技日:共建 AI 工场,相助新一代英伟达自动驾驶平台
尘埃落定!浙江队被剥夺亚冠资格悬念揭晓,来看看名记传来的消息哥哥是皇帝,大伯是光绪,奶奶是慈禧,他却非常低调地活到2015年
美媒把NBA30队首发中锋,分6档,约基奇领衔,戴维斯被低估
美媒列泛起役能在90年月成为巨星的十人,詹姆斯落选,谁被高估了
宝马M8雷霆版全新现车特价优惠出售
友情链接
- 李嘉欣抖音
- 文章抖音
- 周慧敏抖音
- 辩护人TikTok
- 吴亚馨博客
- 林佑威TikTok
- 沉默的羔羊微博
- 孟广美官网
- 唐嫣主页
- 低俗小说官网
- 葛优TikTok
- 蔡少芬博客
- 阿凡达Instagram
- 许名杰Twitter
- 陈志朋Instagram
- 放牛班的春天Facebook
- 刘畊宏TikTok
- 吴镇宇抖音
- 柯佳嬿Weibo
- 陈志朋Facebook
- 长治90名勇士雨中横渡黄河
- 游戏王决斗链接:人剑合一天下无敌,圣骑士构筑浅析
- IDC:2027年5G以及4G/LTE企业无线广域网市场支出将抵达55亿美元
- 无与伦比,马刺续约波波维奇合同创NBA纪录
- 大反转,乐福突爆骑士队秘闻!詹姆斯很难堪,他看透了国王的虚伪
- 2010年安东尼向掘金提出交易申请,各队报价如何?姚明成火箭筹码自认为很红,实则耍大牌都无人应,这6位明星真是尴尬又可笑
- 塔特姆生涯季后赛30+次数为23场,排
- 2500万!一夜6消息:狄龙要价曝光,黄蜂迎20+7前锋!掘金迎利好