尊龙凯时人生就是博·(中国)官网
每一个新动态都是尊龙凯时人生就是博向前迈进的新脚步

尊龙凯时人生就是博官网|彩色直播33188a最新版本|GMI Cloud:为AI

2025-03-03

  GMI Cloud亚太区总裁King Cui认为✿ღ,当前的AI技术尚未达到“技术普惠点”✿ღ,仍处于“1995年的互联网”时代✿ღ。

  04为此✿ღ,GMI Cloud提供高稳定性的GPU云解决方案✿ღ,包括全栈AI应用平台和双验证体系✿ღ。

  “与互联网技术和移动互联网技术相比✿ღ,如今的GPT4 / ChatGPT影响的用户还非常有限✿ღ,AI技术还远远未到‘技术普惠点’✿ღ,我们正处在‘1995年的互联网’时代✿ღ。”

  12月7日✿ღ,GMI Cloud亚太区总裁King Cui出席参加了2024T-EDGE创新大会暨钛媒体财经年会的平行论坛EDGE Founders Demo Day彩色直播33188a最新版本✿ღ,在现场分享了他们在AI出海大潮中的趋势洞察✿ღ,并介绍了GMI Cloud在GPU云平台构建方面的探索✿ღ。

  Cloud 1.0(2010-2015)✿ღ:Cloud Base✿ღ,企业开始将传统的IDC业务迁移到云端✿ღ,这一时期的云服务主要以裸金属形态存在✿ღ,企业开始尝试和适应云的新模式✿ღ。

  Cloud 2.0(2016-2022)✿ღ:Cloud Native✿ღ,用户和企业从简单的云上云转变为深度用云✿ღ,PaaS 产品从裸金属 base 转变为VM及Container Base✿ღ,客户开始更多地使用云厂商提供的PaaS产品✿ღ,专注于自身业务的研发提效✿ღ。

  Cloud 3.0(2023年至今)✿ღ:Cloud 3.0标志着AI Native Cloud时代的到来✿ღ,以 OpenAI发布 GPT 为起点✿ღ,AI浪潮席卷全球✿ღ。这一阶段的云产品形态与前两个阶段有显著不同✿ღ,计算✿ღ、存储和网络产品都发生了重大变化✿ღ,如从CPU计算转向GPU计算✿ღ,存储需求也从传统的文件存储✿ღ、对象存储转变为需要更高速的存储✿ღ,如GPFS✿ღ,网络也同样需要适应GPU集群的高速网络需求✿ღ。

  AI推动了云计算的发展✿ღ。然而✿ღ,在这个AI时代✿ღ,AI企业在全球的发展将是一个确定性趋势✿ღ,未来三年将进入高速发展阶段✿ღ。AI技术的发展速度和对人类生活的影响日益增强✿ღ,尽管AI 技术的发展处于早期阶段✿ღ,但已经展现出巨大的潜力和机会✿ღ。截止至2024年8月尊龙凯时人生就是博官网✿ღ,全球AI WEB产品总数共1717个✿ღ,其中中国AI WEB产品数量280个✿ღ,出海AI WEB 产品数量95个✿ღ。也就是说✿ღ,有34%的AI产品从一开始的定位就是全球化✿ღ。

  中国 AI 企业在海外市场的布局正在加速✿ღ。然而彩色直播33188a最新版本✿ღ,机会与挑战并存✿ღ,在“AI三要素”(数据✿ღ、算法和算力)中✿ღ,算力——因其高昂的硬件成本和稳定运维的高难度✿ღ,都是一个初创AI企业没有能力去自己承担的核心生产资料✿ღ。

  而所有上述问题产生的直接结果就是——AI Infra稳定性不足✿ღ,导致公司承担了更多的经济以及时间成本✿ღ。

  以Meta为例✿ღ, 其披露的报告显示✿ღ,为期54天的预训练阶段中✿ღ,总共出现了466次工作中断✿ღ,其中47次是计划内的自动维护✿ღ,419 次是意外的✿ღ,且大部分都来自硬件问题✿ღ,GPU又是最多的✿ღ,占了其中的 58.7%✿ღ。

  然而✿ღ,维持AI Infra层的稳定性并不是一件简单的事情✿ღ。所以✿ღ,这就意味着我们需要在组网彩色直播33188a最新版本尊龙凯时人生就是博官网✿ღ、硬件✿ღ、软件✿ღ、工程化等方面做大量工作✿ღ,以减少GPU的掉卡率彩色直播33188a最新版本✿ღ,保持任务的连续性✿ღ,最大化GPU的使用效率✿ღ!

  很多AI企业在选择Infra团队的时候✿ღ,优先考虑的往往是单价最低的GPU✿ღ。但其实✿ღ,GPU集群的稳定性才是更为重要的考虑因素✿ღ。稳定性越高✿ღ,模型训练✿ღ、研发整体成本才会下降尊龙凯时人生就是博官网✿ღ。

  作为一个全栈AI应用平台彩色直播33188a最新版本✿ღ,GMI Cloud在GPU硬件架构层和IaaS层拥有完全自研和掌控的硬件和云平台✿ღ。在Iaas层GMI Cloud会基于硬件构建自己的Cloud云平台尊龙凯时官网✿ღ,✿ღ,把计算✿ღ、存储✿ღ、网络这些能力通过API的方式更好地提供给Paas层的客户✿ღ。而在硬件层GMI Cloud会提供高端的GPU服务器✿ღ,包括高速存储和高速网络能力✿ღ。

  GMI Cloud致力于支持AI应用开发者✿ღ,提供高稳定性的GPU集群✿ღ,以提高AI应用的研发效率和产品竞争力✿ღ。

  在Cluster Engine层面✿ღ,GMI Cloud的Cluster Engine是一个端到端的全栈AI应用平台✿ღ,从底层GPU硬件架构层到应用层✿ღ,提供统一的资源管理和调度✿ღ。GMI Cloud 通过Kubernetes和HPC  Slurm开展工作✿ღ。GMI Cloud将Slurm应用到容器化中彩色直播33188a最新版本尊龙凯时人生就是博(中国)官网✿ღ。✿ღ,实现硬件资源(尤其是GPU资源)像任务一样灵活调度和分配✿ღ,并由云集群引擎统一管理✿ღ,满足AI和HPC的资源需求✿ღ。

  除了软件能力✿ღ,“验证体系”也是保证用户体验关键因素之一✿ღ。GMI Cloud具有独特的双验证体系✿ღ。作为NCP(Nvidia Cloud Partner)✿ღ,GMI Cloud的集群设计要首先通过经过Nvidia认证彩色直播33188a最新版本✿ღ,从一开始构建集群的时候✿ღ,构建方案就需要Nvidia review✿ღ。GMI的集群构建完毕之后✿ღ,英伟达会进行再次的check✿ღ,形成一个双重的Nvidia认证体系✿ღ。另一方面✿ღ,GMI Cloud在给客户构建私有集群之前✿ღ,自己也会对于整个硬件和系统做测试✿ღ。包括单机和跨机的这种分布式模型的训练✿ღ,GMI Cloud会做一些压力和功能测试✿ღ。确保这个集群交给客户是完全可以运行的✿ღ。在这套双验证体系的加持之下✿ღ,GMI Cloud可以保证交付给客户的集群是一个完全可用的状态✿ღ。

  云服务不可能说永远不出问题✿ღ,但是GMI Cloud会关注一旦出现问题✿ღ,响应速度是否足够快✿ღ,对问题的定位是否足够快✿ღ,集群的恢复是否足够快✿ღ。

  GMI Cloud与GPU供应商✿ღ、IDC合作伙伴间共筑了三角合作的关系✿ღ,为客户提供更高水平的服务✿ღ、更贴近源头的问题追溯✿ღ。GMI Cloud提供24x7x365的全年全天候的监控和支持服务✿ღ。一旦出现问题✿ღ,GMI会以最快速度恢复我们的集群✿ღ,减少故障时间✿ღ,确保系统稳定性✿ღ。

  GMI Cloud目前为AI Infra选型提供两种方案✿ღ,第一种是PRIVATE CLOUD✿ღ,如果企业需要长期占有一个独立集群✿ღ,GMI Cloud会推荐这种私有的PRIVATE CLOUD✿ღ,GMI Cloud会帮助完成模型从底层到上层的全部优化✿ღ,让企业“拎包入住”✿ღ。如果只是临时使用一两张卡✿ღ、用几天尊龙凯时人生就是搏✿ღ,✿ღ,那就推荐用ON-DEMAND来节约成本✿ღ。

  由Google X 的AI专家与硅谷精英共同参与创立的GMI Cloud是一家领先的AI Native Cloud 服务商✿ღ,拥有遍布全球的数据中心网络✿ღ,为企业AI应用提供最新✿ღ、最优的GPU资源✿ღ,为全球新创公司✿ღ、研究机构和大型企业提供稳定安全✿ღ、高效经济的AI云服务解决方案尊龙凯时人生就是博官网✿ღ。

  GMI Cloud凭借高稳定性的技术架构✿ღ、强大的GPU供应链以及令人瞩目的GPU产品阵容(如拥有AI 强大算力的H100✿ღ;能够精准平衡AI 成本与效率的H200✿ღ;以及未来即将上线等)✿ღ,确保企业客户在高度数据安全与计算效能的基础上尊龙凯时人生就是博官网✿ღ,高效低本地完成 AI 落地✿ღ。

  据悉✿ღ,GMI Cloud在10月完成了A 轮8200 万美元融资✿ღ,由Headline Asia领投✿ღ,同时获得亚太区智能能源解决方案提供商Banpu (BANPU.BK)以及全球科技大厂纬创资通(的战略投资✿ღ。这笔资金将用于科罗拉多州数据中心的建设✿ღ,以强化GMI Cloud 在全球AI算力服务方面的布局尊龙凯时人生就是博✿ღ。✿ღ。