当前位置: 首页 > news >正文

网易科技专访 GMI Cloud 创始人CEO Alex Yeh:以“产品+布局+服务”构建全球竞争力

摘要

日前,网易科技对 GMI Cloud 创始人兼CEO Alex Yeh 进行了专访,内容主要围绕 AI 算力赛道机遇、GMI Cloud 差异化优势及全球布局等,下文为对话精华实录。

近期,网易科技对话了全球头部 AI Cloud 算力提供商 GMI Cloud 的创始人兼CEO Alex Yeh。他从全球行业视角指出,大模型的持续迭代与推理应用的爆发,正推动高端算力需求进入一个前所未有的黄金周期。

Alex 认为,当前赛道的最大机会在于预训练和推理两大核心环节的持续需求。

“预训练并非一劳永逸,主流厂商仍在持续迭代;而开源社区则催生了从代码生成到音视频创作等多样化推理应用的爆发。”他分析道,然而高端算力始终供不应求,主流云厂商难以全面覆盖从中小型到大型客户的所有个性化需求。

正是瞄准这一“市场缺口”,GMI Cloud 作为全球六家 Reference Platform NVIDIA Cloud Partner 之一 的 AI Cloud 提供商,目前已经成功在东南亚、东北亚、北美等十几个地区自建数据中心,为各类开发者提供高效、灵活的万卡集群级全球高端 GPU 资源。

Alex 将 GMI Cloud 的差异化打法归结为三点:产品专注、区域布局与服务深度。

他表示:“面对大厂的竞争,我们的打法是深度聚焦。在产品上,我们的技术团队专注于 AI 云原生平台的开发,通过自研平台极限释放 GPU 最优性能;在布局上,我们凭借全球稀缺的算力节点和合规集群构建壁垒;在服务上,我们提供全流程保姆式支持,真正与客户成为合作伙伴。”

展望未来,Alex 的愿景是让 GMI Cloud 成为 AI 时代的“算力服务标准”。“我们的使命,是让每一位个人、企业、创业者或创作者都能在我们的平台上轻松、高效地使用人工智能,希望能够通过我们的算力资源优势,帮助全球企业构建全新的 Agentic 基础设施。”

以下为网易科技独家对话 Alex 精华实录:

网易科技:我们看到大模型彻底引爆了算力需求,GPU 云算力成了一个黄金赛道。从您的视角看,这个赛道最大的机会点是什么?您在创立 GMI Cloud 时,是看到了哪些具体的、大厂还没完全满足的“市场缺口”?

Alex:我认为,在大模型发展的进程中,预训练和推理应用是两大持续驱动算力需求的核心环节:一方面,预训练并非一次性任务,主流厂商仍在通过引入强化学习等技术不断迭代和优化模型;

另一方面,开源社区推动了从代码生成到音视频创作等多样化推理应用的爆发。然而无论是训练还是推理,当前高端算力始终处于供不应求的状态,主流云厂商的集群级 GPU 资源难以全面覆盖从中小型到大型客户的实际需求。

为此,我们通过全球化资源布局,在东南亚、东北亚、北美等地整合高端算力,使其能够高效、灵活地提供给各类开发者,既支持便捷的资源获取,也提供可持续的深度合作。

网易科技:GMI Cloud 的第一批“种子用户”是谁?他们为什么没有选择头部云厂商,而是选择了一家创业公司?能否具体描述一下你们典型客户的痛点,以及 GMI Cloud 给他们带来了什么?

Alex:我们的首批客户主要来自AI原生应用及大型出海业务需求的互联网企业。在服务模式上,我们不仅作为技术供应商,更致力于成为客户深度合作的伙伴。与市场上部分低成本云厂商相比,我们始终以提供高稳定性、高可用的集群为核心优势,确保客户能够持续在平台上进行模型迭代,而无需担心因算力中断影响研发进程。在技术架构层面,我们为每位客户定制专属环境,使其能够快速接入并高效开展训练任务。

这种深度协同的合作模式进一步延伸至更多维度:例如在推理优化方向,当多数厂商聚焦于对 DeepSeek 等模型的优化时,我们与客户共同推进对 QWen 等模型的联合优化,并通过共享代码库实现技术成果的双向赋能;

此外,我们还协助多家大模型公司将API集成至我们平台,借助平台的高流量优势,直接帮助客户实现商业变现。因此,我们不仅帮助客户降低成本、提升稳定性,更致力于成为他们业务成长中的收益伙伴。

网易科技:OpenAI 发布的 Sora 文生视频模型,对算力的需求提出了新的量级。您认为 Sora 这类视频生成模型,对算力集群的架构会带来哪些不同于之前语言模型的挑战?

Alex:在 Sora 之前,多模态已成为明确的 AI 应用引爆点,尤其在视频生成领域持续高速成长。值得关注的是,视频类应用极易形成现象级传播,例如 Pika、Sora 等工具推动图片、视频生成迅速破圈,引发大量 C 端用户涌入并快速消耗算力,爆发性需求导致高端 GPU 严重短缺。另一方面,数据中心也面临效能提升与规模扩展的双重挑战。

同时从算力资源市场情况来看,尤其是在北美市场,H100 与 H200 芯片已被抢购一空,价格也随之快速上涨。当前任何容量在二三十兆瓦以上的机房电力资源均已被预订一空,明年产能也几乎售罄,反映出底层算力设施已进入高强度投入与快速扩张的新周期。

网易科技:面对头部云厂商的“降价”和“生态”优势,GMI Cloud 的差异化打法是什么?

Alex:我们能够在市场中建立独特优势,主要源于三个层面的聚焦:产品专注、区域布局与服务深度。

首先在产品层面,传统云厂商生态虽强、覆盖全面,但其业务涵盖从数据链路、传统 CPU 到存储与 AI 等多个层面,难以在AI算力这一垂直领域做到极致。我们则专注于 AI Native Cloud 赛道,通过自研的 Cluster Engine 云平台,在提供虚拟化能力的同时避免算力损耗,保障客户训练与开发效率不降反升。同时我们在自研的 Inference Engine 平台( MaaS 平台)上构建了模型层与硬件适配能力,显著提升推理效率与 Token 输出性能。正是由于我们只聚焦AI这一核心产品,持续深耕、将AI赛道的服务做到最优。

其次在区域布局方面,当前全球算力仍处于供不应求状态,不同地区存在明显的资源缺口。例如当前美国区域的 H100/H200 集群级大卡已基本售罄,有节点即意味着有竞争力。此外,每个区域都有其法规与合规要求,例如许多出海企业偏好落地东北亚或东南亚,而北美云厂商往往难以有效覆盖。我们则能为客户——尤其是大型AI公司——建立完全合规、可规模化部署的集群,使其能以合法、稳定的方式获取高端算力。

最后在服务层面,我们定位为“云服务商+深度服务支持”。传统大厂受制于其业务模式,往往只能承接超大规模订单,对中小客户难以配置专属客户经理,更无法提供全程技术响应。而我们真正将客户视为合作伙伴,提供从架构设计到持续优化的全流程服务。这也是为什么我们现有客户中,有相当比例是从大厂迁移而来,选择与我们共同成长。

网易科技:您认为驱动 GMI Cloud 业务增长的核心飞轮是什么?是“资源驱动”,即拿到更多卡就能服务更多客户?还是“产品驱动”,即平台越好用,客户粘性越高,口碑推荐越多?

Alex:我认为,资源是入场券,我们通过全球化布局与合规集群确保高端算力持续可用;产品是核心,依托自研 Cluster Engine 和 Inference Engine 平台提供高度稳定、高效的 K8s / 容器服务与多模态 API,支持从训练到推理的全流程任务。我们的目标是为客户提供既可靠又便捷、既能快速部署又能持续成长的AI云原生平台。

网易科技:从创立 GMI Cloud 到现在,你有观察到“GPU 云算力”这个市场的哪些变化?你对这门生意的认知,又发生了哪些关键的迭代?

Alex:过去几年AI算力市场呈现爆发式增长,行业格局经历深刻重构。在北美市场,从三大公有云垄断到 Oracle 等新兴厂商崛起,专业算力提供商已占据约 20%-30% 的 NVIDIA 营收并且还在持续成长。

如今的市场已从“有卡就行”的资源竞争,演进为产品、布局与服务三位一体的综合能力比拼,这正是近两年来最值得关注的行业范式转变。

网易科技:复盘过去一两年,你觉得做对了什么?又有哪些可能错过的机会?

Alex:我认为我们展现了出色的应变能力,成功从众多厂商中脱颖而出,目前已跻身全球专业云服务提供商的前十,甚至前六之列。这一成绩背后关键在于我们在一年半前果断决定全力投入产品研发。

相比之下,许多曾经只做裸金属交易、缺乏技术投入的公司,如今已被市场淘汰——它们要么消失,要么陷入无差别价格战,最终仅能作为底层硬件供应商存在,而无法成为真正具有竞争力的云服务企业。

正是由于我们较早布局、持续构建自主研发能力与服务体系,才逐步建立起品牌认知与客户信任,从算力层到MaaS层,既关注训练,又关注推理,帮助AI应用企业全面赋能,这也是我认为我们做得最为正确的战略选择。

网易科技:未来一年,GMI Cloud 有哪些阶段性目标?会不会有一些新产品或服务计划推出?

Alex:在未来一至两年内,我们的核心战略将聚焦于扩大基础设施规模并优先获取高端芯片资源。

我们计划于亚太地区建设全亚洲规模最大、技术最先进的 GB300 集群,并在北美部署基于上万张 B300 芯片的大型算力集群——这些并非远期规划,而是将在未来六个月内落地的项目。

作为 NVIDIA 全球六大 GPU 合作伙伴,我们持续与其深度协同,共同推进下一代技术架构的研发与落地,确保始终能够优先获得最先进的算力芯片。在推理服务层面,GMI Cloud Inference Engine 将突破单一云的限制,构建支持多云调度的开放平台,整合 AWS、GCP、阿里云等主流公有云资源,为客户提供跨云高速互联与弹性扩展能力。

网易科技:您希望 GMI Cloud 未来成为一家什么样的公司?

Alex:我的愿景是成为 AI 时代的算力服务标准,我希望我们能成为每一个企业实现 AI 化的首选平台。

而我们的使命,是让每一位个人、企业、创业者或创作者都能在我们的平台上轻松、高效地使用人工智能,AI 的应用与创新将成为一种普及、便捷且常态化的需求。希望能够通过我们的算力资源优势,帮助全球企业构建全新的 Agentic 基础设施。

网易科技:英伟达与 Open AI 以及甲骨文之间的资本互动,,已被不少行业观察者解读为一种“循环经济”。这一现象确实引发了较多关注与讨论。您是怎么看待这个问题的?

Alex:判断一个生态经济是否形成良性循环,核心在于审视其是否创造了真实价值,而不仅仅依赖于内部资金流转。若参与者之间仅是资金空转,缺乏外部收入或增长动力,这样的模式便难以持续。

以 OpenAI 为例,据公开信息,其年营收已达约 150 亿美元,并保持每年翻倍以上的增长速度,每周活跃用户数更高达 8 亿。这些数据表明,其生态通过技术输出与服务落地,持续吸引了外部价值注入与用户增长。只有当价值的创造与循环同步实现,才能构建一个健康、可持续的良性发展闭环。

网易科技:就目前的 GMI Cloud 发展来讲,您当前最关注的是什么?

Alex:就我们自身而言,目前市场需求充足,客户资源充沛,真正的瓶颈在于数据中心节点的稀缺。因此,当前战略重心在于快速扩展基础设施规模,以匹配持续增长的市场需求。

关于 GMI Cloud

由 Google X 的 AI 专家与硅谷精英共同参与创立的 GMI Cloud 是一家领先的 AI Native Cloud 服务商,是全球六大 Reference Platform NVIDIA Cloud Partner 之一,拥有遍布全球的数据中心,为企业 AI 应用提供最新、最优的 GPU 云服务,为全球新创公司、研究机构和大型企业提供稳定安全、高效经济的 AI 云服务解决方案。

GMI Cloud 凭借高稳定性的技术架构、强大的GPU供应链以及令人瞩目的 GPU 产品阵容(如能够精准平衡 AI 成本与效率的 H200、具有卓越性能的 B200、B300 以及未来所有全新上线的高性能芯片),确保企业客户在高度数据安全与计算效能的基础上,高效低本地完成 AI 落地。此外,通过自研“Cluster Engine”、“Inference Engine”两大平台,完成从算力原子化供给到业务级智算服务的全栈跃迁,全力构建下一代智能算力基座。

作为推动通用人工智能(AGI)未来发展的重要力量,GMI Cloud 持续在 AI 基础设施领域引领创新。选择 GMI Cloud,您不仅是选择了先进的 GPU 云服务,更是选择了一个全方位的 AI 基础设施合作伙伴。

如果您想要了解有关 GMI Cloud 的信息

请关注我们并建立联系

http://www.dtcms.com/a/554325.html

相关文章:

  • 从零理解无感BLDC控制:STC官方开源方案原理图详解
  • 算术运算符与比较运算符
  • 越秀网站建设设计长春建站宣传
  • 品牌网站开发动态模块wordpress单页留言板
  • 蓝桥杯高校新生编程赛第三场题解——Java
  • 网站多国语言设计东莞阿里巴巴代运营
  • 用 Gitea 给 StackEdit 搭一个「图床」- 详细步骤截图
  • ArcGIS图斑属性自动智能填写!告别手动低效输入
  • SSM房屋租售软件18fu9ew8(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
  • 财务管理|基于SprinBoot+vue的个人财务管理系统(源码+数据库+文档)
  • 番禺网站制作技术如何建网站免费
  • 网站文字优化方案电子商务公司简介怎么写
  • #leetcode#
  • 上海做网站去哪里免费网站建设ppt
  • 已有网站域名 怎么做网站wordpress活动报名插件
  • 图的基本概述
  • [Dify 实战] 使用 Ollama + Dify 打造免费 GPT-4o 本地应用:离线智能助手全流程
  • 通知:大可Ai镜像版更名为 GPT-Mirrors
  • 配置Docker镜像源
  • 有视频接口怎么做网站wordpress获取指定图片大小
  • 洛阳网站推广方式广州住建厅官方网站
  • 专业网站建设全包中职学校网站建设的厂家
  • 《AMQP-CPP——轻量级的 RabbitMQ C++ 客户端库》
  • 《UniApp 页面配置文件pages.json》
  • SQLBot:基于大模型和RAG的智能问数系统
  • STM32程序下载/串口一键下载电路
  • 邯郸做网站的电话网站怎么做优化推广
  • 《Unity渲染工具协同进阶:跳出单一工具的局限》
  • 【SOA仿真】SOA增益饱和特性仿真2
  • COOKIE 数据提交注入测试 sqlilabs less 20