栏目分类
发布日期:2024-10-25 16:54 点击次数:138
近日,一篇题为“英伟达H100 GPU国外房钱价钱降至2好意思元/小时”的著作飞速在国内传播开来,商场也纷繁围绕“算力泡沫是否开动翻脸”“H100算力不香了”等话题进行究诘。
此前好意思国一家AI推理作事供应商Featherless.AI的结合创举东说念主Eugene Cheah撰文暗意,最近通常收到算力租出商的告白邮件,称单张英伟达H100 GPU的租出价钱降至大致2好意思元/小时,甚而更低,比较2023年5好意思元/小时操纵的商场均价几近腰斩。
客岁时,英伟达曾瞻望,4好意思元/小时的GPU价钱会在4年内保持不变,但不到1年半就走向了降价。
Eugene Cheah在文中称,像AWS、Meta、谷歌这么的大型与中型AI模子公司,已通过耐久租出榨取了算力价值。脚下,除非是要竖立大型智算集群的公司,不然不要购买全新的H100,“租算力”是更经济适用的遴荐。
商场广泛认可H100国外降价的趋势,但以为“2好意思元/小时”,甚而“1好意思元/小时”,主若是Lambda Labs等个别初创算力租出公司为引诱客户搞促销,不成反应商场平均价钱水平。
界面新闻记者浏览亚马逊AWS云作事平台官网时发现,按照短租和长租不同要求,以一台作事器8张GPU换算下来,H100的最新价钱有12好意思元/小时(按一年长租签约)、5好意思元/小时(按三年长租签约)两种不同的档位。另一家云厂商谷歌云近似产物的价钱也在10好意思元陡立。
国内一位从事AI算力租出业务的行业东说念主士告诉界面新闻记者,国外H100降价的逻辑很容易解析——跟着英伟达的GPU新品H200、B200本年陆续开动上市,新品质能更强,平均算下来H100算力资本相对更低,蓝本的旧产物当然需要降价,永别只在于降价幅度和速率。据他了解,5到8好意思元/小时,更能代表目下国外主流平台的价钱水平,也合乎英伟达此前瞻望的产物价钱走势。
英伟达的新品近期开动上市供货后,商场反响依然激烈。
该公司CEO黄仁勋本月在参加一场磋议会时浮现,B200 GPU近期开动量产交货后备受客户嗜好,畴昔12个月的Blackwell架构GPU订单已一说念售罄,任何新客户需要比及2025年才能收到产物。
“国内的情况与国外不同,因为英伟达高端显卡禁售,很难拿新品,走的是另一条不同的路。”上述东说念主士以为,国外降价对国内简直莫得影响,现阶段,国内算力租出商场最大的问题仍在于供需失衡,“国内算力资源十分散布,大多时候齐是卖家找不到买家,买家也找不到卖家。”
之是以如斯,是因为国内目下算力资源总供给有限,无法作念到按需分拨。
据界面新闻记者了解,国内用于历练AI模子的算力资源,除了AI GPU H100、A100除外,还有英伟达的挥霍GPU产物4090,以及不同厂商的国产AI算力。
同期,国内从事算力租出的公司混合,产物作事与价钱零落长入范例,少有像国外的AWS、谷歌云那样,不错向客户提供范例化租出作事的公司。
另有多位商场东说念主士向界面新闻记者暗意,国内算力资源租出的作事器价钱本年确有波动。一台H100作事器,岁首的商场报价在12万元/年操纵,当今的市价大约在7万元。
一家曾参与国内某所在政府缔造智算中心的科技公司CEO提到,由于字节跨越、阿里、腾讯这些互联网巨头掌抓的算力资源主要供自家大模子使用,很少能面向公开商场提供租出作事。当今商场上绝大多数从事算力租出的厂商齐是在卖作事器硬件,无法作念到像往日的云缠绵厂商同样,提供范例作事、长入订价。
“这些算力租出作事商大多数是因客岁算力需求暴涨囤了一定量的AI作事器现货,然后把算力硬件算作‘期货’炒。为了保证硬件回本,他们极少有能简直按小时计价来机动地提供作事,好多订单齐要按1年甚而更长技巧起租,折算下来是一笔不小的资本。”这位CEO以为,国内商场降价主要影响的是这批“投契客”,他们手中的硬件财富在贬值。
av排名另据两位AI作事器的销售东说念主员浮现,目下国内非公开渠说念暴露的极少H100作事器,现货每台价钱在240万元-250万元陡立,比较客岁近300万元的售价有所下降。
在上述科技公司CEO看来,仅通过H100的价钱浮动就预言“算力泡沫翻脸”为前锋早。
就供给而言,与Meta、微软、特斯拉这么已领尽头十万张H100 GPU,且仍连接加大采购的国外算力巨头比较,国内算力总量有限,各地仍在加紧参预缔造智算中心。政府本年对算力缔造的参预方针依然看法“拆伙超前”来加多供给。
而从需求角度看,无论是AI大模子历练照旧推理,以及支撑传统企业通过AI探索业务转型,先进的算力资源恒久是商场上的“抢手货”。
“商场上简直有资源、有实力缔造算力中心的客户照旧极少数少女 自慰,本年战役的多数客户关于平价、踏实且按需调用的算力照旧十分渴求。”该CEO说说念。