公众号2024年11月11日发布:“拖后腿”的芯片技术

⭐发布日期:2024年11月11日 | 来源:公众号

⭐作者:若山詩音 责任编辑:Admin

⭐阅读量:623 评论:6人 转发:9次

【新奥门特免费资料大全.】

【新奥彩免费提供】

【2024澳门天天彩期期免费资料】 【二四六天天好彩】 【球探足球比分即时比分】 【澳门一肖一码100准确测算平台】 【2024新澳开奖历史记录】 【正版全年免费资料大全下载网】 【新澳门彩4949历史记录】 【新澳天天开奖资料大全近十期】
【2024澳门天天彩免费】 【2024澳门免费正版资料】 【新澳今天最新资料晚上】 【奥门中特钢553363】 【澳门资料区免费大公开】 【懊澳门天天好彩】 【澳门最准的免费资料有吗】 【新澳门天天彩2024年开奖直播】

来源:投资界

本周二,Nvidia的股价再次超越苹果,成为全球最有价值的公司,继今年6月创下类似纪录后,再度迎来辉煌时刻。在过去两年中,凭借GPU的强大算力,Nvidia在AI时代可谓风光无限,芯片性能不断攀升,取得了巨大的市场成功。

然而,不得不指出的是,尽管GPU技术飞速发展,仍有一些短板技术正在成为英伟达发展的隐性障碍,影响着其进一步的突破。

高歌猛进的GPU

近一两年来,我们可以看到GPU的速度迭代非常快,背后很大的因素是生成式AI(大模型)的爆发式增长。IDC预测到2027年,全球生成式AI市场规模将攀升至1454亿美元,中国市场的投资也将达到129亿美元,IDC指出,这一发展趋势的动力源自技术迭代的加速、应用领域的拓宽,以及企业对AI创新驱动的不懈投入。

算力是生成式AI发展的物理基础,GPU是加速计算的主要工具。要实现大模型的突破,就需要大幅提高GPU的性能。GPU目前正进入一种“自我加速”的发展模式。英伟达和AMD等厂商面临着巨大的市场压力,它们必须不断在硬件设计上推陈出新,力求实现每年一个小迭代、每两年一个大迭代,才能满足这些需求。即使Hopper H100 GPU平台是“历史上最成功的数据中心处理器”,但黄仁勋在今年的Computex主题演讲中说到,Nvidia也必须继续努力。

英伟达的GPU架构从Fermi到Hopper再到Blackwell,每次架构升级都带来性能和能效上的显著提升。从“Pascal”P100 GPU一代到“Blackwell”B100 GPU一代,八年间GPU的性能提升了1000多倍。

虽然过去八年性能提升了1000多倍,但是GPU的价格仅上涨了7.5倍。据了解,Nvidia的新款基于Blackwell的GB200 GPU系统能够以比上一代H100系统的推理速度快30倍。

由于对数据中心GPU的需求,Nvidia的市值自2023年初以来增长了近十倍。2023年初,英伟达的市值为3600亿美元。不到两年后,其市值已超过3.4万亿美元。

Nvidia市值超越苹果成为全球最有价值的公司

GPU规模的发展速度之快是前所未有的,就拿AMD来说,在AMD 2024年第三季度财报电话会议上,AMD CEO Lisa Su指出,其GPU销量已接近CPU销量,这点与AMD涉足AI市场大有关系。AMD的AI GPU业务才刚开始一年,营收就已经快达到CPU业务规模。

在财报会上,Lisa Su还表示:“仅在数据中心,我们预计AI加速器市场规模将以每年60%以上的速度增长,到2028年将达到5000亿美元。这大致相当于2023年整个半导体行业的年销售额。”AMD将2024年GPU销售额预测从45亿美元上调至50亿美元以上。

然而,GPU这样的快速发展也带来了新问题。随着GPU性能的不断提升,背后支持它们的基础设施——尤其是互联技术和存储技术——却显得相对滞后。

跟不上的互联技术

如今,大型语言模型(LLMs)如ChatGPT、Chinchilla和PALM,以及推荐系统如DLRM和DHEN,都在成千上万的GPU集群上进行训练。训练过程包括频繁的计算和通信阶段,互联技术就显得尤为关键。

传统的互联技术如PCIe(外围组件互联)接口的带宽已难以支撑日益增大的数据传输需求,也早已经跟不上GPU的速度,PCIe标准虽然逐步演进,但它的传输带宽与GPU处理能力之间的差距越来越大。特别是在多卡并行计算的场景中,PCIe显得捉襟见肘,限制了GPU的*性能释放。尽管目前许多大公司尝试采用标准PCIe交换机,并通过基于PCIe的结构扩展到更多加速器,但这只是权宜之计。

为了应对这一瓶颈,英伟达开发了自家的高速互联技术——NVLink和Infiniband。NVLink技术可用于GPU之间的高速点对点互连,提供高带宽和低延迟的数据传输,并通过Peer to Peer技术完成GPU显存之间的直接数据交换,进一步降低数据传输的复杂性。这对于分布式环境下运行的复杂AI模型尤为重要。更快的纵向互联有助于服务器集群内每个GPU性能的充分释放,从而提升整体计算性能。

至于Infiniband技术,是一种网络连接技术。英伟达于2019年收购了Mellanox Technologies,Mellanox是全球*的InfiniBand技术提供商之一。收购后,英伟达继续推进InfiniBand技术的创新,并在其加速计算平台中深度集成了InfiniBand网络。虽然以太网(Ethernet)在很多应用中是主流的网络连接技术,但在高性能计算(HPC)和AI训练等场景中,InfiniBand相较于以太网,具有显著优势:它提供更高的带宽、更低的延迟,且原生支持远程直接内存访问(RDMA),使得数据传输更加高效。

而AMD则推出了自己的Infinity Fabric互联技术,专为数据中心优化,旨在提升数据传输速度和降低延迟。不过Infinity Fabric自然也是比不过NvLink的,不然AMD也不会发起UALink联盟。

NVLink和InfiniBand技术虽然具有明显优势,但它们都是英伟达的专有技术。随着行业对互联技术需求的不断增长,一方面希望避免英伟达在技术上的垄断,另一方面也面临着互联技术瓶颈的挑战。因此,许多企业开始对标英伟达的互联技术,尝试开发替代方案。

去年7月19日,超级以太网联盟(UEC)成立,来对标InfiniBand。创始成员包括AMD、Arista、Broadcom、思科、Eviden(Atos旗下企业)、HPE、英特尔、Meta和微软。目前超级以太网联盟已经吸引了67家公司的加入。其中不乏许多初创公司,联盟的成立将使这些初创公司从该联盟的举措中受益匪浅,UEC将成为初创公司在优化TCO的同时驾驭复杂的AI和HPC网络格局的关键。

据tomshardware的报道,UALink最有可能经常以较小的规模使用,大约8个服务器的pod通过UALink相互通信,进一步的升级由超级以太网处理。联盟成员将在今年获得该规范的访问权限,并于2025年*季度开始进行全面审查。

无论是NVLink、Fabric还是UALink,这一系列举措反映出现有互联技术跟不上加速器发展速度的普遍问题,行业迫切需要新的解决方案来支持更强劲的算力需求。

存储更吃力

与互联技术的滞后相比,存储技术的进步似乎显得更加吃力。在AI、机器学习和大数据的推动下,数据量呈现出指数级的增长,存储技术必须紧随其后,才能确保数据处理的效率和速度。对于当前的内存行业来说,高带宽内存(HBM)已经成为焦点,尤其是在大模型训练所需的GPU芯片中,HBM几乎已经成为标配。

GPU依赖于高带宽内存(HBM)来满足高速数据交换的需求。与CPU相比,GPU需要更加频繁的内存访问,且数据的访问模式具有很高的并行性。这要求存储系统必须能够在毫秒级的延迟内提供极高的数据带宽。

2013年,SK海力士推出了*HBM芯片,直到大模型的崛起,HBM才真正迎来了应用的黄金时机。近年来,SK海力士加速推进HBM技术的更新迭代。今年9月,SK海力士成功批量生产了全球*12层HBM3E产品,并计划于2025年初推出首批16层HBM3E芯片样品。原本预计在2026年量产的HBM4,SK海力士已将时间表提前,预计将在2025年下半年交付12层HBM4芯片。

尽管如此,黄仁勋仍在敦促SK海力士加快HBM4的供应,初步要求提前6个月交付。虽然HBM的需求火爆,存储厂商依然面临着生产能力、技术瓶颈和成本等多重挑战。

存储技术的滞后给高性能计算带来了多重挑战:

计算能力浪费:GPU的强大计算能力无法得到充分利用,存储瓶颈导致大量的GPU计算资源处于空闲状态,无法高效地执行任务。这种不匹配导致了系统性能的低效发挥,增加了计算时间和能源消耗。

AI训练效率下降:在深度学习训练过程中,大量的数据需要频繁地在GPU与存储之间交换。存储的低速和高延迟直接导致AI训练过程中的数据加载时间过长,从而延长了模型训练的周期。这对于需要快速迭代的AI项目来说,尤其是商业应用中,可能会造成较大的成本压力。

大规模数据处理的障碍:随着大数据的兴起,许多AI应用需要处理海量数据。当前存储技术未能有效支持大规模数据的快速处理和存储,特别是在多节点分布式计算的场景中,存储瓶颈往往成为数据流动的*障碍。

为了解决存储跟不上GPU发展的瓶颈,业界已经提出了一些潜在的解决方案:例如存算一体以及CXL这样的智能存储架构。

随着处理器在内存(PIM)技术的兴起,计算和存储有可能进行更紧密的集成。PIM技术允许计算任务直接在存储设备上进行处理,避免了数据在计算和存储之间的传输瓶颈。此类技术有望大幅提升存储系统的性能,并有效支持GPU等计算芯片的高速数据访问需求。

智能存储架构:采用更智能的存储架构,如CXL(Compute Express Link)和NVMe协议,可以实现更高效的存储扩展和更低延迟的数据访问。CXL提供了计算和存储之间的高速互联,使得GPU能够更快速地访问存储数据,解决传统存储架构中存在的带宽瓶颈问题。

存储技术滞后于计算芯片发展的现象,显然已经成为现代计算系统中的瓶颈。尽管存储技术已经取得了一些进展,但与GPU等计算芯片的快速发展相比,仍存在较大的差距。

总结

在当今快速演变的技术生态系统中,多技术协同升级已成为推动新兴技术发展的核心动力。要实现算力的持续增长,GPU、互联、存储等技术必须协调发展。虽然GPU技术已取得了显著进步,但没有更高效的互联技术和更快的存储技术支撑,算力的潜力将无法完全释放。

对于英伟达等科技巨头而言,如何继续推动GPU与其他关键技术的协同进化,解决存储、互联的瓶颈,将是未来几年中的主要挑战。

【本文由投资界合作伙伴半导体行业观察授权发布,本平台仅提供信息存储服务。】如有任何疑问,请联系(editor@zero2ipo.com.cn)投资界处理。

【2024新澳最精准资料】 【2024新澳门正版免费资料】
【新奥彩今天晚上开奖结果查询表】 【2024年澳彩资料大全】
【7777788888管家精准管家婆免费】 【天天澳门开奖结果查询】
【新澳门彩出号走势图手机版2024】 【新澳新奥门正版资料】
【2024年新澳门传真】 【澳门金牛版正版资料大全免费】
【二四六246天天彩资料】 【六和彩开码资料2024开奖码新澳门】 【新澳门2023历史开奖记录查询表】
上一条新闻 下一条新闻

推荐文章

发表评论

斯文·索奇塔

7秒前:Nvidia市值超越苹果成为全球最有价值的公司

IP:49.12.2.*

朱祺隆

8秒前:如今,大型语言模型(LLMs)如ChatGPT、Chinchilla和PALM,以及推荐系统如DLRM和DHEN,都在成千上万的GPU集群上进行训练。

IP:70.59.5.*

Sachs

5秒前:而AMD则推出了自己的Infinity Fabric互联技术,专为数据中心优化,旨在提升数据传输速度和降低延迟。

IP:16.87.7.*

韩振华

3秒前:传统的互联技术如PCIe(外围组件互联)接口的带宽已难以支撑日益增大的数据传输需求,也早已经跟不上GPU的速度,PCIe标准虽然逐步演进,但它的传输带宽与GPU处理能力之间的差距越来越大。

IP:90.87.4.*

Gruenberg

1秒前:与CPU相比,GPU需要更加频繁的内存访问,且数据的访问模式具有很高的并行性。

IP:29.17.2.*

公众号APP介绍

APP图标

澳门六开彩精准天天彩网APP名:公众号

版本:V6.95.877

更新时间:2024-11-10 18:23

新澳资料大全正版资料2024年免费这是一个功能强大的澳门正版资料免费大全2020年APP,可以帮助你完成各种任务。包括最新24小时热点资讯,今日最新:去年7月19日,超级以太网联盟(UEC)成立,来对标InfiniBand。

澳门传真资料网APP介绍

APP图标

2024新澳门天天开彩资料大全APP名:公众号

版本:V2.20.745

更新时间:2024-11-10 23:20

无论是澳门4949资料免费大全快速浏览新闻还是深入了解某个话题,这款新闻APP都能为您提供全面、精准的信息服务。

澳门天天彩资料正版免费特色快8APP介绍

APP图标

新澳天天开奖资料大全最新开奖APP名:公众号

版本:V8.78.764

更新时间:2024-11-10 23:23

2024新澳门天天开好彩大全49应用界面简洁易用,用户可以轻松浏览头条新闻、深度报道和特写文章。24小时内的热点资讯一目了然,让您随时掌握世界动态。此外,您还可以参与评论,与其他读者交流看法,形成一个互动活跃的社区。

2024澳门天天六开好彩APP介绍

APP图标

2024澳门天天开彩开奖结果APP名:公众号

版本:V3.70.805

更新时间:2024-11-10 21:21

正版澳门二四六天天彩牌这款新闻APP是您获取实时信息的理想伴侣。它汇聚了全球最新的新闻报道,涵盖政治、经济、科技、娱乐、体育等多个领域。通过个性化推荐功能,您可以根据兴趣定制新闻源,确保每条信息都与您相关。

2024年正版资料免费完整版APP介绍

APP图标

澳门天天彩开奖结果查询方法APP名:公众号

版本:V5.40.703

更新时间:2024-11-10 14:23

这是一款功能强大的2024年正版资料大全应用,专为帮助您高效完成各种任务而设计。它不仅提供最新的24小时热点资讯,还为您带来今日的最新动态:此类技术有望大幅提升存储系统的性能,并有效支持GPU等计算芯片的高速数据访问需求。。无论是获取信息还是提升效率,这款APP都是您理想的助手。

新澳天天开奖资料大全105APP介绍

APP图标

2024正版资料免费大全APP名:公众号

版本:V3.17.605

更新时间:2024-11-10 18:14

这是一款功能强大的二四六奥门天天开奖应用,旨在帮助您高效完成各类任务。它提供最新的24小时热点资讯,让您随时了解发生的重大事件。今天的最新内容包括:英伟达和AMD等厂商面临着巨大的市场压力,它们必须不断在硬件设计上推陈出新,力求实现每年一个小迭代、每两年一个大迭代,才能满足这些需求。,为您的生活和决策提供了重要参考。这款APP是您获取信息和完成任务的得力助手。

澳门平特一肖100%准资功能APP介绍

APP图标

7777788888王中王跑跑APP名:公众号

版本:V5.64.436

更新时间:2024-11-10 23:20

这是一款功能强大的新澳门天天开奖免费资料应用,专为帮助您高效完成各种任务而设计。它汇集了最新的24小时热点资讯,让您时刻掌握世界动态。今日的最新内容包括:NVLink和InfiniBand技术虽然具有明显优势,但它们都是英伟达的专有技术。,为您的决策和日常生活提供有价值的信息支持。无论您需要了解什么,这款APP都能成为您不可或缺的助手。

澳门资料大全正版免费资料APP介绍

APP图标

新奥2024资料大全APP名:公众号

版本:V4.19.643

更新时间:2024-11-10 16:22

今天的最新动态包括:PIM技术允许计算任务直接在存储设备上进行处理,避免了数据在计算和存储之间的传输瓶颈。,让您第一时间掌握关键资讯,做出明智的决策。这个应用不仅是您的信息获取工具,更是一个提升生活质量的得力助手。

澳门最精准资料大全免费APP介绍

APP图标

2024澳门传真图大全APP名:公众号

版本:V6.74.143

更新时间:2024-11-10 13:13

这是一款功能强大的香港二四六历史开奖应用,能够帮助你高效地完成多种任务。它包括最新的24小时热点资讯,以及今天的最新动态:英伟达于2019年收购了Mellanox Technologies,Mellanox是全球*的InfiniBand技术提供商之一。。

澳门六肖中特期期准免费100%APP介绍

APP图标

2024新奥资料免费精准061APP名:公众号

版本:V6.42.428

更新时间:2024-11-10 14:14

这款功能强大的澳门最精准真正最精准龙门客栈应用旨在提升您的日常效率,帮助您轻松应对各种任务。应用界面友好直观,用户可以快速导航,获取所需信息。它不仅提供最新的24小时热点资讯,还定期更新各种主题的文章和评论,确保您始终走在信息的前沿。

澳门天天彩全年开奖记录APP介绍

APP图标

新澳门六会精准免费开奖APP名:公众号

版本:V1.49.750

更新时间:2024-11-10 13:18

这款新闻APP是您获取实时新闻的最佳选择。它整合了全球各大新闻来源,提供最新的头条、热点和专题报道,涵盖从政治到娱乐的各个领域。用户可以根据兴趣自定义新闻推送,确保获取最相关的信息。

2024澳门天天彩开奖结果查询APP介绍

APP图标

2024新澳正版免费资料APP名:公众号

版本:V1.46.501

更新时间:2024-11-10 18:14

APP界面友好,支持快速浏览和离线阅读。您还可以通过搜索功能,快速找到特定主题的新闻。互动功能让您可以评论、分享文章,与朋友讨论热点话题。无论您是在通勤、休闲,还是工作间隙,这款APP都能让您轻松掌握最新动态。