2026-06-04 15:29:33

通宝TB222-手机版官网- 一颗288核的至强6+,为什么能同时运行500个Agent?

分享

  导语:至强下一代办事器CPU代号Diamond Rapids,将基在Intel 18A P工艺,2027年发布。

已往两年,AI基础举措措施行业有一个险些无人质疑的共鸣:GPU决议AI的上限。

从年夜模子练习到推理部署,财产的存眷点险些都缭绕着GPU睁开。显存够不敷年夜、带宽够不敷高、Token吞吐量能到达几多,成为权衡AI基础举措措施能力的焦点指标。

但Agent的呈现,正于转变这套逻辑。

与传统谈天呆板人差别,Agent其实不只是完成一次问答,而是需要连续履行使命。它需要挪用东西、拜候数据库、阅读网页、治理影象体系,甚至不停创立及调理新的子Agent协同完成事情。

当AI最先从天生谜底转向履行使命,一个持久被GPU光环袒护的脚色从头回到了舞台中心——CPU。

Computex 2026台北国际电脑展时期,英特尔发布了首款基在Intel 18A工艺打造的数据中央处置惩罚器——至强6+(代号Clearwater Forest)。这款处置惩罚器拥有288个能效核(E-Core),还有拥有一个很是吸惹人的特征,于现实测试中,一颗288核至强6+可以轻松同时部署400至500个Agent。

一颗288核的至强6+,为什么能同时运行500个Agent?

这暗地里折射出的,其实不仅仅是一颗新CPU的发布,而是Agent时代AI基础举措措施底层逻辑的一次深刻变化。

一颗CPU能同时运行500个Agent的要害是甚么?

假如说ChatGPT时代的AI更像一个超等搜刮框,那末Agent时代的AI更像一个数字员工。

一个典型Agent使命往往包罗多个环节:用户提出需求,Agent拆解使命,挪用多个东西,查询常识库,启动多个子Agent协同处置惩罚,终极汇总成果并返回。整个历程中,真正卖力天生内容的依然是GPU,但年夜量调理、编排、路由、资源治理以和使命协调事情,则落于了CPU身上。

英特尔数据中央集团技能产物总监杨锦文暗示:"跟着天生式AI带来的成长,CPU及GPU的配比正于从传统的1:8逐渐酿成1:四、1:2,甚至1:1的场景,于部门强化进修场景中甚至呈现了反转。"

一颗288核的至强6+,为什么能同时运行500个Agent?

1:1,甚至CPU比GPU更多——这个比例放于三年前险些不成想象。而这,偏偏是至强6+发布的配景。

一颗288核的至强6+,为什么能同时运行500个Agent?

对于在Agent来讲,CPU面对两个全新的挑战。

第一个挑战是密度。企业但愿于一样的机排挤间内运行更多Agent,跟着Agent数目增长,CPU需要同时治理年夜量使命调理及资源分配。

第二个挑战是相应速率。Agent运行历程中会频仍创立、启动及销毁使命实例,假如启动速率过慢,即便拥有充足算力,也难以满意现实营业需求。

英特尔SoC架构专家曾经义说,"要满意Agent频仍创立、启动及销毁使命实例的特征,但愿于统一颗CPU上部署更高密度的事情负载。这也是为何至强6+是首款单SoC撑持288个核的架构,这可以或许帮忙咱们以很是好的TCO(整体拥有成本)去满意Agent上的需求。"

为了实现这类密度,英特尔于至强6+上采用了英特尔Foveros Direct 3D的三维封装技能。

一颗288核的至强6+,为什么能同时运行500个Agent?

详细而言,是将基在Intel 18A工艺制造的计较Tile,垂直重叠于基在Intel 3工艺的底层Tile之上,再经由过程EMIB封装技能完成各模块之间的互联。整颗处置惩罚器由4个基在18A工艺的计较芯片组成,每一个芯片包罗24个焦点,重叠于3颗基底芯片上方,基底芯片则集成为了片上彀状互联架构、末级缓存及内存子体系——一共29个芯片组件,才组成了这颗288核的处置惩罚器。

内存规格一样针对于Agent以和传统负载的需求举行了强化:12通道DDR5,运行速度最高8000 MT/s,末级缓存高达576MB,比上一代产物晋升跨越5倍。96条PCIe Gen 5通道则包管了跨装备的数据流动不会成为瓶颈。

清晰至强6+的特征后,再来看至强6+可以或许用1颗芯片运行数百个Agent的缘故原由。杨锦文说,详细能运行几多个Agent,取决在详细的配置。云办事中常见配置,凡是是"2个焦点配4G内存"或者"1个焦点配2G内存"。根据这个尺度,288核架构下同时部署400至500个Agent"已经经是很通例的操作"。

他也增补:"上限取决在客户自身的诉求,以和要于甚么样的SLA(办事等级和谈)的办事和谈下提供Agent办事。"

换句话说,Agent时代对于CPU的新要求,再也不只是跑患上快,而是能同时治理更多使命。

一颗288核的至强6+,为什么能同时运行500个Agent?

于机能晋升方面,至强6+对于比上一代产物总体机能最高晋升2.26倍,每一瓦机能最高晋升1.55倍。与同类竞争产物比拟,每一线程机能及每一线程每一瓦机能均超出跨越至多30%,后者是虚拟化数据中央事情负载最焦点的评估维度。

一颗288核的至强6+,为什么能同时运行500个Agent?

对于在利用第二代至强的客户,进级至强6+的理由越发直接,办事器整合比可以到达9:1,物理空间削减近80%,能源节省73%。德意志电信旗下的T-Systems已经将至强6+定位为其T-Cloud私有智能体AI基础举措措施的要害组件,理由恰是海量内核数目与精彩的能效。

一颗288核的至强6+,为什么能同时运行500个Agent?

Agent时代,收集成为瓶颈

已往几年,AI财产形成为了一种惯性思维:GPU决议一切。

但Agent正于让行业意想到一个新的实际——体系能力最先比单芯片能力更主要。

一个Agent完成使命的完备流程是:CPU卖力调理,GPU卖力推理,收集卖力数据互换,内存卖力上下文生存,软件卖力资源编排。任何一个环节呈现瓶颈,城市影响终极的体验。

英特尔履行副总裁兼数据中央事业部总司理Kevork Kechichian指出:"AI的扩大之道,不于在各部件的叠加,而于在体系的协同运作。跟着AI走向智能体时代,编排、并发与数据流动成了新的限定因素。"

这也是为何英特尔于发布至强6+的同时,还有发布了全新的以太网E835节制器和收集适配器。由于当数百个Agent同时事情时,收集已经经成为影响效率的主要因素。

持久以来,网卡于AI基础举措措施中的存于感其实不高。

但当Agent最先频仍挪用外部东西及办事,节点之间的工具向流量迅速增加,收集的主要性最先上升。英特尔技能专家Kevin Cai告诉雷峰网:"AI的成长正于对于收集带宽、时延以和能效提出全新要求,收集已经经成为现代AI基础举措措施中的要害构成部门。"

一颗288核的至强6+,为什么能同时运行500个Agent?

E835撑持最高200GbE吞吐量,笼罩2×25GbE、4×25GbE、2×100GbE、1×200GbE等多种端口配置,可经由过程英特尔以太网端口配置东西(EPCT)矫捷定制。完成初次验证后,仅需两步便可从头配置端口数目及速度。RDMA(RoCEv2/iWARP)撑持可绕过CPU直接于办事器之间传输数据,动态装备个性化(DDP)技能则进一步降低了数据包处置惩罚开消。

E835真实的差异化于功耗上。英特尔给出的数据是,于满载200G线速运行时,E835的功耗比同类重要竞争敌手低28%至47%,终极实现1.4至1.9倍的每一瓦机能上风。对于在正于把愈来愈多算力集中进机架的数据中央来讲,一样的散热及供电预算象征着可以部署更高密度的收集。

一颗288核的至强6+,为什么能同时运行500个Agent?

于电信场景中,E835还有有一个轻易被纰漏的细节,共同至强6+的高精度时钟提取功效,可以于5G专网中以约10纳秒的精度实现时钟同步,这个能力已往需要专门的昂贵装备才能实现。爱立信于现实运营商部署中测试至强6+的数据也已经印证,于不异焦点数下,机能晋升30%,每一瓦机能晋升60%以上,机架功耗降落38%。

E835还有提供跨越10年的产物生命周期,这对于需要持久不变运营的电信及企业客户来讲,是降低持久TCO的主要保障。

为Agent而生的480GB显存GPU

假如说至强6+解决的是Agent的调理问题,那末英特尔下一代数据中央GPU——代号Crescent Island,则对准了另外一个瓶颈:内存。

于Agent时代,内存正于酿成焦点竞争力。由于Agent不仅需要推理,还有需要持久影象、上下文生存、多模子协同以和频仍切换差别使命。愈来愈长的上下文窗口以和不停增加的KV Cache需求,使患上显存容量的主要性迅速晋升。

Crescent Island基在Xe 3P架构,最年夜的差异化不是算力,而是高达480GB的超年夜内存容量。英特尔选择了LPDDR5x显存方案,比拟HBM功耗更低,成本更具竞争力,同时将整卡功耗节制于350W,可直接部署于现有风冷数据中央中,无需液冷革新。

Crescent Island是为Agentic AI而生。

480GB象征着甚么?杨锦文注释,以DeepSeek-V4模子的参数目为例,于FP8量化精度下,仅需4张Crescent Island就能够撑持这个模子的完备部署。更年夜的内存容量还有象征着可以同时于显存中保留多个模子,Agent于差别使命之间切换时无需频仍加载,相应速率会快患上多。但若想得到更抱负的运行效果,确凿还有需要更多的显存容量来支撑。

此外,Crescent Island撑持从原生FP4/MXFP4到FP64的广泛数据类型,PCIe兼容的形状规格进一步降低了扩大门坎。今朝已经有跨越20家OEM及ODM厂商正针对于该产物举行开发,更多细节将于将来几个月陆续披露。

英特尔技能专家指出,Crescent Island GPU走是一条极高性价比的线路,很是合适端侧或者者是企业的典型场景,好比说一机8卡或者者是一机16卡的部署。

于软件撑持方面,Crescent Island GPU将提供开箱即用的广泛模子软件撑持,缭绕四个原则构建同一的 Xe 软件栈,即开放、范围化机能、优异的用户体验以和撑持异构基础举措措施。

从CPU公司,到AI体系公司

从一个总体的视角看英特尔至强6+的发布,会发明一个有趣的征象,英特尔发布的其实不是一款产物,而是一套系统——CPU、GPU、收集、软件生态同时呈现,全数缭绕统一个主题睁开。

这暗地里反应出英特尔数据中央战略的一次深层改变。已往的数据中央竞争,素质上是单芯片竞争。而Agent时代正于让这类界限消散,由于Agent运行需要的是完备体系,CPU卖力节制平面,GPU卖力推理平面,收集卖力数据流动,软件卖力资源编排,任何单一环节都没法自力完成使命。

一颗288核的至强6+,为什么能同时运行500个Agent?

软件生态是英特尔于这场竞争中的另外一张牌。其同一Xe软件栈已经撑持PyTorch、vLLM、SGLang等主流框架,对峙上游优先计谋,不构建关闭生态,而是把对于英特尔硬件的撑持直接孝敬到开源框架的上游代码里,每一款新硬件发布都提供Day 0的即刻撑持。将来开发者可以于锐炫Pro平台上完成开发,再无缝部署到Crescent Island上,前向及后向兼容性都有保障。

一颗288核的至强6+,为什么能同时运行500个Agent?

有些技能堆集,只有到了Agent时代才被从头发明价值。曾经义提到了一个例子,英特尔多年前推出的IAA(Intel In-Memory Analytics Accelerator),可以于内存层做压缩及解压缩加快。其时客户兴致有限,但Agent需要频仍快速地换入换出上下文状况,IAA的价值忽然变患上清楚。海内几家年夜的头部客户于与咱们举行会商及演进的时辰,这个项目的进展速率也很是快。

CXL内存扩大一样云云,经由过程CXL于多个CPU之间同享年夜容量内存池,正于成为Agent年夜范围部署时的主要基础举措措施选项。

于英特尔面向天生式AI的产物组合,CPU依旧是值患上存眷的重点。雷峰网(公家号:雷峰网)相识到,英特尔下一代至强CPU代号Diamond Rapids,将基在Intel 18A P工艺,采用16通道内存配置,提供更多PCIe通道,估计2027年发布。至强6+及Diamond Rapids之间连结完备的Socket兼容性,客户不需要为了进级重构整套基础举措措施。

一颗288核的至强6+,为什么能同时运行500个Agent?

已往几年,AI行业最年夜的叙事是GPU统治世界。

但Agent的呈现,正于让财产从头审阅CPU的价值。

对于在英特尔而言,至强6+最主要的意义也许其实不只是288个焦点,也不只是Intel 18A初次进入数据中央市场。更主要的是,它正于证实一件事,当AI从天生谜底走向履行使命,CPU依然是整个AI基础举措措施不成替换的节制平面。

一颗288核的至强6+,为什么能同时运行500个Agent?

而跟着Agent范围连续扩展,CPU、GPU、收集与软件配合组成的体系能力,也许才是下一阶段AI竞争真实的焦点。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-通宝TB222-手机版官网