Die CPU für das Zeitalter der KI.
Überblick
NVIDIA Vera wurde für die CPU-Arbeit entwickelt, die für agentische KI und bestärkendes Lernen (RL) erforderlich ist, darunter Code-Ausführung, Tool-Nutzung, Sandboxing, Analysen, Datenpipelines und Orchestrierung, die über das Modell hinausgeht. Als Host-CPU für beschleunigte Systeme und als eigenständige CPU für KI-Fabrik-Workloads sorgt Vera dafür, dass GPUs versorgt, Agenten reaktionsschnell und Trainingsschleifen in Bewegung bleiben. Mit schnellen, energieeffizienten NVIDIA Olympus-Kernen und LPDDR5X-Arbeitsspeicher mit hoher Bandbreite bietet Vera bietet eine bis zu 80 % schnellere Sandbox-Umgebungsleistung als herkömmliche CPU-Infrastruktur, wodurch KI-Fabriken mehr Token pro Dollar generieren können.
Das NVIDIA Vera CPU-Rack unterstützt bestärkendes Lernen und agentische KI im Maßstab einer KI-Fabrik. Es basiert auf NVIDIA MGX™ und integriert bis zu 256 Vera CPUs, um über 22.500 gleichzeitige Umgebungen auszuführen.
Highlights
Agentische KI wird durch herkömmliche CPUs eingeschränkt. Im Verlauf des Reasoning-Zyklus eines Agenten kompiliert die CPU den generierten Code, führt Python-Toolketten aus und analysiert Software-Code. NVIDIA Vera beschleunigt alle drei Workloads um das bis zu 1,8-Fache gegenüber führenden x86-CPUs und verleiht der agentischen inneren Schleife einen massiven Schub, um den Output der KI-Fabrik zu maximieren.
Relative Leistung basierend auf gemessenen Daten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung, basierend auf einer x86-CPU der neuesten Generation als Referenzwert.
Relative Leistung basierend auf Messdaten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung auf Basis einer x86-CPU der neuesten Generation mit DDR5 in wichtigen CPU-Speicherleistungsmetriken.
Herkömmliches DDR5 erzwingt einen Kompromiss zwischen Bandbreite, Effizienz und Wartungsfreundlichkeit. NVIDIA Vera kombiniert LPDDR5X-Arbeitsspeicher mit SOCAMM, abnehmbaren, im Feld austauschbaren Modulen, die Energieeffizienz (LP) mit Flexibilität auf Server-Niveau und erweiterbarer Kapazität bieten. Das Ergebnis ist die 2-fache Bandbreite, die 3-fache Bandbreite pro Kern und die 4-fache Energieeffizienz im Vergleich zu führenden x86-CPUs mit DDR5, wodurch eine höhere Leistung in KI-Fabriken im Hyperscale- und Unternehmensmaßstab ermöglicht wird.
Anwendungsbeispiele
Merkmale
NVIDIA Vera wurde für die Anforderungen des bestärkenden Lernens und der agentischen KI entwickelt und kombiniert speziell entwickelte Olympus-Kerne, LPDDR5X-Speicher mit hoher Bandbreite und NVIDIA Scalable Coherency Fabric (SCF) mit geringer Latenz. Mit NVIDIA NVLink™-C2C-Konnektivität, Confidential Computing und vollständiger Arm®-Kompatibilität lässt sich Vera über beschleunigte Systeme und moderne Rechenzentrumsumgebungen hinweg einsetzen. Die monolithische Rechenarchitektur sorgt für reaktionsfähige Softwareumgebungen und eine effiziente Datenbewegung, wodurch Durchsatz, Energieeffizienz und GPU-Auslastung in KI-, Analyse- und HPC-Workloads maximiert werden.
NVIDIA Vera Rubin NVL72 kombiniert bahnbrechende Technologien von NVIDIA: 72 Rubin-GPUs, 36 Vera CPUs, ConnectX®-9 SuperNICs und BlueField-4 DPUs. Es skaliert die Intelligenz in einer Rack-Skala-Plattform mit dem NVLink 6 Switch und skaliert nach außen mit NVIDIA Quantum-X800 InfiniBand und Spectrum-X™ Ethernet, um die industrielle KI-Revolution voranzutreiben.
Erste Schritte
Melden Sie sich an, um aktuelle Nachrichten, Updates und mehr von NVIDIA zu erhalten.