NVIDIA Vera

Die CPU für das Zeitalter der KI.

Überblick
Highlights
Anwendungsbeispiele
Merkmale
Vera-Architektur
Erste Schritte

Überblick
Highlights
Anwendungsbeispiele
Merkmale
Vera-Architektur
Erste Schritte

Überblick

Entwickelt für KI-Fabriken weltweit

NVIDIA Vera wurde für die CPU-Arbeit entwickelt, die für agentische KI und bestärkendes Lernen (RL) erforderlich ist, darunter Code-Ausführung, Tool-Nutzung, Sandboxing, Analysen, Datenpipelines und Orchestrierung, die über das Modell hinausgeht. Als Host-CPU für beschleunigte Systeme und als eigenständige CPU für KI-Fabrik-Workloads sorgt Vera dafür, dass GPUs versorgt, Agenten reaktionsschnell und Trainingsschleifen in Bewegung bleiben. Mit schnellen, energieeffizienten NVIDIA Olympus-Kernen und LPDDR5X-Arbeitsspeicher mit hoher Bandbreite bietet Vera bietet eine bis zu 80 % schnellere Sandbox-Umgebungsleistung als herkömmliche CPU-Infrastruktur, wodurch KI-Fabriken mehr Token pro Dollar generieren können.

NVIDIA stellt Vera vor – die CPU für Agenten

NVIDIA hat neue leistungsstarke, energieeffiziente NVIDIA Vera-CPUs veröffentlicht, die verschiedene Workloads in unterschiedlichen Branchen unterstützen, darunter agentische KI, bestärkendes Lernen und Datenverarbeitung.

Pressemitteilung lesen

Vera kommt: Die erste CPU von NVIDIA, die für Agenten entwickelt wurde, landet in führenden KI-Labs

Ian Buck, VP bei NVIDIA für Hyperscale und High-Performance-Computing (HPC), hat die ersten NVIDIA Vera CPU-Systeme persönlich an Anthropic, OpenAI, Oracle Cloud Infrastructure und SpaceXAI ausgeliefert. Damit wird der Moment markiert, in dem agentische CPUs von der Ankündigung in die Produktion übergehen.

Den Blog lesen

NVIDIA Vera CPU Rack

Das NVIDIA Vera CPU-Rack unterstützt bestärkendes Lernen und agentische KI im Maßstab einer KI-Fabrik. Es basiert auf NVIDIA MGX™ und integriert bis zu 256 Vera CPUs, um über 22.500 gleichzeitige Umgebungen auszuführen.

Mehr erfahren

Highlights

Branchenführende agentische CPU-Leistung

1,8-mal schnellere agentische Sandbox-Leistung

Agentische KI wird durch herkömmliche CPUs eingeschränkt. Im Verlauf des Reasoning-Zyklus eines Agenten kompiliert die CPU den generierten Code, führt Python-Toolketten aus und analysiert Software-Code. NVIDIA Vera beschleunigt alle drei Workloads um das bis zu 1,8-Fache gegenüber führenden x86-CPUs und verleiht der agentischen inneren Schleife einen massiven Schub, um den Output der KI-Fabrik zu maximieren.

Relative Leistung basierend auf gemessenen Daten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung, basierend auf einer x86-CPU der neuesten Generation als Referenzwert.

Relative Leistung basierend auf Messdaten und vorbehaltlich etwaiger Änderungen. NVIDIA Vera CPU mit LPDDR5X-Leistung auf Basis einer x86-CPU der neuesten Generation mit DDR5 in wichtigen CPU-Speicherleistungsmetriken.

Energieeffizienter Speicher mit hoher Bandbreite

Herkömmliches DDR5 erzwingt einen Kompromiss zwischen Bandbreite, Effizienz und Wartungsfreundlichkeit. NVIDIA Vera kombiniert LPDDR5X-Arbeitsspeicher mit SOCAMM, abnehmbaren, im Feld austauschbaren Modulen, die Energieeffizienz (LP) mit Flexibilität auf Server-Niveau und erweiterbarer Kapazität bieten. Das Ergebnis ist die 2-fache Bandbreite, die 3-fache Bandbreite pro Kern und die 4-fache Energieeffizienz im Vergleich zu führenden x86-CPUs mit DDR5, wodurch eine höhere Leistung in KI-Fabriken im Hyperscale- und Unternehmensmaßstab ermöglicht wird.

Anwendungsbeispiele

Entwickelt für KI-Fabriken

Host-CPU

NVIDIA Vera bietet Effizienz auf Systemebene als Host-CPU für KI-Fabriken, darunter die Plattformen NVIDIA Vera Rubin NVL72 und HGX™ Vera Rubin NVL8. Vera versorgt GPUs für KI im großen Maßstab und führt gleichzeitig die CPU-Arbeit der Fabrik aus, darunter ETL, Key-Value-Cache-Management (KV) und Orchestrierung. Mit hoher Single-Thread-Leistung, enormer Speicherbandbreite und einem Single-Compute-Die-Design, das Latenz zwischen Chiplets vermeidet, liefert Vera vorhersehbare Leistung und sorgt gleichzeitig für eine vollständige Auslastung der GPUs in beschleunigten KI- und HPC-Systemen.

Standalone CPU

NVIDIA Vera bietet eine hohe Leistung pro Kern und eine massive Speicherbandbreite, um Tausende von parallelen Sandbox-Umgebungen, Tool-Aufrufen, Code-Ausführungen, Evaluierungsschleifen und Daten-Workflows für agentische KI, bestärkendes Lernen, Datenverarbeitung und Analysen auszuführen. Eine schnellere CPU-Ausführung bedeutet, weniger Wartezeiten für die Agenten, mehr Feedback pro Trainingsschritt bei RL-Systemen und eine höhere Token-Produktion pro Dollar für KI-Fabriken. Als eigenständige CPU-Plattform unterstützt Vera außerdem Hyperscale-Cloud-, Unternehmens- und HPC-Workloads und kann mit NVIDIA Vera BlueField®-4 STX auf die Datenspeicherinfrastruktur erweitert werden. Vera ist als dichtes, flüssigkeitsgekühltes NVIDIA Vera CPU-Rack oder in Standardkonfigurationen mit zwei oder einem Sockel verfügbar und passt in jedes Rechenzentrum.

Merkmale

Entdecken Sie die technologischen Durchbrüche

NVIDIA Vera wurde für die Anforderungen des bestärkenden Lernens und der agentischen KI entwickelt und kombiniert speziell entwickelte Olympus-Kerne, LPDDR5X-Speicher mit hoher Bandbreite und NVIDIA Scalable Coherency Fabric (SCF) mit geringer Latenz. Mit NVIDIA NVLink™-C2C-Konnektivität, Confidential Computing und vollständiger Arm®-Kompatibilität lässt sich Vera über beschleunigte Systeme und moderne Rechenzentrumsumgebungen hinweg einsetzen. Die monolithische Rechenarchitektur sorgt für reaktionsfähige Softwareumgebungen und eine effiziente Datenbewegung, wodurch Durchsatz, Energieeffizienz und GPU-Auslastung in KI-, Analyse- und HPC-Workloads maximiert werden.

Benutzerdefinierte NVIDIA Olympus-Kerne

NVIDIA Vera enthält 88 benutzerdefinierte Olympus-Kerne, die für die steuerungsintensive, latenzsensible Arbeit hinter agentischer KI und bestärktem Lernen entwickelt wurden. Die hohe Single-Thread-Leistung trägt dazu bei, dass Softwareumgebungen, Tool-Aufrufe und Evaluierungszyklen schneller abgeschlossen werden, während NVIDIA Spatial Multithreading 176 Threads mit partitionierten Kernressourcen für einen vorhersehbaren Durchsatz in großem Maßstab erzeugt.

LPDDR5X Speichersubsystem

NVIDIA Vera bietet bis zu 1,2 Terabyte pro Sekunde (TB/s) LPDDR5X-Speicherbandbreite und die 2-fache Bandbreite bei der Hälfte der Leistung von herkömmlichem CPU-Speicher. Dadurch können Tausende von parallelen Softwareumgebungen reaktionsschnell arbeiten. Gleichzeitig werden schnellere RL-Iterationen, effizientes KV-Cache-Management und datenintensive agentenbasierte Workflows unterstützt. Mit bis zu 1,5 TB Arbeitsspeicher bietet Vera Kapazität und Effizienz für KI-Fabriken, Analysen und HPC-Workloads.

NVIDIA SCF der zweiten Generation

NVIDIA Vera nutzt NVIDIA SCF der zweiten Generation, um alle 88 Kerne, den Cache, den Speicher, die Ein- und Ausgänge (I/O) sowie NVLink-C2C auf einem einzigen Rechenchip miteinander zu verbinden. Mit 3,4 TB/s Bisektions-Bandbreite und einer einheitlichen Cache-Architektur bietet SCF den Kernen einen schnellen, konsistenten Datenzugriff, sogar bei voller Auslastung der CPU. Vera verzichtet auf die Kommunikation zwischen den einzelnen Chiplets und gewährleistet so eine vorhersehbare Latenz und einen vorhersehbaren Durchsatz für agentische Workloads, Analysen und die Infrastruktur von KI-Fabriken in großem Maßstab.

NVIDIA NVLINK-C2C

NVIDIA NVLink-C2C bietet bis zu 1,8 TB/s kohärente Bandbreite zwischen Vera CPUs und NVIDIA-GPUs. In Kombination mit NVIDIA Rubin-GPUs schafft Vera eine einheitliche Speicherarchitektur, die es CPUs und GPUs ermöglicht, bei komplexen KI- und HPC-Workloads, großen Datensätzen und der KV-Cache-Entlastung zusammenzuarbeiten. NVLink-C2C reduziert Engpässe bei der Datenübertragung, vereinfacht die Optimierung, unterstützt die sichere Isolation für sensible Daten und Code und ermöglicht Hochgeschwindigkeitskonnektivität in Dual-Socket-Vera-CPU-Systemen.

NVIDIA Vera Rubin NVL72

NVIDIA Vera Rubin NVL72 kombiniert bahnbrechende Technologien von NVIDIA: 72 Rubin-GPUs, 36 Vera CPUs, ConnectX®-9 SuperNICs und BlueField-4 DPUs. Es skaliert die Intelligenz in einer Rack-Skala-Plattform mit dem NVLink 6 Switch und skaliert nach außen mit NVIDIA Quantum-X800 InfiniBand und Spectrum-X™ Ethernet, um die industrielle KI-Revolution voranzutreiben.

Mehr erfahren

Erste Schritte

Verpassen Sie keine Neuigkeiten über NVIDIA

Melden Sie sich an, um aktuelle Nachrichten, Updates und mehr von NVIDIA zu erhalten.

Bleiben Sie auf dem Laufenden

Senden Sie mir eine E-Mail bei Verfügbarkeit

Section

Section

Vorname

Nachname

Geschäftliche E-Mail-Adresse

Name der Organisation/Universität

Branche

Berufsbezeichnung

Ort

Bevorzugte Sprache

Bundesland/Kanton

enterpriseOptIns hidden field

Ich möchte aktuelle Neuigkeiten, Ankündigungen und weitere Informationen zu Unternehmenslösungen von NVIDIA erhalten. Eine Abmeldung ist jederzeit möglich.

nvid hidden field

ncid hidden field

NVIDIA-Datenschutzrichtlinie

Ich stimme der Erfassung und Verarbeitung der oben genannten Daten durch NVIDIA <span class="corporation-txt hidden">Corporation </span>zu Forschungszwecken und zur Organisation von Veranstaltungen zu und ich habe die <a href="https://www.nvidia.com/de-de/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA-Datenschutzrichtlinie</a> gelesen und stimme ihr zu.

Ich bin damit einverstanden, dass die oben genannten Informationen an die NVIDIA Corporation in den USA übertragen und gemäß den Anforderungen der <a href="https://www.nvidia.com/de-de/about-nvidia/privacy-policy/?deeplink=visiting-our-website" target="_blank">NVIDIA-Datenschutzrichtlinie</a> zu Forschungszwecken, zur Organisation von Veranstaltungen und für die entsprechenden internen Verwaltungs- und Systemanforderungen von NVIDIA gespeichert werden. Sie können uns kontaktieren, indem Sie eine E-Mail an <a href="mailto:[email protected]">[email protected]</a> senden, um damit verbundene Probleme zu beheben.