Hardware-Zone Schriftzug

Neueste Artikel

Vorstellung der Nvidia Geforce RTX 4000 Serie [Update]

von | Nov 16, 2022 | Grafikkarte

Am 20. September hat Nvidia die ersten Grafikprozessoren der Geforce RTX 40 Serie, auch unter dem Namen Ada Lovelace bekannt, offiziell vorgestellt. Es handelt sich dabei um die leistungsstärksten Modelle Geforce RTX 4090 sowie RTX 4080 mit 12 und 16 GB Grafikspeicher. Die Geforce RTX 4090 ist bereits seit 10. Oktober im Handel erhältlich, während die Geforce RTX 4090 mit 16 GB erst am 16. November erscheinen wird.

GPUTakt
Basis/Turbo (MHz)
FP32/TMUs/ROPsTensor/RTSpeicheran- bindung (Bit)GrafikspeicherTBP (W)UVP (EUR)
Geforce RTX 40902230/252016384/512/176512/12838424 GB GDDR6X4501949
Geforce RTX 3090 Ti1560/186010752/336/112336/8438424 GB GDDR6X (21,0 GT/s) 4501329
Geforce RTX 30901400/169510496/328/112328/8238424 GB GDDR6X (19,5 GT/s)3501199
Geforce RTX 4080 16GB2210/25109728/??/?25616 GB GDDR6X3201469
Geforce RTX 3080 12GB1260/17108960/280/96280/7038412 GB GDDR6X (19 GT/s)350keine
Geforce RTX 4070 Ti2310/26107680/240/80240/6019212 GB GDDR6X (21,0 GT/s)285899
Geforce RTX 3070 Ti1575/17706144/192/96192/482568 GB GDDR6X (19,0 GT/s)290699

* = wird nicht veröffentlicht
TBP (Total Board Power) = thermische Verlustleistung der Grafikkarte (GPU, Speicher, Spannungswandler)

Verbesserungen gegenüber der Ampere-Generation (RTX-3000-Serie)

  • DLSS 3.0: In der neuesten Version unterstützt das KI-gestützte Upsamling-Verfahren „Frame Generation“. Hierbei wird nach jedem via DLSS skalierten Bild (Frame) automatisch ein weiteres Bild eingefügt, das von einem KI-basierten Algorithmus mit Hilfe von Bewegungsvektoren und eines optischen Flussfelds erzeugt wird. Dieses Feld wird von einer Recheneinheit erzeugt, die als „Optischer Flussbeschleuniger“ (Optical Flow Accelerator) bezeichnet wird. Es bildet zu jedem Bildpunkt die entsprechende Bewegungsinformation ab. Dadurch kann die Bildrate im Idealfall verdoppelt werden.
  • Schnellere Raytracing-Einheiten: Die Raytracing-Kerne der dritten Generation können beim Durchlaufen der BVH (Bounding Volume Hierarchy) doppelt so viele Schnittpunkttests pro Sekunde durchführen wie die Vorgängergeneration.
  • Neuer Fertigungsprozess TSMC 4N: Durch einen optimierten Fertigungsprozess mit einer Strukturbreite von 5 statt bisher 8 (Samsung 8N) Nanometern lassen sich viel mehr Transistoren bzw. Recheneinheiten pro Fläche auf dem Chip unterbringen. Außerdem sind wesentlich höhere Taktfrequenzen möglich.
  • Größerer Level-2-Cache: Der 2nd-Level-Cache hat in der größten Variante des Grafikchips eine Speicherkapazität von stattlichen 96 MB (RTX 3090 Ti: 6 MB).
  • Shader Execution Reordering (SER): Erhöht die Ray-Tracing-Leistung, indem die Shader-Programme für Sekundärstrahl-Treffer vor deren Ausführung in der Render-Pipeline nach Strahlentyp sortiert werden.

Leistung

  • Die Leistungstests von Nvidia wurden alle mit aktiviertem DLSS (Deep Learning Super-Sampling) erstellt. Bei den Benchmarks mit der Geforce RTX 3090 wurde DLSS 2 genutzt, während bei den neuen GPUs DLSS 3 aktiviert wurde. Die Ergebnisse sind deshalb nur bedingt vergleichbar und stellen nicht die tatsächliche (Roh-)Leistung der Grafikprozessoren dar.

Rasterisierung

Beim Einsatz der herkömmlichen 3D-Darstellungstechnik ist die Geforce RTX 4090 laut Herstellerangaben teilweise doppelt so schnell wie die Geforce RTX 3090.

  • Geforce RTX 4090

Ohne Zuhilfenahme von DLSS ist die Geforce RTX 4090 „nur“ knapp 50 Prozent schneller als die Geforce RTX 3090 Ti – das entspricht dem Faktor 1,5. Das liegt aber vor allem daran, dass es gerade bei niedrigeren Auflösungen selbst eine der schnellsten Spiele-CPU, der Intel Core i9-12900K, nicht schafft, der GPU schnell genug Bilddaten zu liefern. Betrachtet man nur die Testergebnisse, die in UltraHD-Auflösung (3.840 x 2.160) entstanden sind, liegt das Leistungsplus bei etwa 65 Prozent.

  • Geforce RTX 4080 16GB

Bei der Geforce RTX 4080 mit 16 GB Grafikspeicher liegt der Vorsprung gegenüber einer Geforce RTX 3090 Ti nur noch bei etwa 20 Prozent. Zurückzuführen ist die geringere Rechenleistung nicht nur auf die um 40 Prozent geschrumpfte Anzahl von FP32-ALUs, sondern auch auf die schmalere Speicheranbindung von nur 256 Bit und den kleineren L2-Cache (64 statt 72 MB). Im Vergleich zum direkten Vorgängermodell Geforce RTX 3080 kann die neue GPU allerdings durch ein Leistungsplus von satten 50 Prozent überzeugen, wenn auch zu einem extrem hohen Preisaufschlag.

  • Geforce RTX 4070 Ti

In Leistungstests hält sich die Geforce RTX 4070 Ti im Bereich zwischen einer RTX 3090 und RTX 3090 Ti auf, die bis September 2022 immerhin noch die schnellsten Gaming-Grafikchips waren. Sie ist im Schnitt acht Prozent schneller als die am ehesten als Vorgängemodell vergleichbare Geforce RTX 3080 12GB (die RTX 4070 Ti sollte ursprünglich als RTX 4080 12GB auf den Markt kommen) und erreicht damit etwa zwei Drittel der Leistung einer Geforce RTX 4090.

Raytracing

Bei der Verwendung von Raytracing fällt der Unterschied laut Nvidia wesentlich größer aus: Hier ist die Geforce RTX 4090 teilweise mehr als viermal so schnell wie die Geforce RTX 3090 unterwegs. Selbst die Geforce RTX 4080 mit 12 GB ist noch doppelt so schnell.

  • Geforce RTX 4090

Auch hier wird der Grafikchip in FullHD-Auflösung von der CPU gebremst, so dass in der Praxis das durchschnittliche Leistungsplus im Vergleich mit einer Geforce RTX 3090 und einer Geforce 3090 Ti bei lediglich 63 bzw. 53 Prozent liegt – und das ist immer noch eine enorme Leistungssteigerung!

  • Geforce RTX 4080 16GB

Selbst das nächstkleinere Modell kann sich mit durchschnittlich 24 Prozent deutlich von einer Geforce 3090 Ti absetzen. Im Vergleich zum direkten Vorgängermodell liegt wie beim Einsatz der herkömmlichen Rasterisierung der Leistungssprung bei etwa 50 Prozent.

  • Geforce RTX 4070 Ti

Auch bei den Raytracing-Leistungstests liegt die Geforce RTX 4070 Ti zwischen einer RTX 3090 und einer RTX 3090 Ti. Damit liegt sie zwar mehr als 50 Prozent hinter der Geforce RTX 4090, aber immer noch ganz knapp vor dem stärksten Konkurrenzmodell AMD Radeon RX 7900 XTX.

Stromverbrauch/Effizienz

  • Geforce RTX 4090

Während sich die Geforce RTX 3090 Ti unter Volllast teilweise mehr als die offiziell spezifizierten 450 Watt an Leistungsaufnahme gönnt, bleibt die RTX 4090 mit einem Durchschnittsverbrauch von leicht über 400 W sogar deutlich darunter. Stellt man die enorme Mehrleistung in einigen Raytracing-Titeln der Leistunngsaufnahme gegenüber, ist die neue GPU im Idealfall sogar doppelt so effizient wie eine RTX 3090 Ti.

  • Geforce RTX 4080 16GB

Auch die Geforce RTX 4080 16GB liegt mit einem Durchschnittsverbrauch von 300 W unter der vom Hersteller spezifizierten Gesamt-Leistungsaufnahme (Total Board Power) von 320 W. Selbst das direkte Vorgängermodell Geforce RTX 3080 muss für einen Bruchteil der Leistung mehr Energie aufbringen. Beim Spielen in UltraHD-Auflösung arbeitet die zweitschnellste Nvidia-GPU fast doppelt so effizient wie die Geforce RTX 3090 Ti und 69 Prozent effizienter als die Geforce RTX 3080.

  • Geforce RTX 4070 Ti

Die GPU bleibt auf einem nicht übertakten Custom-Design (Zotac Geforce RTX 4070 Ti Trinity) mit einer durchschnittlichen Leistungsaufnahme von 250 Watt meist unterhalb des spezifizierten Verbrauchs von 285 W. Die GPU ist damit zwar wesentlich effizienter als die minimal schnellere Geforce RTX 3090 Ti (TBP: 450 W), muss sich aber dennoch den beiden nächstgrößeren Modellen der RTX-4000-Serie geschlagen geben.

Preis/Leistung

Preise der Vorgängermodelle im Vergleich zu denen der aktuellen Modelle:

Geforce RTX 3090 / Geforce RTX 4090 (Founders Edition)

1199 € / 1949 € (+ 62.,5%)

Geforce RTX 3080 10GB / RTX 4080 16GB (Founders Edition)

759,00 € / 1469,00 € (+93,5%)

Stand: 18.11.2022

Geforce RTX 3070 Ti / RTX 4070 Ti

699,00 € / 899,00 € (+28,6%)

Stand: 07.01.2023

Bei der Geforce RTX 4090 entspricht der Preisanstieg in etwa der Leistungssteigerung, wodurch sich das Preis-/Leistungsverhältnis nicht verändert hat. So bleiben Grafikkarten mit dem schnellsten Grafikprozessor auf dem Markt weiterhin Gamern mit hohem Einkommen vorenhalten. Der Preisanstieg bei der Geforce RTX 4080 16GB ist hingegen viel höher als der Leistungsgewinn. Deshalb ist das zweite Modell der RTX-4000-Reihe trotz des größeren Speichers noch viel zu teuer! Ein sehr gutes Preis-/Leistungsverhältnis bietet hingegen die Geforce RTX 4070 Ti, die mehr als 60 Prozent schneller ist als das direkte Vorgängermodell, aber nur etwa ein Viertel mehr kostet.

Fazit

Extrem schnelle aber auch (zu) teure Gaming-GPUs. Nur die Geforce RTX 4070 Ti hat ein gutes Preis-/Leistungsverhältnis.

Pro

  • sehr gute Rasterisierungsleistung
  • sehr gute Raytracing-Leistung
  • hohe Effizienz
  • großzügig bemessener Speicher

Contra

  • extrem teuer
  • sehr selten auftretende Defekte an Adapterkabel und Buchse