Neueste Artikel

Nvidia Geforce RTX 4080/4090 vorgestellt [Update]

von | Nov 16, 2022 | Grafikkarte

Am 20. September hat Nvidia die ersten Grafikprozessoren der Geforce RTX 40 Serie, auch unter dem Namen Ada Lovelace bekannt, offiziell vorgestellt. Es handelt sich dabei um die leistungsstärksten Modelle Geforce RTX 4090 sowie RTX 4080 mit 12 und 16 GB Grafikspeicher. Die Geforce RTX 4090 ist bereits seit 10. Oktober im Handel erhältlich, während die Geforce RTX 4090 mit 16 GB erst am 16. November erscheinen wird.

GPUTakt
Basis/Turbo (MHz)
FP32/TMUs/ROPsTensor/RTSpeicheran- bindung (Bit)GrafikspeicherTBP (W)UVP (EUR)
Geforce RTX 40902230/252016384/512/176512/12838424 GB GDDR6X4501949
Geforce RTX 3090 Ti1560/186010752/336/112336/8438424 GB GDDR6X (21,0 GT/s) 4501329
Geforce RTX 30901400/169510496/328/112328/8238424 GB GDDR6X (19,5 GT/s)3501199
Geforce RTX 4080 16GB2210/25109728/??/?25616 GB GDDR6X3201469
Geforce RTX 3080 12GB1260/17108960/280/96280/7038412 GB GDDR6X (19 GT/s)350keine
Geforce RTX 4080 12GB*2310/26107680/?/??/?19212 GB GDDR6X2851099
Geforce RTX 30801440/17108704/272/96272/6832010 GB GDDR6X (19 GT/s)320719

* = wird nicht veröffentlicht
TBP (Total Board Power) = thermische Verlustleistung der Grafikkarte (GPU, Speicher, Spannungswandler)

Verbesserungen gegenüber der Ampere-Generation (RTX-3000-Serie)

  • DLSS 3.0: In der neuesten Version unterstützt das KI-gestützte Upsamling-Verfahren „Frame Generation“. Hierbei wird nach jedem via DLSS skalierten Bild (Frame) automatisch ein weiteres Bild eingefügt, das von einem KI-basierten Algorithmus mit Hilfe von Bewegungsvektoren und eines optischen Flussfelds erzeugt wird. Dieses Feld wird von einer Recheneinheit erzeugt, die als „Optischer Flussbeschleuniger“ (Optical Flow Accelerator) bezeichnet wird. Es bildet zu jedem Bildpunkt die entsprechende Bewegungsinformation ab. Dadurch kann die Bildrate im Idealfall verdoppelt werden.
  • Schnellere Raytracing-Einheiten: Die Raytracing-Kerne der dritten Generation können beim Durchlaufen der BVH (Bounding Volume Hierarchy) doppelt so viele Schnittpunkttests pro Sekunde durchführen wie die Vorgängergeneration.
  • Neuer Fertigungsprozess TSMC 4N: Durch einen optimierten Fertigungsprozess mit einer Strukturbreite von 5 statt bisher 8 (Samsung 8N) Nanometern lassen sich viel mehr Transistoren bzw. Recheneinheiten pro Fläche auf dem Chip unterbringen. Außerdem sind wesentlich höhere Taktfrequenzen möglich.
  • Größerer Level-2-Cache: Der 2nd-Level-Cache hat in der größten Variante des Grafikchips eine Speicherkapazität von stattlichen 96 MB (RTX 3090 Ti: 6 MB).
  • Shader Execution Reordering (SER): Erhöht die Ray-Tracing-Leistung, indem die Shader-Programme für Sekundärstrahl-Treffer vor deren Ausführung in der Render-Pipeline nach Strahlentyp sortiert werden.

Leistung

  • Die Leistungstests von Nvidia wurden alle mit aktiviertem DLSS (Deep Learning Super-Sampling) erstellt. Bei den Benchmarks mit der Geforce RTX 3090 wurde DLSS 2 genutzt, während bei den neuen GPUs DLSS 3 aktiviert wurde. Die Ergebnisse sind deshalb nur bedingt vergleichbar und stellen nicht die tatsächliche (Roh-)Leistung der Grafikprozessoren dar.

Rasterisierung

Beim Einsatz der herkömmlichen 3D-Darstellungstechnik ist die Geforce RTX 4090 laut Herstellerangaben teilweise doppelt so schnell wie die Geforce RTX 3090.

  • Geforce RTX 4090

Ohne Zuhilfenahme von DLSS ist die Geforce RTX 4090 „nur“ knapp 50 Prozent schneller als die Geforce RTX 3090 Ti – das entspricht dem Faktor 1,5. Das liegt aber vor allem daran, dass es gerade bei niedrigeren Auflösungen selbst eine der schnellsten Spiele-CPU, der Intel Core i9-12900K, nicht schafft, der GPU schnell genug Bilddaten zu liefern. Betrachtet man nur die Testergebnisse, die in UltraHD-Auflösung (3.840 x 2.160) entstanden sind, liegt das Leistungsplus bei etwa 65 Prozent.

  • Geforce RTX 4080 16GB

Bei der Geforce RTX 4080 mit 16 GB Grafikspeicher liegt der Vorsprung gegenüber einer Geforce RTX 3090 Ti nur noch bei etwa 20 Prozent. Zurückzuführen ist die geringere Rechenleistung nicht nur auf die um 40 Prozent geschrumpfte Anzahl von FP32-ALUs, sondern auch auf die schmalere Speicheranbindung von nur 256 Bit und den kleineren L2-Cache (64 statt 72 MB). Im Vergleich zum direkten Vorgängermodell Geforce RTX 3080 kann die neue GPU allerdings durch ein Leistungsplus von satten 50 Prozent überzeugen, wenn auch zu einem extrem hohen Preisaufschlag.

Raytracing

Bei der Verwendung von Raytracing fällt der Unterschied laut Nvidia wesentlich größer aus: Hier ist die Geforce RTX 4090 teilweise mehr als viermal so schnell wie die Geforce RTX 3090 unterwegs. Selbst die Geforce RTX 4080 mit 12 GB ist noch doppelt so schnell.

  • Geforce RTX 4090

Auch hier wird der Grafikchip in FullHD-Auflösung von der CPU gebremst, so dass in der Praxis das durchschnittliche Leistungsplus im Vergleich mit einer Geforce RTX 3090 und einer Geforce 3090 Ti bei lediglich 63 bzw. 53 Prozent liegt – und das ist immer noch eine enorme Leistungssteigerung!

  • Geforce RTX 4080 16GB

Selbst das nächstkleinere Modell kann sich mit durchschnittlich 24 Prozent deutlich von einer Geforce 3090 Ti absetzen. Im Vergleich zum direkten Vorgängermodell liegt wie beim Einsatz der herkömmlichen Rasterisierung der Leistungssprung bei etwa 50 Prozent.

Stromverbrauch/Effizienz

  • Geforce RTX 4090

Während sich die Geforce RTX 3090 Ti unter Volllast teilweise mehr als die offiziell spezifizierten 450 Watt an Leistungsaufnahme gönnt, bleibt die RTX 4090 mit einem Durchschnittsverbrauch von leicht über 400 W sogar deutlich darunter. Stellt man die enorme Mehrleistung in einigen Raytracing-Titeln der Leistunngsaufnahme gegenüber, ist die neue GPU im Idealfall sogar doppelt so effizient wie eine RTX 3090 Ti.

  • Geforce RTX 4080 16GB

Auch die Geforce RTX 4080 16GB liegt mit einem Durchschnittsverbrauch von 300 W unter der vom Hersteller spezifizierten Gesamt-Leistungsaufnahme (Total Board Power) von 320 W. Selbst das direkte Vorgängermodell Geforce RTX 3080 muss für einen Bruchteil der Leistung mehr Energie aufbringen. Beim Spielen in UltraHD-Auflösung arbeitet die zweitschnellste Nvidia-GPU fast doppelt so effizient wie die Geforce RTX 3090 Ti und 69 Prozent effizienter als die Geforce RTX 3080.

Preis/Leistung

Preise der Vorgängermodelle im Vergleich zu denen der aktuellen Modelle:

Geforce RTX 3090 / Geforce RTX 4090 (Founders Edition)

1199 € / 1949 € (+ 62.,5%)

Geforce RTX 3080 10GB / RTX 4080 16GB (Founders Edition)

 759,00 € / 1469,00 € (+93,5%)

Stand: 18.11.2022

Bei der Geforce RTX 4090 entspricht der Preisanstieg in etwa der Leistungssteigerung, wodurch sich das Preis-/Leistungsverhältnis nicht verändert hat. So bleiben Grafikkarten mit dem schnellsten Grafikprozessor auf dem Markt weiterhin Gamern mit hohem Einkommen vorenhalten. Der Preisanstieg bei der Geforce RTX 4080 16GB ist hingegen viel höher als der Leistungsgewinn. Deshalb ist das zweite Modell der RTX-4000-Reihe trotz des größeren Speichers noch viel zu teuer!

Fazit

Extrem schnelle aber auch (zu) teure Gaming-GPUs

Pro

  • sehr gute Rasterisierungsleistung
  • sehr gute Raytracing-Leistung
  • hohe Effizienz
  • großzügig bemessener Speicher

Contra

  • extrem teuer
  • sehr selten auftretende Defekte an Adapterkabel und Buchse