12

Hardware- und Nachrichten-Links des 12. Mai 2021

Von Locuza @ Twitter kommt der Hinweis auf die Spezifikationen zu "Navi 24", welcher sich kürzlich in einem Linux-Treiber mit dem zusätzlichen Codenamen "Beige Goby" zeigte. Danach kommt Navi 24 am untersten Ende der zuletzt schon nach unten geschraubten Erwartungen heraus: Es gibt gerade einmal 16 Shader-Cluster (= 1024 FP32-Einheiten) an einem 64-Bit-Speicherinterface. Damit ist Navi 24 nominell deutlich kleiner als der Navi-14-Chip der Radeon RX 5500 Serie (24 CU @ 128-bit), selbst wenn Navi 24 dies teilweise über höhere Taktraten sowie die Hinzunahme eines Infinity Caches ausgleichen kann. Letztgenannter ist tatsächlich auch bei Navi 24 vorhanden, allerdings ist dessen Größe mit nur 16 MB ziemlich mickrig – der Zusammenhang mit dem jeweiligen Speicherinterface ergibt sich aus einem weiteren Tweet seitens Locuza.

RDNA1 RDNA2
HighEnd - Navi 21
80 CU @ 256-bit, 128MB IF$, 16 GB
Midrange Navi 10
40 CU @ 256-bit, 6-8 GB
Navi 22
40 CU @ 192-bit, 96MB IF$, 12 GB
Mainstream Navi 14
24 CU @ 128-bit, 3-8 GB
Navi 23
32 CU @ 128-bit, 32MB IF$, 8 GB
Entry - Navi 24
16 CU @ 64-bit, 16MB IF$, 4 GB
Anmerkung: Hardware-Daten zu noch nicht veröffentlichten Chips basieren weitgehend auf Gerüchten & Annahmen

Vermutlich ist Navi 24 aber auch gar nicht dazu gedacht, unbedingt schneller als Navi 14 herauszukommen. Die geringe Hardware-Kapazität zeigt eher darauf hin, dass hiermit eine echte LowCost-Lösung aufgelegt werden soll, welche die Basis zum einen für absolute Einsteiger-Grafikkarten und zum anderen für typische Office-Grafikkarten abgibt. Und letztere werden ab und zu im Portfolio der Grafikchip-Entwickler benötigt und üblicherweise dann über mehrere Generationen mitgeschleppt – wie bei nVidia derzeit die GeForce GT 1030. AMD hat für dieses Marktsegment bis zuletzt nur Polaris-basierte Lösungen in petto (Radeon RX 550), welche allerdings wegen der zugrundeliegenden 14nm-Fertigung irgendwann unmodern wie auch unwirtschaftlich werden. Navi 24 dürfte somit den Unterbau einer Grafikkarten-Serie mit vermutlichen Namen à Radeon RX 6300, 6400 & 6500 geben, welche mit echten Gaming-Beschleunigern wenig zu tun haben, zur Portfolio-Abrundung aber dennoch benötigt werden.

Vermutlich deswegen ist die Hardware-Differenz zum nächsthöheren Navi-23-Chip auch derart hoch – weil letzterer tatsächlich für ernstzunehmende Gaming-Grafikkarten des Mainstream-Segments umgesetzt wird. VideoCardz berichten diesbezüglich von aus dem chinesischen Chiphell-Forum stammenden Daten zu Radeon RX 6600 & 6600 XT: Beide Grafikkarten sollen auf dem Navi-23-Chip basieren und jeweils 8 GB Speicher mitbringen. Die kleinere Radeon RX 6600 kommt dabei mit 28 Shader-Clustern daher, die größere Radeon RX 6600 XT im Vollausbau des zugrundeliegenden Grafikchips mit 32 Shader-Clustern. Gemäß der ebenfalls genannten TimeSpy-Werte läßt sich zudem eine erste Performance-Abschätzung durchführen: Die Radeon RX 6600 kommt danach etwas unterhalb der Radeon RX 5700 heraus, die Radeon RX 6600 XT knapp oberhalb der Radeon RX 5700 XT. Spiele-Benchmarks mit finalen Serien-Karten könnten hiervon noch leicht abweichende Werte liefern, insofern ist derzeit nicht mehr als die Angabe einer groben Performance-Richtung möglich.

Hardware TS (GPU) Werte-Quelle
Radeon RX 6700 XT Navi 21, 40 CU @ 192-bit 11938 Ø von Guru3D, KitGuru & SweClockers
Radeon RX 6600 XT Navi 23, 32 CU @ 128-bit 9439 AMD Engineering Sample
Radeon RX 5700 XT Navi 10, 40 CU @ 256-bit 9252 Ø von Guru3D, KitGuru & SweClockers
Radeon RX 5700 Navi 10, 36 CU @ 256-bit 8305 Ø von Guru3D, KitGuru & SweClockers
Radeon RX 6600 Navi 23, 28 CU @ 128-bit 7805 AMD Engineering Sample

Erkennbar ist allerdings, dass AMD auf eine etwas größere Performance-Differenz zwischen Radeon RX 6600 und 6600 XT setzt – wahrscheinlich, weil sich Radeon RX 5700 & 5700 XT in dieser Frage zu ähnlich waren. Realisierbar ist dies problemlos über niedrigere Taktraten bzw. ein niedrigeres Power-Limit bei der Radeon RX 6600, womit letztere Karte dann sowohl für Netzteil-limitierte PCs als auch für einen gewissen Übertaktungs-Erfolg interessant sein könnte. Mit der Performance der Radeon RX 5700 Serie holt man zwar niemand von den Grafik-Enthusiasten hinter dem warmen Ofen hervor, aber im Massenmarkt dürfte sich dies gut (als Kontrahenten zur GeForce RTX 3060) verkaufen lassen. Ein Marktstart macht allerdings nur dann Sinn, wenn man auch Massenmarkt-kompatible Straßenpreise garantieren kann – sprich, trotz aller Vorbereitungshandlungen seitens der Grafikkarten-Hersteller sollte AMD hierzu auf ein besseres Preis-Klima im Einzelhandel warten. Eventuell bereits produzierte Navi-23-Chips finden im Mobile-Segment jederzeit Abnehmer, wie es nVidia derzeit bereits mit dem GA107-Chip vormacht.

Navi 24 Navi 23 Navi 22 Navi 21
Codename "Beige Goby" "Dimgrey Cavefish" "Navy Flounder" "Sienna Cichlid" ("Big Navi")
Chipbasis unbekannt angeblich 236mm² Chipfäche (7nm TSMC) 17,2 Mrd. Transistoren auf 336mm² Chipfläche in der 7nm-Fertigung von TSMC 26,8 Mrd. Transistoren auf 520mm² Chipfläche in der 7nm-Fertigung von TSMC
Technik angeblich 16 Shader Cluster (1024 FP32-Einheiten, 64 TMUs, 16 RA-Einheiten), 1 MB Level2-Cache, 16 MB "Infinity Cache", 64 Bit GDDR6-Interface angeblich 32 Shader Cluster (2048 FP32-Einheiten, 128 TMUs, 32 RA-Einheiten), 2 MB Level2-Cache, 32 MB "Infinity Cache", 128 Bit GDDR6-Interface 2 Raster-Engines, 40 Shader-Cluster, 2560 FP32-Einheiten, 160 TMUs, 40 RA-Einheiten, 64 ROPs, 3 MB Level2-Cache, 96 MB "Infinity Cache", 192 Bit GDDR6-Interface 4 Raster-Engines, 80 Shader-Cluster, 5120 FP32-Einheiten, 320 TMUs, 80 RA-Einheiten, 128 ROPs, 4 MB Level2-Cache, 128 MB "Infinity Cache", 256 Bit GDDR6-Interface
Speicher 4 GB GDDR6 8 GB GDDR6 @ 16 Gbps 12 GB GDDR6 @ 16 Gbps 16 GB GDDR6 @ 16 Gbps
FHD Perf.Index vermutlich ~400-600% geschätzt ~900-1150% Radeon RX 6700 XT:  1480% Radeon RX 6800:  1650%
Radeon RX 6800 XT:  1840%
Radeon RX 6900 XT:  1950%
Preislagen vermutlich $100-130 vermutlich $200-300 Radeon RX 6700 XT:  $479 Radeon RX 6800:  $579
Radeon RX 6800 XT:  $649
Radeon RX 6900 XT:  $999
Release vermutlich Herbst 2021 vermutlich Sommer 2021 18. März 2021 18. November 2020

Igor's Lab berichten zu Intels Compute-Beschleunigern mit Codenamen "Arctic Sound" auf Basis der Xe-HP Architektur, zu welchem neue Details aus der konkreten Produkt-Realisierung bei Intel vorliegen. Demnach materialisieren sich (derzeit) die früheren Planungen von bis zu 4 Tiles mit je bis zu 512 EU nicht, die aktuell in Vorbereitung befindlichen Compute-Beschleuniger kommen hingegen mit einer Tile á 384 EU sowie zwei Tiles á 480 EU deutlich handzahmer daher. Dies wird breitflächig als Hinweis auf einen nicht zufriedenstellenden Projekt-Verlauf gewertet – allerdings müssen speziell die angesetzten Abspeckungen damit wenig zu tun haben: Denn die 480 EU sind nahe des Vollausbaus von 512 EU – und im HPC/Compute-Segment verwendet man den Vollausbau eigentlich sehr selten, geht es dort weniger um Spitzenleistung pro Einheit. Die kleinere Lösung mit nur 384 EU könnte dann eine bessere Salvage-Variante oder einfach nur wegen der angesetzten TDP derart gestaltet sein.

Eher relevant wäre an dieser Stelle das Fehlen einer Variante mit 4 Tiles, womit man dann bei der Anzahl der ingesamt möglichen Recheneinheiten (im Vollausbau 2048 EU = 16'384 FP32) deutlich oberhalb dessen herauskommen würde, was nVidia mit dem GA100-Chip bietet. Andererseits kann diese Meldung auch keinen sicheren Hinweis darauf liefern, das Intel ein solches 4-Tile-Monster nicht doch noch (später) realisiert – insofern sind Aussagen über ein "gescheitertes Projekt" wohl ein wenig verfrüht. Dass es nicht einfach wird, aus dem Stand heraus AMD und gerade nVidia bei HPC-Lösungen einzuholen, war eigentlich klar. Aber Intel wird vermutlich strategisch bzw. mit einer Langzeit-Planung an die Sache herangehen, womit man mit dem Erstlingswerk auch keinerlei Erwartungen verbinden dürfte, plötzlich voll konkurrenzfähig zu sein. Dies wird auch bei den Xe-basierten Gaming-Grafikkarten kaum anders laufen.