Top News

Nvidia GeForce RTX 30: mise à jour sur l’actualité de l’architecture Ampere

6

Derrière la GeForce RTX 30 se trouve Ampere, l’architecture développée par Nvidia pour sa deuxième génération de GPU orientés raytracing. Évolution plutôt que révolution, cette nouvelle architecture apporte encore son lot de nouveautés intéressantes.

Il y a deux ans, Nvidia a dévoilé la GeForce RTX 20, ses premières cartes graphiques capables d’accélérer le traitement du raytracing et d’ouvrir la voie à des jeux d’effets graphiques plus avancés. Mise à jour en 2019 avec les versions Super, ces cartes graphiques cèdent désormais la place à la GeForce RTX 30. Annoncées d’autant plus rapidement, elles comptent tirer parti de leur architecture Ampere pour devenir la nouvelle référence du jeu raytraced.

Avec l’arrivée des premières cartes graphiques AMD gérant le raytracing (RDNA2) et en même temps lorsque les consoles de jeux pourront également proposer des graphismes améliorés par cette technique de rendu, il va de soi que Nvidia souhaite consolider son leadership technologique. . Cela passe par une série de cartes graphiques qui devront créer une pause en poussant le curseur de performance bien au-delà de celui des modèles précédents.

© Nvidia

Pour ce lancement, les trois cartes graphiques présentées (GeForce RTX 3070, GeForce RTX 3080 et GeForce RTX 3090) partagent un point commun: un GPU qui utilise l’architecture Ampère. En un sens, l’architecture est le moteur qui propulse le véhicule. Et avec Ampère, Nvidia propose plus une évolution majeure de l’architecture Turing de la GeForce RTX 20 qu’une véritable révolution. Cependant, avec une GeForce RTX 3070 présentée comme beaucoup plus rapide que l’ancien produit phare de la marque (la GeForce RTX 2080 Ti), il va sans dire que Nvidia a pu utiliser différents leviers pour booster drastiquement les performances.

Gravure plus fine pour une puce de transistor de 28 milliards

© Nvidia

Nvidia a d’abord opté pour un nouveau procédé de gravure. La puce graphique GeForce RTX 30 est gravée à 8 nm dans les usines Samsung. Dans la pratique, il serait peut-être plus correct de parler d’un processus de gravure 10 nm, optimisé spécifiquement pour les besoins de Nvidia; de la même manière que le 12nm des GeForce RTX 20s n’est en fait qu’une optimisation spécifique du processus 14nm de TSMC. Cependant, Nvidia s’est tourné vers ce Samsung 8nm au lieu du 7nm de TSMC. Un choix probablement dicté par des raisons de coût et de disponibilité.

Avec cette finesse de gravure plus fine, Nvidia a pu créer une puce avec 28 milliards de transistors (GA102, utilisé sur RTX 3080 et RTX 3090). Un chiffre époustouflant si l’on se souvient que la puce TU102 de la GeForce RTX 2080 Ti est “limitée” à 18,6 milliards de transistors. Ce cluster de transistors permet notamment d’offrir un nombre assez important d’unités de calcul. La GeForce RTX 3090 culmine ainsi à 10 496 unités alors que la RTX 2080 Ti était “limitée” à 4 352 unités.

Unité de calcul nouvelle génération

Les blocs de calcul ont tous été revus et optimisés. © Nvidia

Les blocs de calcul ont tous été revus et optimisés. © Nvidia

D’un point de vue technique, Nvidia n’a pas doublé toutes les unités de calcul, mais uniquement celles dédiées aux calculs en virgule flottante. Un choix opportuniste. Nvidia nous assure que ce type de calcul est le plus rentable pour les jeux vidéo. Pour le reste, l’organisation de la puce est essentiellement la même que celle de la génération précédente. On retrouve donc des blocs SM qui contiennent un module RT Core, un module Tensor – doublé, contient désormais 8 cœurs Tensor – et évidemment les unités de calcul classiques, autrement appelées cœur CUDA.

Les unités dédiées aux calculs en virgule flottante ont été doublées. © Nvidia

Les unités dédiées aux calculs en virgule flottante ont été doublées. © Nvidia

Les unités RT Cores dédiées aux calculs de lancer de rayons sont de deuxième génération. Annoncées deux fois plus efficaces – sans trop de détails de la part de Nvidia, il faut l’admettre – ces unités sont désormais capables d’accélérer les effets du flou de mouvement (le flou de mouvement) trouvé dans de nombreux jeux au rythme rapide.

© Nvidia

Les Tensor Cores ont également été révisés et sont annoncés comme étant de troisième génération. Ces blocs sont destinés à accélérer les calculs liés à l’IA. Par exemple, ce sont ces blocs qui sont utilisés pour activer DLSS, le système deexpansion image de jeu vidéo.

Cette troisième génération est annoncée comme 4 à 8 fois plus rapide que la seconde, celle de la GeForce RTX 20. De quoi donner à Nvidia l’opportunité d’en utiliser la moitié qu’auparavant, augmentant les performances à ce niveau et laissant une certaine «place». sur la puce pour les autres blocs.

Fonctionnant en même temps, les différents blocs de calcul permettent de raccourcir le temps nécessaire au rendu des images. © Nvidia

Fonctionnant en même temps, les différents blocs de calcul permettent de raccourcir le temps nécessaire au rendu des images. © Nvidia

Nvidia se souvient au passage que les unités de calcul classiques, RT Core et Tensor Core, sont capables de fonctionner simultanément. Une façon de réduire davantage le temps nécessaire au rendu de chaque image. En pratique, cela se traduit par un débit plus rapide dans les jeux qu’une méthode où chaque bloc fonctionnerait dans une chaîne.

Nvidia inaugure la mémoire GDDR6X

© Nvidia

Chaque série de cartes graphiques Nvidia a sa nouvelle génération de RAM. Après le GDDR5X de la GeForce GTX 10 et le GDDR6 de la GeForce RTX 20, place pour le GDDR6X sur la GeForce RTX 30. Ce nouveau type de mémoire promet une bande passante nettement plus élevée grâce, notamment, à la possibilité de traiter 4 signaux simultanément, contre 2 précédemment. Cette mémoire est notamment capable de fonctionner à une fréquence assez élevée, ce qui se traduit par une bande passante beaucoup plus élevée que GDDR6.

Nvidia a également mis à jour la partie multimédia de ses cartes graphiques. Les GeForce RTX 30 sont capables d’accélérer le décodage du codec AV1, jusqu’à 8K HDR à 60 ips. Les cartes étant compatibles HDMI 2.1 (à 48 Gb / s), elles sont également capables de transmettre un signal HDR 8K à 60 ips vers des téléviseurs compatibles, et ce, via un seul câble. En revanche, point d’évolution DisplayPort qui reste limité à 1.4a. On note également la disparition du support du port USB-C dédié à VirtualLink de certains casques VR.

RTX IO: pour des téléchargements de jeux ultra-rapides

© Nvidia

Dans le chapitre des nouvelles fonctionnalités, Nvidia utilise cette génération de cartes graphiques pour annoncer RTX IO, une fonctionnalité qui sera également active sur la GeForce RTX 20. Derrière ce nom se cache un système qui utilise l’API de stockage DirectX de Microsoft pour accélérer le chargement des fichiers. Les données. Les fichiers de jeu étant souvent compressés, ils nécessitent la décompression des ressources du processeur avant d’être envoyés à la carte graphique. Le passage dans la boîte CPU représente un véritable goulot d’étranglement.

Via l’API de Microsoft et le système RTX IO, les données peuvent être envoyées directement au GPU, qui décompresse les données à la volée. De quoi réduire considérablement les temps de chargement. Sur un SSD SATA, le chargement d’un niveau passerait alors de 6,6 s à 3,3 s et de 3,8 s à 0,5 s sur un SSD PCIe Gen 4. Une annonce que nous avons hâte de voir en pratique Mais il faudra être patient, l’API Microsoft indispensable pour ce système n’est pas attendue avant 2021. Une solution qui sonne comme un écho aux annonces de Sony concernant son système de stockage SSD ultra-rapide présenté dans la PS5.

READ  En Biélorussie, le courage de l'opposant Kolesnikova met en évidence les méthodes du régime Loukachenko

Thierry Dufour

"Amoureux de la nourriture. Défenseur de l'alcool. Solutionneur de problèmes. Expert en café. Maven d'Internet pour les hipsters."

Articles similaires

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer
Fermer