«Es sorprendente la cantidad de arquitectura que se hace en las servilletas de los hoteles», dice Andy Pomianowski, miembro de AMD, en una sala repleta de prensa en el evento de lanzamiento de RDNA 3 de AMD. Es una noticia para mi. Siempre supuse que una gran cantidad de rotuladores de pizarra había sido la mejor manera de anotar cualquier idea futura. Sin embargo, la arquitectura de chiplet de RDNA 3 se anotó por primera vez en un papel endeble en un hotel durante una reunión de personal fuera del sitio.
«Estamos lidiando con desafíos. ¿Cómo ofrecemos el mejor producto para nuestros clientes? Hemos tenido mucho éxito en el mercado de servidores y computadoras de escritorio, y la aplicación de esa tecnología a las GPU no era obvia», Sam Naffziger , miembro corporativo de AMD, nos dice.
«Miguel [Mantor] y Andy [Pomianowski] tenía objetivos muy agresivos, muchas características y objetivos que sabíamos que no podríamos cumplir en combinación sin hacer algo diferente».
«Así que estábamos con nuestro personal fuera del sitio y haciendo nuestra parte, siendo buenos, fingiendo que estábamos comprometidos, pero no todas las presentaciones fueron tan atractivas. Hubo una en la que estábamos sentados allí pensando, mi mente está trabajando en el fondo, y simplemente pensando en todos los desafíos tecnológicos y las opciones. Así que comencé a escribir en un pequeño bloc de notas de hotel allí, que nadie suele usar, pero de vez en cuando son útiles».
Según Naffziger, anotó algo que ahora sería bastante familiar para cualquier jugador de PC que esté interesado en el último hardware: el plan para los chiplets dentro de las GPU recientemente anunciadas de RDNA 3: RX 7900 XTX y RX 7900 XT. (se abre en una pestaña nueva) .
«Así que la cosa GCD/MCD. Taché algo notablemente parecido a lo que mostramos ayer [at RDNA 3’s launch event] y parecía una apuesta. Así que se lo pasé a Andy, y él se sentó allí e hizo uno de sus, ya sabes, frunció el ceño y dijo: ‘Creo que eso puede funcionar'».
«Empieza con una servilleta. Luego es PowerPoint, y luego los equipos de ingeniería simplemente lo hacen», bromea Pomianowski.
Si sólo fuera así de simple. La arquitectura RDNA 3 involucra solo dos tipos de chiplet, el GCD y el MCD, pero hay mucho más de lo que eso sugiere.
(Crédito de la imagen: AMD)
(se abre en una pestaña nueva)
Piense en RDNA 3 como una división amistosa para la canalización de gráficos y la mayor parte del subsistema de memoria.
El GCD es donde viven los núcleos de sombreado reales, conocidos como procesadores de flujo en la arquitectura RDNA de AMD. Estos se agrupan en unidades de cómputo duales, no muy diferentes a RDNA 2, excepto con una ALU multipropósito nueva y mejorada para un mejor rendimiento de instrucción, una unidad de operación de IA mejorada con el nuevo Matrix Accelerator y un Vector Cache más grande. Estas actualizaciones y muchas otras permiten que Dual CU de RDNA 3 ofrezca un rendimiento de reloj por reloj muy mejorado en comparación con la última generación: alrededor del 17,4 %.
Ocho unidades de cómputo duales comparten caché L1 dentro de un Shader Engine. Seis Shader Engines comparten caché L2, un procesador de geometría y un procesador de comandos de gráficos. Todo lo cual vive dentro del GCD y está unido por el silicio PCIe Gen 4, el motor multimedia y el motor de visualización de la tarjeta.
(Crédito de la imagen: AMD)
(se abre en una pestaña nueva)
Y eso sobre envuelve un muy división de nivel superior del GCD dentro de la GPU Navi 31. Sin embargo, faltan algunas cosas: Infinity Cache, por ejemplo, que es una característica clave de RDNA introducida con RDNA 2, pero también una forma crucial para que la GPU se comunique con los chips de memoria instalados fuera del paquete en el PCB de la tarjeta gráfica. No llegarías muy lejos en los juegos más recientes sin acceso a un gran búfer de memoria.
Si mira de cerca, puede ver los chipsets MCD que rodean el GCD en mi foto del paquete Navi 31. (Crédito de la imagen: futuro)
(se abre en una pestaña nueva)
Ahí es donde AMD está usando lo que se llama un MCD. Esto toma todas las cosas que generalmente se atascan alrededor del motor de gráficos, Infinity Cache y las interfaces de memoria GDDR6, y las inicia en su propio chiplet. Cada MCD es mucho, mucho más pequeño que el GCD, pero ahí radica uno de los beneficios de este sistema de chiplet.
Mientras que la GPU Navi 21 que se encuentra en la RX 6950 XT es de 520 mm2 y la GPU AD102 en el RTX 4090 de Nvidia es de 608 mm2 el GCD de AMD para Navi 31 es de solo 300 mm2 .
Cada MCD es de solo 37 mm2 .
Un tamaño de chip más bajo genera mayores rendimientos. Los rendimientos más altos deberían contribuir a una imagen mucho mejor de la oferta.
«Cuanto más pequeño es el troquel, mejor es el rendimiento, y así es, solo desde un punto de vista económico, todos son muy pequeños, con muy, muy buen rendimiento», me dice Laura Smith, vicepresidenta corporativa de Graphics MNC y Product Management. .
«Si los pone a todos en un gran dado, entonces verá, y lo verá en todo tipo de productos, necesita algunas capacidades redundantes, porque tendrá consecuencias».
(Crédito de la imagen: AMD)
(se abre en una pestaña nueva)
Me encantaría pensar que este enfoque de chiplet tendría un efecto deseable en el panorama general de la oferta y, por lo tanto, se filtraría para afectar los precios y la oferta que los jugadores realmente verán en los minoristas después del fervor del lanzamiento inicial. Un único chiplet que reduzca drásticamente el tamaño de la matriz y, al mismo tiempo, se utilice en múltiples productos de la línea de AMD podría ser un verdadero ganador en ese sentido, incluso si AMD no apunta a la mejor GPU de Nvidia. (se abre en una pestaña nueva) en rendimiento Ciertamente funcionó para Ryzen, que empleó un enfoque similar con su cIOD, un chip que reunió toda la funcionalidad no central del procesador bajo un mismo techo y en un nodo de proceso más antiguo.
Se puede hacer lo mismo con los chips RDNA 3 de AMD con respecto a los nodos de proceso. La interfaz de memoria y el Infinity Cache no estaban configurados para beneficiarse mucho del nodo de proceso de 5nm de TSMC, por lo que tenía más sentido separarlos del núcleo y fabricarlos en el nodo de 6nm más económico.
«Cuando analizamos el diseño de chiplets, queremos maximizarlo, lo que significa que queremos poner las cosas que se encogen bien y obtener los beneficios de los nodos de tecnología avanzada y costosa en esa tecnología y las cosas que no obtienen muchos beneficios podemos dejar atrás en los nodos de tecnología antigua», dice Naffziger.
«La tecnología adecuada, el trabajo adecuado».
(Crédito de la imagen: AMD)
(se abre en una pestaña nueva)
Tu próxima máquina
(Crédito de la imagen: futuro)
Mejor PC para juegos (se abre en una pestaña nueva) : Las mejores máquinas prefabricadas de los profesionalesLa mejor computadora portátil para juegos (se abre en una pestaña nueva) : Portátiles perfectos para juegos móviles
Naffziger trabajó en el enfoque de chiplet Ryzen de AMD, fue su «bebé» durante años, por lo que tiene sentido que sea él quien idee la nueva forma en que esta tecnología podría aplicarse a una GPU para juegos. Eso también requería una nueva interconexión (las GPU son tontos para el ancho de banda) y ahí es donde los emocionantes Infinity Links de AMD (se abre en una pestaña nueva) viene en.
Pero pensar que todo esto comenzó en un trozo de papel en un hotel durante una reunión aburrida. Así que piense en eso la próxima vez que esté sentado en una reunión escuchando a alguien hablar sobre por qué su empresa tiene que apagar toda la calefacción en la oficina este invierno, podría soñar con su próximo gran avance allí mismo.