Nvidia, AMD e Intel han estado en una especie de carrera por las GPU de matriz múltiple. La teoría es que si tomas un chip poderoso y lo pegas perfectamente a otro, terminarás con algo el doble de bueno. Sencillo, ¿verdad? Bueno, no es tan fácil, y aunque AMD ha logrado hacer que este concepto funcione para su acelerador MI200 de cómputo de supercomputadora de alta gama, nadie más ha tenido nada más que compartir hasta el momento.
Bueno, hasta que Apple acaba de llegar con su nuevo M1 Ultra System-on-Chip (SoC).
Al combinar dos M1 Max SoC, que se lanzaron a fines del año pasado, el nuevo Apple M1 Ultra reúne sus muchos núcleos de CPU y GPU en un solo paquete. Eso lo convierte en una CPU basada en Arm de 20 núcleos, una GPU de 64 núcleos y un motor neuronal de 32 núcleos bajo un mismo techo. Eso lo convierte en un chip con 114 mil millones de transistores en total. Eso se puede configurar con hasta 128 GB de memoria en el lateral.
Solo como punto de referencia, la Nvidia GeForce RTX 3090 cuenta con 28,3 mil millones de transistores en total. De acuerdo, el Apple M1 Ultra es CPU, GPU y E/S, todo en un solo paquete, y luego se duplica a través de una interconexión, pero efectivamente Apple ha lanzado una gran cantidad de transistores al problema informático para que desaparezca.
La clave del chip Ultra es lo que Apple llama «UltraFusion»; su nueva arquitectura de empaque. Es efectivamente un enlace fuerte de 10,000 señales a lo largo del borde de cada uno de los chips, que se coloca allí durante el proceso de empaquetado. Esto permite una comunicación de alta velocidad entre los dos chips conectados de hasta 2,5 TB/s. Que es un gran número por cualquier comprensión.
La interconexión en sí no es un concepto completamente nuevo, e Intel y AMD tienen sus propias interconexiones de gran ancho de banda para combinar, pero la versión de Apple definitivamente hace todo lo posible para mantenerse al tanto de lo último de los otros jugadores importantes en la construcción de chips.
«M1 Ultra es otro cambio de juego para el silicio de Apple que una vez más sorprenderá a la industria de las PC. Al conectar dos matrices M1 Max con nuestra arquitectura de empaque UltraFusion, podemos escalar el silicio de Apple a nuevas alturas sin precedentes», dijo Johny Srouji, Vicepresidente senior de Tecnologías de Hardware de Apple. «Con su potente CPU, GPU masiva, increíble Neural Engine, aceleración de hardware ProRes y gran cantidad de memoria unificada, M1 Ultra completa la familia M1 como el chip más potente y capaz del mundo para una computadora personal».
Ahora, el chip M1 Ultra de Apple no es un cambio de juego en el sentido de cambiar juegos, en absoluto, en realidad. Puede ejecutar juegos en una máquina Apple, por supuesto, pero esa GPU no está diseñada para ejecutarse de ninguna manera.
Una vez más, la compañía se muestra increíblemente cautelosa con respecto a los puntos de referencia exactos que utiliza para mostrar su rendimiento relativo/vatio aquí; todo lo que sabemos es que usó «puntos de referencia estándar de la industria seleccionados» y que sus «datos de rendimiento de GPU discretos populares probados desde Core i9-12900K con memoria DDR5 y GeForce RTX 3060 Ti. Datos de rendimiento de GPU discretos de gama alta probados desde Core i9-12900K con memoria DDR5 y GeForce RTX 3090».
Aún así, Apple afirma que este chip puede superar a la GeForce RTX 3090 de Nvidia, técnicamente la mejor tarjeta de Nvidia, ya que la RTX 3090 Ti actualmente no se presenta, bajo ciertas condiciones y con un consumo de energía mucho menor.
Imagen 1 de 2
(Crédito de la imagen: Apple)
Imagen 2 de 2
(Crédito de la imagen: Apple)
Ahora que es un gran reclamo, pero como vimos con el M1 Max, que se suponía que era tan bueno como la GeForce RTX 3080 de Nvidia, la realidad es que hay advertencias para todo. Eso es especialmente cierto si te ves como un jugador de PC con expectativas de rendimiento de juego. Si bien el chip de Apple será muy bueno en muchas cosas, los juegos realmente no son para lo que está diseñado. Mientras que la arquitectura Ampere de Nvidia lo es más o menos.
Incluso con un indicador de rendimiento más general, TFLOP, el M1 Ultra todavía está un poco alejado de los 35,58 TFLOP FP32 del RTX 3090. El M1 Max tenía una clasificación aproximada de 10,4 TFLOP, y si tuviera que duplicar exactamente eso (como es el caso de los dos troqueles M1 Max del M1 Ultra conectados entre sí), alcanzaría los 20,8 TFLOP. Un poco más bajo, incluso si considera que los TFLOP no son una medida directa del rendimiento real.
Sin embargo, esa eficiencia energética es muy impresionante. Apple está implementando una vez más el proceso de 5nm de TSMC aquí, que es otra pluma en el límite de la compañía y, sin duda, la impulsa a un nuevo territorio en eficiencia energética. Intel, AMD y Nvidia todavía tienen que usar un nodo de proceso comparable a escala.
Especificaciones de la familia Apple M1
M1
M1 profesional
M1 máx.
M1 Ultra
transistores
16B
33.7B
57B
114B
Nodo de proceso
5nm
5nm
5nm
5nm
Núcleos de CPU (alto rendimiento + alta eficiencia)
4+4
Hasta 8+2
8+2
16+4
núcleos de GPU
Hasta 8
hasta 16
hasta 32
hasta 64
GPU ALU
1,024
2,048
4,096
8,192
Y si Apple puede hacer que su SoC de doble GPU sea visto por un sistema como un solo chip, eso también es impresionante. Esa es la verdadera dificultad de crear una GPU multi-die: ha sido excepcionalmente difícil hacer que estos chips discretos parezcan uno en un sistema y no requieran ninguna programación a medida. Al menos para cualquier cosa que no sea solo hacer tareas de cómputo sin procesar.
No queremos simplemente otra situación de SLI/CrossFire aquí, donde los desarrolladores de juegos o Nvidia/AMD son en gran parte responsables de hacer que varias GPU funcionen en tándem; las GPU de matriz múltiple deben verse como una sola y funcionar como una para todos los intentos y propósitos. .
En cuanto al rendimiento de la CPU, Intel y Apple ahora tienen el equivalente de una disputa de sangre entre empresas, así que puedes imaginar que no hay amor perdido en ninguno de los dos lados. Apple se ha centrado en compararlo con el Intel Core i9 12900K con sus resultados de referencia no especificados aquí, que son tan útiles como un castillo hinchable de plomo, pero afirma que tiene un rendimiento casi el doble a 60 vatios. Ciertamente, es probable que los 16 núcleos de alto rendimiento y los cuatro núcleos de bajo consumo del M1 Ultra sean capaces de mostrar el para qué de Intel en cierta capacidad y puntos de referencia, aunque se requiere más investigación para ver realmente cómo estos dos chips se sacuden en cuanto al rendimiento.
Imagen 1 de 2
Apple realmente sabe cómo hacer que su silicona sonría para la cámara. (Crédito de la imagen: Apple)
Imagen 2 de 2
El Apple M1 original se lanzó en 2020 y le siguieron el M1 Pro y el M1 Max en 2021. (Crédito de la imagen: Apple)
El M1 Ultra es un chip que sin duda se ve muy bien en el papel y probablemente se verá muy bien con las cargas de trabajo para las que Apple lo ha diseñado: aquellas en el espacio creativo de la estación de trabajo. Sin embargo, tendremos que ver cómo le va en los puntos de referencia del mundo real (donde los puntos de referencia y las condiciones de prueba están realmente especificados).
Sin embargo, dicho esto, creo que puedes ver lo que Apple logró hacer con un SoC multi-die de su propio diseño como una señal muy prometedora de lo que está por venir para los juegos de PC. Intel está trabajando en diseños de SoC en mosaico que combinan chiplets interconectados de gráficos Arc y arquitecturas de CPU de próxima generación, comenzando con Meteor Lake en 2023. Mientras que AMD ha apilado CPU VRAM y GPU de matriz múltiple a la vuelta de la esquina, aparentemente. También se dice que Nvidia se está preparando para un gran aumento en el número de transistores (y potencia) con sus arquitecturas Lovelace y Hopper.
Estamos al borde de un momento muy emocionante en el desarrollo de GPU, y el M1 Ultra de Apple es un vistazo de lo que vendrá de un montón de empresas que ahora luchan por dominar el rendimiento con diseños intrincados y nodos de proceso de vanguardia.
Y sería negligente de mi parte no discutir el precio en relación con el chip M1 Ultra de Apple. El chip de Apple viene en Mac Studio, la nueva y elegante caja de escritorio de Apple. Con el M1 Ultra full-fat en el interior y 128GB de memoria, estás viendo un paquete de $5,799. Eso es solo con un SSD de 1 TB, también. Cuesta $ 7,999 para un modelo de 8 TB. Puede reducir ese precio a $ 3,999 si abandona el M1 Ultra de nivel superior por un modelo de GPU de 48 núcleos y opta por solamente Memoria de 64 GB.
Así que considere el M1 Ultra como un procesador de alta gama. Apple también agregó recientemente un ajuste de altura al soporte de su monitor y aplicó otros $ 400 en su etiqueta de precio por el privilegio. Algunas cosas nunca cambian.