En su conferencia para desarrolladores Google I/O, Google anunció el martes la próxima generación de sus Unidades de Procesamiento Tensorial (TPU), sus chips de IA para centros de datos. Esta sexta generación de chips, llamada Trillium, se lanzará más adelante este año.
“Google se preparó para este momento. Hemos sido pioneros en las GPU durante más de una década”, dijo el CEO de Google, Sundar Pichai, en una sesión informativa previa a la conferencia.
Anunciar la próxima generación de TPUs es algo así como una tradición en la I/O, aunque los chips solo se lanzan más adelante en el año. Sin embargo, cuando lleguen, contarán con un aumento del rendimiento del 4,7x en rendimiento de cálculo por chip en comparación con la quinta generación, según Pichai.
En parte, Google logró esto expandiendo las unidades de multiplicación de matrices (MXUs) del chip y aumentando la velocidad general del reloj. Además, Google también duplicó el ancho de banda de memoria para los chips Trillium.
Lo que tal vez sea aún más importante es que Trillium presenta la tercera generación de SparseCore, que Google describe como “un acelerador especializado para procesar incrustaciones ultra grandes comunes en cargas de trabajo avanzadas de clasificación y recomendación”. Esto, argumenta la compañía, permitirá que las TPUs Trillium entrenen modelos más rápido y los sirvan con menor latencia.
Pichai también describió los nuevos chips como las TPUs “más eficientes energéticamente” de Google hasta el momento, algo que es especialmente importante a medida que la demanda de chips de IA continúa aumentando exponencialmente. “La demanda de la industria por cálculo de ML ha crecido por un factor de 1 millón en los últimos seis años, aumentando aproximadamente diez veces cada año”, dijo. Eso no es sostenible sin invertir en reducir las demandas de energía de estos chips. Google promete que las nuevas TPUs son un 67% más eficientes energéticamente que los chips de quinta generación.
Recientemente, las TPUs de Google tendían a venir en varias variantes. Hasta ahora, Google no ha proporcionado más detalles sobre los nuevos chips, o cuánto costará usarlos en Google Cloud.
A principios de este año, Google también anunció que sería uno de los primeros proveedores de servicios en la nube en ofrecer acceso a los procesadores Blackwell de próxima generación de Nvidia. Sin embargo, esto significa que los desarrolladores tendrán que esperar hasta principios de 2025 para acceder a estos chips.
“Continuaremos invirtiendo en la infraestructura para impulsar nuestros avances en IA y continuaremos rompiendo nuevos límites”, dijo Pichai.
¡Estamos lanzando un boletín de IA! Regístrese aquí para comenzar a recibirlo en su bandeja de entrada el 5 de junio.