Channels etched into silicon.

Microsoft dévoile de nouvelles puces informatiques refroidies par liquide – ils pourraient empêcher les centres de données d’IA de surchauffer massivement

Par Anissa Chauvin

Microsoft Engineers a conçu une nouvelle façon de garder les centres de données cool – et cela pourrait aider à empêcher la prochaine génération de intelligence artificielle (AI) matériel de la cuisson à mort.

La technologie est basée sur la «microfluidique» et implique le pompage du liquide de liquide à travers de minuscules canaux gravés directement dans les puces de silicium.

L’entreprise espère que microfluidique permettra aux centres de données d’exécuter des charges de travail de calcul plus intensives sans risque de surchauffe, en particulier lorsque des processeurs d’IA plus récents et plus puissants entrent sur le marché. Ceux-ci génèrent beaucoup plus de chaleur que les générations précédentes de puces informatiques, avec Microsoft avertissant que la technologie de refroidissement actuelle pourrait maximiser les performances du centre de données en « quelques années ».

« Si vous comptez toujours sur la technologie traditionnelle des plaques froides, vous êtes coincé », a déclaré Sashi Majety, responsable de programme technique principal chez Microsoft, dans le communiqué. « Au cours de cinq ans, cela pourrait devenir un plafond sur la performance. »

Les unités de traitement des graphiques (GPU) sont souvent utilisées dans les centres de données car ils peuvent exécuter plusieurs calculs en parallèle. Cela les rend idéaux pour l’alimentation IA et autres charges de travail à forte intensité de calcul.

Pour les empêcher de surchauffer, les GPU sont généralement refroidis à l’aide de plaques froides en métal. Ceux-ci sont montés sur le boîtier de la puce et font circuler le liquide de refroidissement sur et autour pour éloigner la chaleur. Cependant, les plaques froides sont séparées du silicium par plusieurs couches, ce qui limite la quantité de chaleur qu’ils peuvent extraire de la puce.

Cool et groovy

La technologie microfluidique de Microsoft implique la gravure des rainures de la taille d’un cheveux humains directement dans la matrice de silicium – le noyau de calcul densément emballé de la puce. Lorsque le liquide de refroidissement est envoyé directement à la matrice via cette tuyauterie microscopique, la chaleur est emportée beaucoup plus efficacement.

La puce prototype a subi quatre itérations de conception. Microsoft s’est associé à la startup suisse Corinttis pour développer une disposition inspirée des veines des feuilles et des ailes de papillon – des modèles qui distribuent du liquide sur les chemins de ramification plutôt que par des lignes droites.

L’objectif était d’atteindre les points chauds plus précisément et d’éviter le colmatage ou la fissuration du silicium. Un modèle d’IA a optimisé ces chemins de refroidissement en utilisant des cartes de chaleur pour montrer où les températures avaient tendance à être les plus élevées sur le processeur.

Les ingénieurs ont ensuite testé la conception sur un GPU exécutant une charge de travail simulée des équipes Microsoft – un mélange de services vidéo, audio et de transcription utilisés pour refléter les conditions typiques du centre de données. En plus de repousser la chaleur beaucoup plus efficacement, le système de refroidissement microfluidique a réduit l’augmentation de la température de pointe dans le silicium du GPU de 65%, selon les représentants de Microsoft.

Au-delà du meilleur contrôle thermique, Microsoft espère que les microfluidiques pourraient permettre un overclocking – pousser en toute sécurité les puces au-delà de leurs limites de fonctionnement normales sans les brûler.

« Chaque fois que nous avons des charges de travail épineuses, nous voulons pouvoir overclocker », a déclaré Jim Kleewein, chercheur technique chez Microsoft 365 Core Management, dans le communiqué. « La microfluidique nous permettrait d’overclocker sans nous soucier de faire fondre la puce car c’est une refroidisse plus efficace de la puce. »

La société explore maintenant comment appliquer la microfluidique à ses puces Cobalt et MAIA personnalisées et travaillera désormais avec des partenaires de fabrication pour utiliser la technologie plus largement utilisée. Les applications futures peuvent inclure des puces empilées en 3D de refroidissement, qui sont notoirement difficiles à concevoir en raison de l’accumulation de chaleur entre les couches.

« Nous voulons que la microfluidique devienne quelque chose que tout le monde fait, pas seulement quelque chose que nous faisons », a déclaré Kleewein. « Plus il y a de gens qui l’adoptent, mieux c’est, plus la technologie va se développer, mieux ce sera pour nous, pour nos clients, pour tout le monde. »

Anissa Chauvin