Gestión térmica del chip AI

Actualmente, otros gigantes tecnológicos como Microsoft, Google y Meta también están ampliando sus centros de datos para entrenar y ejecutar sus modelos de inteligencia artificial. Según los informes, Microsoft y OpenAI están planeando construir un proyecto de centro de datos que incluirá una supercomputadora con millones de chips de servidor dedicados, y el proyecto actual podría costar 115 mil millones de dólares, incluida una supercomputadora de inteligencia artificial llamada Stargate, que se espera que se lance en 2028. El director ejecutivo de Meta, Mark Zuckerberg, también declaró en enero de este año que la infraestructura informática de la empresa incluirá 30.000 tarjetas gráficas H100 para finales de 2024. También añadió: "Si se incluyen otras GPU, habrá aproximadamente 600.000 cálculos equivalentes a H100".

 

AI computing

 

AIGC se basa en grandes modelos y grandes datos. Un modelo grande se refiere a un modelo que puede adaptarse a tareas posteriores después de entrenar con datos amplios y a gran escala. Después del surgimiento de un modelo grande, (1) los parámetros del modelo aumentan en magnitud; (2) La demanda diversificada acelera la mejora diversificada de la potencia informática: la potencia informática se puede dividir en potencia informática básica, potencia informática inteligente y potencia de supercomputación según la demanda. En 2021, la potencia informática total de los dispositivos informáticos globales alcanzó 615 EFlops, con una tasa de crecimiento del 44%. Para 2030, se espera que aumente a 56ZFlops, con una tasa compuesta anual del 65%. La potencia de cálculo inteligente aumentará de 232EFlops a 52,5ZFlops, con una CAGR superior al 80%; Después de la aparición del gran modelo, trajo consigo una nueva tendencia de crecimiento de la potencia informática, con un tiempo medio de duplicación de la potencia informática de 9,9 meses.

 

AIGC chip cooling

 

Detrás de la mejora de la potencia informática, los chips deben tener una mayor eficiencia informática y completar más cálculos en menos tiempo, lo que inevitablemente conduce a un aumento en el consumo de energía del chip. Las características de alta densidad y alto consumo de energía de los centros de datos en los centros de supercomputación hacen que los problemas de disipación de calor sean cada vez más prominentes. Los centros de datos modernos, especialmente los centros de supercomputación, suelen contener una gran cantidad de dispositivos de alta potencia que generan una cantidad significativa de calor durante el funcionamiento. Si el calor no se puede disipar de manera oportuna y efectiva, no solo afectará el rendimiento del dispositivo, sino que también puede provocar fallas de hardware. Según el informe de IDC, alrededor del 40% del consumo de energía en los centros de datos se utiliza para sistemas de refrigeración, lo que indica que las soluciones de refrigeración eficaces son cruciales para el funcionamiento de los centros de datos.

 

data canter liquid cooling

 

Los sistemas tradicionales de refrigeración por aire ya no pueden satisfacer las necesidades de refrigeración de las supercomputadoras actuales, por lo que la tecnología de refrigeración líquida se ha convertido gradualmente en la opción principal en la industria. La aplicación de la tecnología de refrigeración líquida permite a los centros de datos acomodar más dispositivos informáticos en el mismo espacio, al tiempo que reduce el consumo de energía del sistema de refrigeración. La aplicación de la tecnología de refrigeración líquida no sólo mejora la eficiencia computacional, sino que también reduce significativamente el consumo de energía y los costos operativos. La tecnología de refrigeración líquida puede manejar más tareas informáticas con el mismo consumo de energía mediante una conducción de calor más eficiente.

 

data center immersion liquid cooling

 

Con la creciente demanda de formación en IA y computación de alto rendimiento, la tecnología de refrigeración líquida desempeñará un papel más importante en los futuros centros de supercomputación. Se espera que la tecnología de refrigeración líquida se convierta en una configuración estándar en los centros de supercomputación y los grandes centros de datos en los próximos años para satisfacer las crecientes demandas informáticas y los desafíos de disipación de calor.

También podría gustarte

Envíeconsulta