IA y refrigeración térmica

Las aplicaciones de IA aceleran la evolución de los centros de datos hacia la alta densidad. Ante el crecimiento explosivo de los datos y la informática provocado por la IA, y ante la creciente escasez de recursos de los centros de datos, especialmente en las ciudades de primer nivel, sólo mejorando la potencia informática, el almacenamiento y las capacidades de transmisión por unidad de área de la sala de ordenadores se puede maximizar el valor del centro de datos. La introducción de chips de IA de alta informática acelerará la tendencia de evolución de la alta densidad de potencia de los servidores.

AI thermal cooling SINK

A medida que ChatGPT enciende una nueva ronda de entusiasmo por las aplicaciones de inteligencia artificial, los centros de datos nacionales y extranjeros y los fabricantes de negocios en la nube han comenzado a promover la construcción de infraestructura de inteligencia artificial, y la proporción de envíos de servidores de inteligencia artificial en todos los servidores está aumentando gradualmente. Según datos de TrendForce, el volumen de envío anual de servidores de IA equipados con GPGPU representó casi el 1 por ciento de todos los servidores en 2022. En 2023, con el apoyo de aplicaciones de inteligencia artificial como ChatGPT, se espera que aumente el volumen de envío de servidores de IA. un 8 por ciento interanual. De 2022 a 2026, se espera que la CAGR del volumen de envío alcance el 10,8 por ciento. Las GPU se utilizan principalmente para servidores de IA, principalmente Nvidia H100, A100, A800 (enviados principalmente a China), así como las series AMD MI250 y MI250X. La proporción de NVIDIA y AMD es de aproximadamente 8:2.

AI computing thermal sink

El efecto de una velocidad del ventilador superior a 4000 r/min sobre la resistencia térmica es limitado. Según CNKI, en un sistema refrigerado por aire, la velocidad del ventilador aumenta de 1000 r/min a 4000 r/min y la convección domina la disipación de calor del chip. Con un aumento en el caudal, el coeficiente de transferencia de calor por convección aumenta significativamente. La refrigeración por aire puede mejorar eficazmente los problemas de disipación de calor del chip. Cuando la velocidad del ventilador excede las 4000 r/min, la disminución en la resistencia a la transferencia de calor es relativamente suave y un aumento en la velocidad solo puede mejorar la transferencia de calor con el aire, lo que resulta en una disminución en el efecto de disipación de calor. La refrigeración líquida a nivel de chip es la tendencia de desarrollo futuro. En un espacio de servidor de 2U, 250 W es aproximadamente el límite para refrigeración por aire y disipación de calor; Por encima de 4U, la refrigeración por aire puede alcanzar 400-600W; El TDP de los chips de IA generalmente supera los 400 W y utiliza principalmente 4-8U. La disipación de calor tradicional enfriada por aire ha llegado a su límite. El control de la temperatura del chip es particularmente importante para un funcionamiento estable y continuo, con una temperatura máxima que no exceda los 85 grados. Una temperatura excesiva puede provocar daños en las astillas. Dentro de 70-80 grados, cada aumento de 10 grados en la temperatura de un solo componente electrónico reduce la confiabilidad del sistema en un 50 por ciento. Por lo tanto, en el contexto de mayor potencia, el sistema de refrigeración se actualizará a refrigeración líquida a nivel de chip.

air cooling heatsink module

En comparación con la refrigeración por aire, la refrigeración líquida no solo puede cumplir con los requisitos de disipación de calor de los gabinetes de alta densidad de potencia, sino que también logra un PUE más bajo y una mayor potencia de salida (GUE). En comparación con el enfriamiento por aire tradicional, el PUE del enfriamiento líquido con placa fría es generalmente 1,1x, con un GUE superior al 75 por ciento, mientras que el PUE del enfriamiento líquido por inmersión puede ser tan bajo como 1,0x, con un GUE. de más del 80 por ciento. El uso simultáneo de la tecnología de refrigeración líquida puede eliminar algunos o incluso todos los ventiladores del equipo de TI (normalmente el consumo de energía del ventilador también se calcula en el consumo de energía del equipo del servidor). Para la refrigeración líquida sumergida, quitar el ventilador del servidor puede reducir el consumo de energía del servidor en aproximadamente un 4 por ciento -15 por ciento.

immersion cooling liquid

La madurez actual de la tecnología de refrigeración líquida de placa fría es relativamente alta y es la corriente principal en la ruta de la tecnología de refrigeración líquida. Suponiendo que la proporción actual sea del 80 por ciento. En el futuro, con la madurez de la tecnología de refrigeración líquida por inmersión, se espera que la proporción general aumente gradualmente. Basado en cálculos integrales, el entrenamiento y la inferencia de modelos grandes de IA traerán un espacio de mercado de refrigeración líquida de 4 mil millones de RMB. Con el aumento de los parámetros del modelo y la promoción de su uso, el mercado de refrigeración líquida experimentará una tasa de crecimiento anual compuesta del 60 por ciento durante los próximos cuatro años.

liquild cooling plate-3

Creemos que se espera que el gran modelo de IA lidere la mejora de la demanda de potencia informática, impulse la construcción de centros de computación y supercomputación inteligentes de alta densidad de potencia, acelere la introducción en el mercado de instalaciones de apoyo, como sistemas de refrigeración líquida, y en el futuro , con la construcción de nuevos centros de datos y la transformación de los centros de datos existentes, se espera que la tasa de penetración general aumente rápidamente. En la actualidad, la industria de la refrigeración líquida aún se encuentra en sus primeras etapas de desarrollo y es optimista acerca de los fabricantes con un diseño líder en tecnología y capacidad de producción.

También podría gustarte

Envíeconsulta