El diseñador chino de procesadores Loongson se está preparando para un salto bastante más ambicioso que sus generaciones anteriores. Su próxima familia de CPUs para servidor, llamada 3D7000, apuesta por un diseño en chiplets con 32 o más núcleos por chiplet y pretende fabricarse en un nodo de clase sub-10 nm que, según los planes de la compañía, debería estar listo hacia 2027. 
Sobre el papel no es solo una actualización incremental: es un movimiento claro hacia más densidad de cómputo, funciones de plataforma modernas y, sobre todo, mayor autonomía tecnológica en un contexto de sanciones y restricciones de exportación.
Para entender qué significa 3D7000, hay que mirar primero a la generación actual. Hoy la gama de servidores de Loongson se apoya en los 3C6000, chips que analistas sitúan cerca de un proceso de 12 nm. Estos procesadores utilizan chiplets de 16 núcleos y permiten configuraciones de hasta cuatro chiplets por socket, alcanzando 64 núcleos con un TDP aproximado de 300 W. No son líderes de eficiencia, pero cumplen su papel en nubes locales, centros de datos estatales y proveedores regionales. En paralelo, la serie 3D5000 se dirige a estaciones de trabajo, con hasta 32 núcleos alrededor de los 2,0 GHz, pensada para entornos profesionales que necesitan rendimiento, aunque no necesariamente lo último de AMD o Intel.
3D7000 nace precisamente para ir más allá de esa base relativamente conservadora. Loongson habla de un proceso avanzado “X-nanómetro”, fórmula que en la práctica equivale a un nodo sub-10 nm en su terminología. Además de los núcleos de CPU, la compañía está rediseñando bloques IP clave: phase-locked loops (PLL), archivos de registros multiport, y los PHY para memoria DDR5 y para la interfaz PCIe 5.0. Es decir, no solo quiere aumentar el número de núcleos, sino también ponerse al día en el ecosistema de memoria y conectividad que hoy exigen las plataformas de servidor modernas.
El salto de 16 a 32 o incluso más núcleos por chiplet es el corazón de la propuesta. Al duplicar la densidad de núcleos por pieza de silicio, se abarata el coste por hilo de ejecución: la placa base, la fuente y el sistema de refrigeración se reparten entre muchas más tareas simultáneas. Para cargas de trabajo masivamente paralelas – desde contenedores y microservicios hasta analítica o bases de datos distribuidas – , ese enfoque puede ser atractivo aunque cada núcleo individual no compita cara a cara con un core de última generación de AMD o Intel. Y para organismos públicos chinos, empresas estatales y proveedores que ya no tienen barra libre en el mercado de x86 occidental, una plataforma doméstica con decenas de núcleos y soporte actual de memoria y E/S es mucho más realista que seguir estirando hardware antiguo.
La gran incógnita está en la letra pequeña de ese “sub-10 nm”. Nadie espera que el nodo de fabricación que use Loongson sea comparable, uno a uno, con los procesos más avanzados de TSMC o de Intel Foundry. Lo más probable es que se apoye en variantes mejoradas de SMIC, algo en la línea de N+1 o N+2: evoluciones sobre nodos más maduros, sin el despliegue masivo de litografía EUV que se ve en Taiwán o Estados Unidos. En la práctica, eso puede traducirse en frecuencias algo más bajas, tensiones más conservadoras y consumos elevados si se empuja demasiado. No es casualidad que en foros y comentarios ya abunden los chistes sobre futuros “radiadores” de 400 o 500 vatios disfrazados de CPU para centro de datos.
Aun así, despachar a la ligera la 3D7000 como si fuera “juguete chino” sería perder de vista el contexto. Hace unas décadas China estaba a años luz de los fabricantes punteros; hoy, aunque sigue por detrás, el retraso se mide en unos pocos años, no en generaciones enteras. Si Loongson consigue poner en producción CPUs que van cuatro o cinco años por detrás de los EPYC o Xeon más recientes, eso sigue siendo un enorme avance para su propio ecosistema. Mientras algunos comentarios apocalípticos hablan de una infraestructura china “en ruinas”, la realidad es que el país sigue inaugurando fábricas, presentando nuevas generaciones de chips y sustituyendo, poco a poco, piezas críticas de su hardware por alternativas nacionales.
También hay un efecto competitivo que va más allá de China. Cuantos más proveedores serios de CPUs de servidor existan, más difícil será que dos o tres gigantes dicten precios, disponibilidad y ciclos de renovación sin contrapesos. El ejemplo de la memoria DRAM es bastante claro: con tan pocos actores dominando la oferta, el mercado se vuelve frágil y dependiente. Aunque la mayoría de los 3D7000 terminen alimentando solo centros de datos chinos, su mera existencia altera el equilibrio de poder y manda un mensaje al resto de la industria: el monopolio tecnológico nunca es eterno.
La estrategia de Loongson no se limita a las CPUs. En paralelo, la compañía está impulsando la GPU discreta 9A1000, pensada para el segmento de AI PC y para gráficos de entrada. Según la propia empresa, el chip ya ha alcanzado la fase de tape-out y el equipo de software trabaja en los controladores para Windows. Nadie espera que compita con una RTX tope de gama o con las Radeon más potentes, pero esa tampoco es la intención: se trata de contar con una tarjeta “suficientemente buena” para PCs corporativos, administración y usos ligeros de inteligencia artificial, sin necesidad de recurrir a hardware extranjero.
Faltan, por ahora, muchas piezas del puzzle. Loongson no ha detallado la microarquitectura de 3D7000, ni la jerarquía de caché, ni el número máximo de chiplets por socket, ni qué tipo de aceleradores específicos para IA o cifrado podrían integrarse más adelante. Tampoco está claro cuánto volumen se reservará para el mercado global y cuánto se quedará estrictamente dentro de China, donde el sector público y los gigantes de internet absorben buena parte de la demanda. Lo que sí parece evidente es que el país está construyendo, paso a paso, su propio stack de computación de alto rendimiento. Y aunque 3D7000 no vaya a coronar los rankings de rendimiento mundial, será otra pieza clave en ese objetivo y otra señal para el resto del mundo de que el juego de los procesadores de servidor ya no se decide solo en Silicon Valley y Hsinchu.
4 comentarios
en potencia pura igual se queda a nivel de EPYC viejos, pero para data centers internos en China eso es un salto brutal comparado con lo que tenían
gracioso cómo algunos llevan años anunciando el colapso de China mientras ellos van sacando chips y fabs sin parar, el cope está fuerte
lo de sub 10 nm suena precioso en la slide, pero si al final es un 12 nm vitaminado ya me imagino el rack en modo estufa de 400W jaja
hace nada todo el mundo se reía de Loongson y ahora van solo unos añitos por detrás de los grandes, el sprint que se han pegado es bastante loco 😂