Semiconductores: ¿Por qué hay problemas de suministros de componentes?
Si te has intentado comprar algún equipo en los últimos meses, seguro que has tenido que esperar un poco más de lo habitual porque no había stock de alguno de los componentes. Hay una escasez de muchos componentes semiconductores, y muchos fabricantes han tenido que hacer verdaderos malabares para poder lidiar con estos problemas.
Pero ¿cuáles son las causas? ¿es simplemente por la pandemia? ¿hay algo más que no nos están contando? ¿se debe a guerras geopolíticas? ¿es un simple caso de «chip famine»? Vamos a analizar todo lo que está ocurriendo poco a poco, ya que es un poco complejo y se debe a más motivos de los que imaginas…
ÍNDICE:
¿Qué es chip famine?
Una «chips famine» (literalmente «hambruna de chips»), o semiconductor shortage, es un fenómeno que suele ocurrir en la industria de semiconductores cada cuatro años aproximadamente. Se debe especialmente a que la demanda de chips supera la oferta, aunque en ocasiones también puede haber una falta de circuitos integrados por otras causas.
Esta escasez suele ocurrir también cuando se producen cambios sociológicos, catástrofes naturales en zonas donde se concentran las industrias semiconductoras, pandemias, guerras, etc. También las primeras tiradas de nuevos chips suelen tener este problema, ya que cuando se lanzan al mercado, no suele haber suficiente stock.
Y a lo largo de la historia ha habido algunas importantes:
- 1986: por un pacto para promover la industria norteamericana frente a la japonesa. En este acuerdo se prohibía a los asiáticos vender productos por debajo del coste (dumping). Eso produjo fuertes recortes en la industria nipona, y las americanas tampoco lograron despegar debido a los altos costes y al riesgo.
- 1988: fue debida a la llegada de nuevas tecnologías al sector de semiconductores que hizo que las fábricas no estuvieran actualizadas a tiempo. Eso obligó a algunos trabajadores a suspender sus vacaciones veraniegas y trabajar a destajo para devolver la normalidad, como los de las factorías Hitachi. Los problemas de suministros de chips SRAM y DRAM obligaron incluso a retrasar el videojuego Zelda II: The Adventure of Link.
- 1993: los chips DRAM para los módulos de memoria también escasearon en este año. El motivo fue una explosión de una fábrica de resina que producía el 60% de la producción mundial necesaria para la industria semiconductores.
- 1994: vino otro caso importante, y fue debido a un cambio en los procesos de fabricación. Se necesitaban salas limpias (clean rooms) más limpias de lo que se usaba hasta la fecha y muchos lotes de productos se tuvieron que descartar por problemas de fabricación.
- 2000: Intel sufría una en ese caso, el IDM se encargó de satisfacer a sus clientes mayoritarios, mientras que los minoristas tuvieron problemas de escasez. Algunos de sus clientes habituales optarían por cambiar a AMD.
- 2004: cuando surgieron nuevos tipos de chips CDMA para el sector móvil.
- 2007: la Nintendo Wii también acusó escasez debida a la falta de producción de los circuitos integrados necesarios.
- 2011: debido al terremoto en Japón, donde se fabricaban la mayoría de chips de memoria NAND y pantallas, también hubo serios problemas para las tarjetas de memoria.
- 2012: Qualcomm también anunció un problema de escasez en sus chips Snapdragon, y por tanto, muchos dispositivos móviles se quedaron sin ellos. El problema se debía a la falta de instalaciones en las foundries para fabricar en nodo de 28nm.
- 2013: un incendio en la fábrica de SK Hynix, uno de los mayores productores mundiales de chips de memoria, produjo escasez en RAM. En ella se concentra un alto porcentaje de la producción, junto con Samsung y Micron Technology.
- 2020-2023: se han alineado todas las posibles cosas que podían salir mal para producir una de las peores «chips famine» de la historia, afectando a múltiples productos, desde chips para consolas, microprocesadores, tarjetas gráficas, memorias, chips 5G, etc. Por ejemplo, se han visto afectadas las nuevas tarjetas gráficas NVIDIA GeForce RTX 3000-Series, las AMD Radeon RX 6000-Series, las consolas Microsoft Xbox Series X y Sony PlayStation 5 (ambas con chips AMD), también chips de Intel, etc. Eso impactaba directamente en los fabricantes de computadores pre-ensambladas de sobremesa y portátiles como Slimbook, Dell, HP, ASUS, Acer, Lenovo, MSI, y un largo etc., que veían cómo les llegaban suministros con cuentagotas. En el caso de AMD, se aprovechó algunas «bajas» de clientes de TSMC para obtener una mayor cuota de obleas en producción, pero esa aceleración solo afectaría a los chips dirigidos a videoconsolas (debido a su éxito de ventas). Por ejemplo, la baja de Mediatek, debida a las guerras geopolíticas entre EE.UU. y China, hizo que AMD pudiera ocupar 13K de obleas/mes de 7nm más.
Ten en cuenta, que aunque estos problemas solo afecten a una región, dicha región puede ser la que suministre componentes de los que dependen otras regiones para sus productos.
A veces son tan preocupantes que han impulsado a los fabricantes a cambiar de proveedor o a rediseñar sus productos para evitar usar los componentes de los que se carece. Otros han hecho una especie de paper-launch, con unidades limitadas de sus novedades. Incluso, en casos extremos, al relanzamiento de productos de versiones anteriores que ya habían entrado en EOL (End-Of-Line, es decir, que ya llegaron al final de su producción por la previsión de un predecesor) por la imposibilidad de suministrar los nuevos.
2020-2021: escasez de semiconductores en detalle
El SARS-CoV-2 ha tenido parte de la culpa, porque las fabricas no han podido funcionar al 100% en algunos casos, y por todos los cierres de fronteras y problemas de logística generada por la pandemia. Pero no ha sido lo único que ha generado problemas, así que si pensabas que la Covid-19 fue la única culpable te equivocas y mucho…
De hecho, las foundries trabajan sin apenas personal, y las capacidades en muchos casos no se han visto mermadas demasiado, trabajando al 90% de sus capacidades.
También se conjugó ese problema con el lanzamiento de muchos productos nuevos, como he citado anteriormente. Eso hizo que la demanda de componentes subiera. Suma a los problemas por el virus se le agrega a las novedades en en ámbito doméstico, HPC, consolas de juegos, etc., el incremento de la demanda de productos tecnológicos debidos al confinamiento, teletrabajo, educación a distancia, etc.
El resultado no solo es el retraso en las entregas, también afectó a otras industrias dependientes de los chips, como el sector del automóvil. Por ejemplo, SEAT (también el Gurpo Volskwagen y otros fabricantes alemanes) se vio afectada por la escasez de suministro de semiconductores, teniendo que frenar la producción de vehículos e incrementar el coste. GM (General Motors) en EE.UU. también redujo a la mitad la producción en algunas de sus factorías, mientras Toyota anunció en Japón que bajaría la producción un 40%. Otros fabricantes como Honda (ídem para otros japoneses y de otros países) tampoco han podido esquivar este problema, anunciando que reducirían la producción debido a que se había quedado sin semiconductores para los sistemas de control de sus coches. La producción bajaría en 400 unidades/mes, pero a partir de febrero de 2021 la situación sería aún más insostenible, pudiendo llegar a decenas de miles menos en Japón.
Fabricantes que abastecen a este sector (Samsung Electronics, NXP Semiconductor, STMicroelectronics, SMIC, TSMC, Freescale, UMC, VIS, TI, DB HiTek,…) no daban a basto, como tampoco lo daban para satisfacer a otros sectores. Además, muchos optaban por aumentar los precios de los productos, lo que tampoco era una ayuda para la difícil situación.
También se han visto afectados por esta «hambruna de chips» los chips NAND, por lo que todos los componentes de almacenamiento dependientes de ellos, como los SSD, se han visto afectados en cuanto a cantidad de stock e incremento de precios. Algo parecido le ha ocurrido a los paneles para pantallas, con las factorías de LG y Samsung sin dar a basto para crear pantallas OLED para smart Tvs y dispositivos móviles…
Intel y AMD también han tenido que rediseñar sus estrategias y dar también cobertura a la demanda de chips HPC para centros de datos, restando algo a los chips para consumo. ¿Motivos? Debido a la pandemia, servicios como Netflix, Youtube, Amazon Prime, etc., se han disparado, lo que ha obligado a estas empresas a ampliar sus centros de datos.
Desde el lado del consumo se veían caídas del 30% en las ventas debido a esas faltas de stock, en el caso de algunas compañías, como ASUS, llegaron al 40%. En definitiva, un caos como jamás lo ha habido en la industria de los semiconductores…
Componentes conflictivos
Algunos componentes semiconductores están acusando mayor escasez que otros. Si se analiza esto se llega a la conclusión de que los mayores problemas radican en:
- Controladores PWM: esto afecta a componentes que sirven para construir placas base y tarjetas gráficas, ya que son los chips encargados de regular la alimentación que llega a los ventiladores de la GPU y CPU cuando se necesita que trabajen a mayor o menor RPM. Las tarjetas gráficas se han visto más perjudicadas que ningún otro componente, ya que no todos los controladores PWM sirven. Por ejemplo, en el caso de AMD se emplean los de la marca alemana Infineon.
- Chips de monitorización: también escasean y afectan a la producción de tarjetas gráficas y placas base, ya que hasta que no se reciben todos los componentes, no se puede comenzar con la producción. En este caso, son elementos encargados de medir la temperatura de la CPU/GPU y voltaje de diferentes elementos.
- VRAM: los ICs de GDDR y HBM también han tenido problemas de suministro, por lo que tampoco se han podido ensamblar las tarjetas gráficas. Micron es uno de los principales fabricantes de memoria, especialmente de ciertos tipos como la GDDR6/GDDR6X, lo que también ha generado un cuello de botella similar al de TSMC.
- PSU: esto afecta al ensamblado de PCs, ya que la demanda por los mineros de criptomonedas ha hecho que también haya escasez de fuentes de alimentación destinadas a entusiastas (no tanto en entry y mainstream), es decir, en el high-end con alta potencia.
- Flash NAND: la memoria ya lleva arrastrando escasez desde 2019, y con la actual situación no ha hecho más que empeorar. Por eso, se avecina una subida de precios en los medios de almacenamiento.
- Unidades de procesamiento: ha habido también algunos problemas, aunque en menor medida, de unidades de procesamiento, como CPUs y GPUs. La producción no ha cesado, pero han ido llegando en menor medida.
Por otro lado, también hay problemas de suministro con los sustratos necesarios para el packaging de los chips. Nicholas Stukan, director de desarrollo de Zhuhai Access Semiconductor, una empresa del sur de China dedicada afabricar sustratos aseguró: «Ahora lo único que tienes que hacer es decir que fabricas sustratos y ya tienes un negocio hecho. Es una locura«.
Los materiales que se emplean para fabricar estos sustratos pueden variar según el uso, pero habitualmente son compuestos a base de resinas, vidrio, policarbonatos, cerámicas (dióxido de silicio, óxido de aluminio,…), o polímeros.
El sustrato es una base, o lámina de material sólido, para ofrecer la estructura necesaria para el chip y aportar una interfaz mecánica y eléctrica entre el chip y el PCB. Sin sustrato no hay dispositivo terminado, y esto también está generando un problema añadido. La demanda actual es mayor que la oferta, especialmente para chips como los microprocesadores, GPUs, etc.
Binning
Seguramente has visto el término binning referenciado en algún documento sobre la industria de semiconductores. Y es otro factor que tampoco ayuda demasiado, y que está también muy ligado a otro término: el yield. En cualquier caso, es algo que evita que todas las unidades fabricadas se puedan llegar a comercializar, o no en los mismos términos.
Explicado de una forma rápida, el yield es el rendimiento de producción que se le puede sacar a cada oblea. Se consigue al dividir el número de dados por oblea que son válidos entre los dados totales que alberga la oblea. Por ejemplo, si tienes una oblea con 300 dies y hay que descartar 44, entonces 256/300=0.85 (85%). Esto se puede aplicar tanto a nivel de wafers, como de dice, para el proceso de packaging, y los que pasan las pruebas burn-in. Cuando se debe descartar un die se habla de caso catastrófico y cuando no funciona como se esperaba, pero funciona, se habla de una pérdida paramétrica.
Ten en cuenta que cuando se fabrica un chip se realiza en obleas (wafers) que integran muchas unidades supuestamente iguales. Pero lo cierto es que no son 100% idénticos, ya que durante las diferentes etapas de fabricación puede haber ciertas imperfecciones (problemas de corte, concentración de impurezas, imperfecciones en las interconexiones, transistores mal formados, residuos o suciedad,…) que hará que todos los chips no se comporten igual, e incluso que algunos de ellos no funcionen en absoluto y se deben desechar del lote.
Algunos de los chips fabricados puede que tengan partes inservibles o núcleos que se deben desactivar, otros que pueden funcionar con unos ciertos valores de voltaje y frecuencia de forma estable pero no aceptan que se reduzca el voltaje o se aumente la frecuencia (o ambos), etc. Si lo recuerdas, es algo que comenté cuando publiqué sobre el overclocking y también sobre las marca.
Por eso, cuando se fabrica una oblea, se realizan una serie de tests para generar un mapa y determinar qué troqueles se deben descartar, para poder clasificarlos (binning), etc.
Durante ese binning puede servir al fabricante para etiquetar sus productos de una u otra forma teniendo en cuenta los resultados de estos chips de todos los dados que funcionan. Es por eso que, con una misma microarquitectura y tipo de troquel se pueden sacar varias marcas diferentes por ejemplo los Celeron, Pentium, Core i3, Core i5, Core i7, o Athlon, Ryzen 3, Ryzen 5, y Ryzen 7. Por esto también te puede tocar un procesador de los mejor formados y el margen para hacer overclocking sea superior a otro producto etiquetado bajo la misma especificación…
Dicho de otro modo, y aunque te suene extraño, pero un Celeron y Pentium no son más que que los chips menos afortunados de un wafer de chips Core i7; los que son un poco mejor que eso se marcan como Core i3; luego vendrían los Core i5, los que les funcionan más núcleos; y solo se marcarán como Core i7 los que tienen una cantidad máxima de núcleos funcionales, y no se les ha tenido de desactivar ninguno de fábrica debido a problemas de funcionamiento. También es el mismo chip el Core i7 de la misma microarquitectura que trabaja a menor frecuencia y el que funciona a mayor frecuencia. Esto último tiene que ver con el test de estabilidad frecuencia/voltaje…
¡Ojo! Aunque esté centrándome en las unidades de procesamiento, se hace en otros muchos casos como la GPU, chips de memoria, etc. De hecho, las memorias flash tienen controladores de memoria que, además de poder balancear el desgaste de las celdas de memoria reasignando escrituras a bloques menos transitados, también pueden programarse para mapear las celdas de memoria que se fabricaron con defectos para evitarlas y así poder aprovechar chips con defectos.
De hecho, durante el binning, muchos fabricantes suelen seleccionar los «pata negra» para etiquetarlos como versiones especiales y venderlos más caros. Por ejemplo, esos designados con nomenclaturas tipo K, X, Black Edition, Gold Edition, etc.
Esos sí, no pienses que todos los productos son producto del binning. Por ejemplo, en el caso de AMD, los Ryzen 7, Ryzen 5 y Ryzen 3 basados en una misma microarquitectura pertenecen a un mismo troquel, mientras que los Threadripper y EPYC pertenecen a otro, también las APUs que integran GPU, etc. También ocurriría algo similar en el caso de Intel, como Celeron/Pentium/Core por un lado, mientras que los Xeon o los Atom serían diferentes.
La soledad de TSMC
Otro problema es que cada vez quedan menos IDMs, y cada vez existen más fabless que deben encargar la producción de sus chips a otras foundries. Además, solo algunas foundries (TSMC y Samsung) han podido seguir avanzando en cuanto a nodos de fabricación y están a la vanguardia. Eso ha generado un efecto de cuello de botella, ya que la mayoría de fabless quieren que sus chips sean competitivos y se fabriquen en estas dos factorías, ya que otras como UMC, GlobalFoundries, ST Microelectronics, etc., han quedado atrás.
Samsung y TSMC agrupan la mayoría de la producción de chips avanzados en la actualidad. Aunque Intel se resiste como IDM, otras como NVIDIA, AMD, Apple, Qualcomm, y un largo etc., dependen de terceros para fabricar. ¿Resultado? Pues, por ejemplo, TSMC cuenta con unos 500 clientes, algunos de la talla de Apple, NVIDIA, AMD, Qualcomm, HiSilicon (Huawei), Mediatek, Broadcom, Marvell, Alibaba, Amazon, Tesla, Google, Xilinx, Unisoc, etc., lo que significa que lleva a sus espaldas una enorme sobrecarga (afortunadamente no todos están en la línea de producción de nodo 5 o 7nm y wafers de 300mm).
EE.UU. ha perdido la batalla en este sentido. Ha pasado de liderar a estar bastante por detrás. Intel, la punta de lanza del país americano no termina de despegar, atascado en los nodos de 14nm/10nm durante demasiado tiempo, mientras que los coreanos y taiwaneses ya están comenzando la producción de 5nm. Algo que ha hecho que incluso el DoD tengan que encargar chips a TSMC por verse incapacitados de fabricarlos de forma competitiva en factorías nacionales.
En definitiva, TSMC tiene la línea de 7nm sobresaturada, y pronto lo estarán las fabs de 6nm y 5nm cuando comiencen a migrar muchos de los nuevos diseños de próximos lanzamientos hacia esas líneas de producción. De hecho, el acuerdo firmado en el contrato de Apple para usar la línea de 5nm para el M1 también perjudicará a los que quieran hacer uso de ella.
Para paliar esta saturación, algunas fabless están adaptando sus diseños a los procesos de fabricación de competidores como Samsung. Algo que no es nada barato. Por eso se entiende que estos problemas no serán pasajeros, algunos expertos apuntan a mediados del próximo año para salir de esta situación…
Para hacerte una idea, TSMC es el mayor fabricante de chips del mundo, una foundry pura que sostiene el 55% de la producción mundial en sus fabs. Después de TSMC le sigue Samsung, un IDM que también ofrece sus fabs a terceros para actuar como fundición de fabless. Tras la surcoreana vendría GlobalFoundries (ex fabs de AMD) y UMC en producción, aunque más distantes en cuanto a tecnologías de fabricación. El fabricante chino SMIC también sostiene un alto porcentaje de fabricación, aunque necesita también ponerse al día con los nodos.
Los problemas causados por el temporal de 2021 que han dejado a zonas de Texas aisladas y sin suministros no han contribuido. Recuerda que ese estado aglutina gran cantidad de fábricas, como algunas de Infineon, Samsung, NXP, etc.
Y como en una conjunción de eventos negativos, a todo esto hay que agregar el problema de las reservas de arena, cada vez más escasas al ser, junto con el agua, uno de los recursos más explotados (construcción, producción de vidrio, silicio,…). Esto no sería preocupante si no se hubiera cruzado la producción masiva de vacunas, que necesitan millones de botes de vidrio para distribuir las dosis, lo que ha disparado la demanda de este material…
En Taiwán también está habiendo problemas de sequía, y en una industria como la semiconductora, donde se pueden necesitar hasta varios miles de litros de agua por cada oblea producida, es una tragedia que se debe sumar a la lista.
Si en esta región hubiese un seísmo o cualquier otro desastre, la producción podría tener la estacada final… es el problema de ser tan dependientes y de aglomerar las industrias en zonas muy concretas en vez de distribuirlas.
EE.UU. se plantea un plan para poder salir de esa situación, y Europa, también en desventaja, invertirá para caminar hacia los 2nm y no tener esa fuerte dependencia. Si eso fuese así, más fuentes de fabricación aliviarían también la situación actual. Los mejor posicionados actualmente en Europa son ST Microelectronics seguida de la alemana Infineon.
En EE.UU. también se presiona al gobierno para que solucione la situación, aunque parece que Intel quiere tratos de favor para inyectar dinero en sus factorías. Por tanto, no se muy bien cómo terminará este asunto. Además, los problemas que los han mantenido atascados en los 10nm vienen del uso de estructuras de puertas exóticas y de nuevos materiales para los contactos, como el uso de cobalto para la puerta y primera capa metálica (M1).
Ese ansia por buscar mayor densidad y por solucionar sus problemas, ha generado otros que han terminado como todos saben. Además, las foundries suelen contar con dos equipos de trabajo. Uno trabaja para el actual nodo y otro para el desarrollo del futuro nodo. Me consta que en Intel ambos han estado trabajando a destajo para solventar estos problemas, lo que me hace pensar que su futuro nodo está muy atrasado. Así que… o dan un paso atrás hacia tecnologías más convencionales, o se les va a atragantar.
Movilidad y contenedores
La movilidad reducida por el Covid-19 no ha ayudado. Los vuelos comerciales han caído un 50% durante 2020 y principios de 2021. Eso significa que, aunque las factorías pudieran dar a basto, los materiales no se pueden llevar a su destino con normalidad.
Los barcos que transportan los contenedores de materiales se han negado en ocasiones a llevar la mercancía desde China a otros puertos, ya que las navieras no quieren devolver contenedores vacíos si no los paga alguien y prefieren recuperar lo perdido aprovechando hasta el último centímetro de carga de los barcos para mercancías que se paguen. Todos esos containers han quedado varados en puertos de Europa y EE.UU. sin volver a China (la fábrica del mundo), por lo que esta extraña escasez de contenedores para el transporte también ha generado un efecto mariposa.
En dos meses los 2000$ por envío de un contenedor pasaron a ser 12000$, según algunas fuentes que han alertado de ese incremento en algunos portes que han llegado a Reino Unido.
Guerras geopolíticas
No solo es culpa del SARS-CoV-2, las tensiones entre China y EE.UU. no han ayudado. Y, personalmente, creo que una vez Trump se haya ido de la Casa Blanca el problema NO se va a solucionar. Biden no es la solución a nada, siento decirlo.
De hecho, habrá que estar con un ojo puesto en lo que haga, ya que las relaciones entre Taiwan y EE.UU. dependen mucho de las relaciones entre EE.UU. y China. Recuerda que Taiwan tiene una tensa relación con China, por lo que si Biden mejora su relación con el gigante asiático, a Taiwan no le gustaría demasiado. Y es el territorio donde hay multitud de fábricas de semiconductores como TSMC, y también otras muchas de tecnología electrónica (ASUS, Acer, HTC, MSI, Foxconn, Gigabyte, etc.).
Pero independientemente de eso, ten en cuenta que algunos retrasos han venido propiciados por restricciones de EE.UU. a usar ciertas tecnologías que van desde licencias de software empleado en la industria semiconductora, hasta maquinaria y tecnología de fabricación de componentes, aranceles, y un largo etc.
Criptominería
No, lo cierto es que hay más problemas que no han hecho más que empeorar las cosas, como el incremento del interés por las criptomonedas. Los mineros de estas divisas han aumentado la demanda de GPUs empleadas para esta tarea, por lo que eso le ha restado cantidad de unidades disponibles para otros sectores…
Tal es el problema que NVIDIA se ha planteado bloquear las tarjetas gráficas que se estén empleando para minería. Una medida para paliar la escasez que no parece seguir AMD, quien ha dado la venta para minería como ventas lícitas. De hecho, si NVIDIA diese el paso y las bloquease mediante telemetría a través de sus drivers, sería bastante escandaloso, ya que el fabricante estaría decidiendo para qué se puede emplear un producto.
Actualmente, NVIDIA también ha diseñado un chip GPU específico para minería, aunque personalmente no veo como ésto pueda ayudar a paliar estos efectos, ya que este chip tendrá que ser fabricado en las mismas factorías de TSMC. ¿Entonces? No puedes cargar a la saturada foundry con más producción, por lo que se entiende que se deberían restar obleas de GPUs normales para dejar hueco a estas otras. Eso significa que estamos en las mismas…
Pingback: IDM vs Fabless: comparación de los modelos, ventajas y desventajas