NVIDIA risponde alla grande domanda di microchip di IA triplicando la produzione di chip H100

TSMC stima che la domanda di chip di IA per server crescerà di circa il 50% annuo per prossimi 5 anni.

Nvidia, leader nella progettazione di microprocessori e schede grafiche, ha annunciato l’intenzione di triplicare la produzione dei propri ambìti chip H100 per venire incontro alla crescente domanda del mercato.

L’esplosiva domanda di chip Nvidia per progetti di intelligenza artificiale sta segnando in modo incisivo il mercato dei componenti informatici. I livelli della domanda di questi prodotti così specializzati stanno facendo sì che i server convenzionali stiano perdendo protagonismo visto che le imprese e i provider di servizi in cloud vogliono ora potenziale la propria infrastruttura IA.

Triplicare la produzione

Fonti vicine alla società rivelano che Nvidia ora ha in programma di aumentare in modo massiccio la produzione di chip H100. Per il 2024, la produzione dovrebbe raggiungere gli 1,5-2 milioni di unità, il che vale un impressionante incremento rispetto ai 500 mila che dovrebbero prodursi nel 2023. Il chip H100 è uno dei più potenti nel segmento IA e la triplicazione della capacità produttiva rispecchia l’impegno di Nvidia verso la domanda mondiale.

TSMC, il colosso produttore di chip che lavora con Nvidia, stima che la domanda di chip di IA per server dovrebbe crescere di circa il 50% annuo nei prossimi 5 anni. Nonostante questa crescita, la domanda non potrà compensare completamente le sfide economiche attuali.

Cambio di approccio nel cloud

Negli Stati Uniti, i principali attori del settore cloud, come Microsoft, Amazon e Google stanno variando il proprio approccio verso l’infrastruttura IA. Questo a portato ad un calo della spesa in infrastrutture convenzionali, che dovrebbe crescere solo dell’8% quest’anno contro il 25% del 2022. L’inflazione ha poi avuto un ruolo non di secondo piano in queste dinamiche.

Tuttavia, la trasformazione da server tradizionali a server con IA non è così semplice. Gli esperti indicano che questo aggiornamento richiederà la sostituzione di vari componenti, non solo delle unità di elaborazione grafica (GPU). Le imprese dovranno fare i conti con complessità e con costi aggiuntivi in questa trasformazione, situazione che potrebbe erodere altri investimenti pianificati.

Investimento e crescita

Le previsioni indicano che la distribuzione globale di server convenzionali vivrà un calo del 6% quest’anno e solo una timida ripresa del 2-3% nel 2024. Questo si deve in parte al cambio di rotta intrapreso da aziende come Meta, che hanno ridotto l’investimento in server convenzionali per concentrarsi su hardware IA.

Una delle maggiori sfide sarà la produzione di memorie HBM, essenziali per i chip IA. Rallentamenti nella produzione di questi componenti, prodotti da società come SK Hynix e Samsung, dovrebbero perdurare fino a fine 2024, il che potrebbe ripercuotersi sulla disponibilità di chip specializzati.

La trasformazione dei data center

Oltre alla produzione di chip, la trasformazione verso server specializzati in IA investe l’infrastruttura dei data center. Questi server richiedono schede madre specifiche e rack più grandi per GPU più potenti. Inoltre, i sistemi di raffreddamento e le fonti di alimentazione dovranno essere adattate per gestire il calore generato dai chip ad alto rendimento.