Le 19 avril 2026 (heure locale), des médias citant des sources proches du dossier ont révélé que Google, une filiale d'Alphabet, était en pourparlers avec Marvell Technology, une société américaine de conception de semi-conducteurs sans usine, pour développer deux nouvelles puces d'IA.L’objectif est d’exécuter plus efficacement les modèles d’intelligence artificielle, d’améliorer les performances d’inférence et de réduire les coûts de calcul.
La collaboration se concentre sur deux puces : premièrement, une unité de traitement de mémoire (MPU), qui fonctionnera en tandem avec les unités de traitement tensoriel (TPU) existantes de Google pour décharger les tâches de calcul gourmandes en mémoire, atténuant ainsi les goulots d'étranglement du TPU dans la bande passante mémoire et améliorant ainsi l'efficacité du système dans les scénarios d'inférence à haute concurrence.Les deux sociétés prévoient d'achever la conception et d'entrer dans la phase de production pilote dès 2027. Le second est un TPU dédié optimisé pour les scénarios d'inférence, dans le but d'atteindre un meilleur rapport coût-performance et de réduire le coût de calcul par réponse d'IA.L’accélérateur d’IA phare actuel de Google est le TPU v7 (nom de code Ironwood), et cette collaboration vise à optimiser davantage les performances d’inférence.
D'un point de vue stratégique, Google construit systématiquement une chaîne d'approvisionnement diversifiée pour les puces personnalisées, après avoir établi des partenariats avec des sociétés telles que Broadcom et MediaTek.L’ajout de Marvell porte le nombre de partenaires de conception de Google de deux à trois et introduit une nouvelle catégorie de puces : le MPU.Alors que le nombre d’utilisateurs de l’IA continue de croître, les coûts d’inférence sont devenus l’élément qui connaît la croissance la plus rapide des dépenses d’exploitation des centres de données.Google espère réduire ces coûts et améliorer le retour sur investissement de l'IA grâce à des puces personnalisées.
Marvell possède une vaste expérience dans le domaine des puces cloud personnalisées, ayant fourni des services de conception à des fournisseurs de cloud tels qu'Amazon, Microsoft et Meta.Dans ce partenariat, Marvell assumera un rôle de service de conception, similaire à son modèle de collaboration dans le projet Axion ARM CPU de Google.Récemment, Marvell a également conclu un partenariat stratégique avec NVIDIA, qui implique un investissement de 2 milliards de dollars et une intégration approfondie de ses puces et produits de réseau, renforçant ainsi la position de Marvell sur le marché des puces IA.
Les analystes du marché estiment que cette décision reflète un changement fondamental dans la stratégie de Google en matière de puces d’IA : une transition progressive de la priorité accordée aux performances de formation à l’accent mis sur l’efficacité de l’inférence, afin de relever les défis posés par la hausse rapide des coûts d’inférence.Cette collaboration marque une étape importante dans la stratégie diversifiée de Google dans le secteur des puces d’IA, visant à optimiser les performances d’inférence et à réduire les coûts opérationnels grâce à des puces personnalisées, renforçant ainsi son avantage concurrentiel dans le domaine des infrastructures d’IA.
E-mail : Info@ariat-tech.comTÉL HK : +852 30501966ADR : Rm 2703 27F Ho King Comm Center 2-16,
Fa Yuen St MongKok Kowloon, Hong Kong.