
Le Modèle R1 de DeepSeek Bouleverse les Actions Technologiques et le Marché de l'IA
Un récent développement en intelligence artificielle a pris le monde d'assaut : le modèle R1 de la startup chinoise DeepSeek. Dévoilé le 23 janvier 2025, ce modèle open-source de raisonnement en IA a provoqué une onde de choc dans l'industrie technologique, impactant notamment les valeurs boursières.
Le modèle R1 de DeepSeek se distingue par ses 685 milliards de paramètres, démontrant une performance égale ou supérieure à celle des modèles de géants de l'IA tels qu'OpenAI et Anthropic. L'un des traits marquants de ce modèle est sa rentabilité. Formé à une fraction du coût des modèles propriétaires, il offre une API 90 % moins chère que celle d'OpenAI, avec des tokens d'entrée et de sortie à 0,55 $ et 2,19 $ par million de tokens, respectivement.
L'impact du modèle R1 a été si significatif que plusieurs géants de la technologie ont vu leurs parts de marché notablement diminuer. NVIDIA a subi une baisse de 18 %, Microsoft a connu un déclin de 7,5 %, les actions de Broadcom ont chuté de 11 %, et Siemens Energy a connu une baisse de 17,8 %. Ces changements soulignent le potentiel disruptif du modèle sur le marché technologique.
IoT Analytics identifie les utilisateurs finaux et les fournisseurs d'applications d'IA comme principaux bénéficiaires du modèle R1. Ils louent les avantages économiques et l'efficacité qu'apporte le modèle. En revanche, les fournisseurs de modèles propriétaires pourraient souffrir face à la concurrence ouverte posée par l'innovation de DeepSeek.
Les rapports sur le coût de développement du modèle R1 dépassent les 5,5 millions de dollars, bien que des débats persistent sur le coût total véritable en tenant compte du matériel et de la R&D. Ses avantages technologiques tirent parti de plusieurs méthodes innovantes, notamment l'architecture mixture de spécialistes (MoE), les techniques d'apprentissage par renforcement et l'optimisation minutieuse du matériel.
Bien qu'ouvert, le modèle de DeepSeek n'adhère pas pleinement aux standards OSI. Cependant, il permet une accessibilité supérieure comparée aux autres options du marché, avec des versions plus petites allant de 1,5 milliard à 70 milliards de paramètres disponibles pour téléchargement. Ces modèles ont déjà été téléchargés plus d'un million de fois sur des plateformes comme HuggingFace.
Des spéculations entourent également les pratiques de DeepSeek alors que Microsoft a lancé une enquête sur l'éventuelle utilisation de données d'OpenAI lors du développement de R1. Il y a actuellement peu de détails confirmatoires, mais la controverse ajoute une autre couche de complexité à l'histoire de DeepSeek.
L'effet d'entraînement du modèle R1 positionne différemment divers acteurs le long de la chaîne de valeur de l'IA. Les utilisateurs finaux, les fournisseurs d'applications GenAI et les entreprises concentrées sur l'IA à la périphérie et l'informatique d'edge se trouvent avantagés. Avec des modèles plus petits et moins exigeants, ces derniers peuvent capitaliser sur l'accessibilité de l'IA sur du matériel moins puissant. Cependant, les entreprises de puces AI pourraient rencontrer des défis car des modèles plus efficaces pourraient réduire la demande de matériel.
Néanmoins, les prévisions concernant les dépenses mondiales pour l'IA générative restent optimistes. Les analystes prévoient un taux de croissance annuel composé de 52 % jusqu'en 2030. Dans un contexte plus large, le modèle R1 de DeepSeek pourrait continuer à favoriser l'innovation au bénéfice des utilisateurs finaux, s'alignant sur la vision de Philipp Wegner selon laquelle DeepSeek représente un phare de l'évolution technologique.