Une entreprise chinoise prête à rivaliser avec ChatGPT
DeepSeek, une entreprise chinoise, propose une solution d’apprentissage pour les intelligences artificielles à un coût bien inférieur à celui d’OpenAI, son concurrent américain. Avec des modèles de langage open source, DeepSeek se distingue par sa rapidité et son efficacité, suscitant l’intérêt des professionnels du secteur.
L’intelligence artificielle est un domaine en pleine expansion, englobant à la fois des applications pratiques et des enjeux théoriques, notamment à travers l’apprentissage des LLM (modèles de langage). Les préoccupations économiques et environnementales entourant le développement de ces technologies sont croissantes. DeepSeek entend répondre à ces préoccupations par une solution économique.
Plus rapide et moins cher
Avec l’augmentation des capacités des intelligences artificielles, les paramètres de leurs modèles de langage doivent croître pour rester pertinents et gérer des requêtes complexes. Par exemple, la version 3 de ChatGPT compte 175 milliards de paramètres et a nécessité plusieurs centaines de millions de dollars pour son développement. OpenAI, sa société mère, est souvent critiquée pour ses coûts exorbitants.
D’après Jim Fan, chercheur chez Nvidia, DeepSeek, basé à Hangzhou, est considéré comme « le plus grand outsider » pour 2025 dans le secteur des LLM open source volumineux, selon le South China Morning Post. En comparaison, DeepSeek V3, qui dispose de 671 milliards de paramètres, a été formé en seulement deux mois pour un coût de 5,58 millions de dollars américains.
Un modèle open source
En plus de son caractère économique, DeepSeek se positionne comme un modèle open source, ce qui lui permet de gagner en crédibilité auprès des professionnels. « DeepSeek V3 semble être un modèle plus puissant, avec seulement 2,8 millions d’heures GPU », a déclaré Andrej Karpathy, ancien responsable de l’IA chez Tesla et membre fondateur d’OpenAI. En comparaison, Llama 3.1 du groupe Meta a nécessité 30,8 millions d’heures GPU pour son entraînement.
« Je suis DeepSeek depuis longtemps. L’année dernière, ils ont eu l’un des meilleurs modèles de codage ouvert », indique Fan. Ces modèles open source devraient exercer une pression croissante sur le secteur, ce qui favorisera une évolution rapide.
Pour les intéressés, le modèle DeepSeek est accessible sur Hugging Face et sa documentation est disponible sur GitHub.
Le saviez-vous ? Google News vous permet de choisir vos médias. Ne passez pas à côté de Frandroid et Numerama.
Crédits
Virginie Majaux
"Virginie Mazaux" est un personnage fictif créé par l'équipe de Yourtopia.fr, symbolisant une passionnée de blogs et de réseaux sociaux née en 1992 à Bordeaux. Ce personnage, imaginé pour représenter une génération connectée et créative, a été conçu pour explorer et écrire sur diverses passions dans le monde numérique. Bien que "Virginie" ne soit pas une personne réelle, les articles publiés sous ce nom reflètent le travail collaboratif de notre équipe éditoriale, qui partage un intérêt commun pour la communication, l'innovation numérique et les tendances sociales. "Virginie", en tant que création de Yourtopia.fr, apporte une perspective unique et engageante sur les dernières évolutions dans le domaine des médias sociaux et du blogging, illustrant le parcours d'une blogueuse fictive depuis ses débuts jusqu'à la création de son propre blog et sa collaboration avec Yourtopia.fr.