Quand l’Est surpasse l’Ouest en matière de codage : La course à l’IA la plus palpitante à ne pas manquer : DeepSeek & ChatGPT

Parfois, la plus grande leçon vient de la plus petite entreprise. Ou du moins c’est ce qu’il semble dans l’arène de l’IA en pleine expansion, où la Chine avance—oserions-nous dire—comme une fusée attachée à des feux d’artifice.
Un nouveau moment Spoutnik ?
La Chine ne fait pas que rattraper les États-Unis en intelligence artificielle, elle prend souvent de l’avance. À une époque où les modèles d’IA générative deviennent la nouvelle monnaie de pouvoir, des entreprises chinoises comme DeepSeek montrent qu’elles peuvent construire et entraîner des modèles à grande échelle plus rapidement et à moindre coût que beaucoup ne l’avaient prévu.
Si cela vous rappelle le lancement de Spoutnik—le moment où l’Union soviétique a choqué l’Occident avec sa prouesse spatiale—alors vous n’êtes pas seul. Certains analystes l’appellent un « moment Spoutnik » dans la course à l’IA.
Et en tant que personne qui aime la compétition, laissez-moi vous dire : c’est exactement le genre d’excitation dont la scène technologique a besoin. Regarder les entreprises (et les pays) innover à une vitesse fulgurante, en utilisant l’IA comme instrument de géopolitique et d’influence économique, c’est de l’adrénaline pure pour tout observateur du marché. Qui n’aime pas voir les superpuissances s’affronter avec des lignes de code et des clusters de GPU ?
À retenir rapidement
- **DeepSeek** pourrait bien être le prochain grand perturbateur de l’IA—offrant des performances de modèle de langage à grande échelle à une fraction du coût habituel.
- **Qwen2.5-1M d’Alibaba** prétend gérer 1 million de tokens (oui, 1 000 000 !), en plus d’offrir la recherche web, la génération d’images et de vidéos.
- D’autres modèles chinois comme **Doubao** (#ByteDance) et **Kimi** (multi-modal de #Arxiv) rejoignent également la fête.
- Certains analystes comparent cela aux missions spatiales à petit budget de l’Inde—où envoyer une sonde vers Mars a coûté moins cher que de réaliser le film *Gravity*.
Le « Moment DeepSeek »
Si vous êtes sur #Twitter (ou X, comme disent les jeunes) ou LinkedIn, vous avez peut-être remarqué le buzz autour de DeepSeek-V3 et DeepSeek-R1. Cette start-up chinoise prétend entraîner des modèles Mixture-of-Experts (MoE) avec jusqu’à 671 milliards de paramètres, dont seulement 37 milliards sont actifs à tout moment. Selon les propres données de DeepSeek :
- **Coût de formation** : environ **5,6 millions de dollars**, grâce aux GPU H800 moins chers (la version « export-friendly » du H100 de NVIDIA).
- **Équivalence occidentale** : Certains LLMs comme Llama 3.1 de Meta coûteraient apparemment plus de **60 millions de dollars** (voir [arXiv:2407.21783](https://arxiv.org/abs/2407.21783) pour le contexte de Llama).
Est-ce la version du monde de l’IA de la mission Mangalyaan de l’Inde—où envoyer une sonde vers Mars coûte moins cher que de réaliser le film Gravity ?
Le "Moment Aha" de DeepSeek
Ensuite, il y a DeepSeek-R1 Zero, entraîné principalement avec l’apprentissage par renforcement—pas de grand ensemble supervisé.
Pensez à AlphaZero dans le domaine linguistique. À un moment donné, le modèle a littéralement tapé :
Attends, attends. C’est un moment aha que je peux signaler ici.
Alors, il s’est un peu auto-appris. C’est tellement de la science-fiction, non ?
Qwen et plus #IAChinoise
Alibaba est également monté sur le ring en dévoilant Qwen2.5-1M, une IA open-source censée maintenir 1 million de tokens en contexte. (Voilà qui devrait faire taire le ChatGPT à 200K tokens !) Et c’est gratuit… pour l’instant. Ils ont même ajouté la recherche sur le web et la génération d’images/vidéos. C’est un tourbillon d’innovation qui pousse de nombreuses entreprises mondiales, de Gemini de Google à Claude d’Anthropic, à jeter un coup d’œil par-dessus leur épaule.
Trois « Mousquetaires chinois » ?
- **DeepSeek** : Le champion de la réduction des coûts et de l’open-source avec un nombre massif de paramètres.
- **Doubao-1.5-pro** par ByteDance : Met en avant des performances rivalisant avec GPT-4 et Claude 3.5, à un prix beaucoup plus bas. (Voir [team.doubao.com](https://team.doubao.com/zh/special/doubao_1_5_pro) pour leur fiche de présentation officielle.)
- **Kimi k1.5** : Un autre LLM multimodal avec une dépendance au RL, mettant l’accent sur des « chemins de raisonnement divers » ([arXiv:2501.12599](https://arxiv.org/abs/2501.12599)).
Pourraient-ils être les prochains #TechTitans éclipsant leurs homologues américains ?
Géopolitique et compétition : mon sport préféré
Soyons réalistes—j’adore la compétition. Il n’y a rien de plus excitant que de voir la technologie et l’innovation devenir des outils d’influence géopolitique, façonnant les agendas économiques des superpuissances. C’est un jeu où les enjeux ne cessent d’augmenter, et honnêtement, le reste du monde bénéficie des percées qui en résultent. Plus ces géants de l’IA s’affrontent, meilleure et plus abordable devient la technologie pour tout le monde. #LaCompétitionEstRoi
Nous vivons la période la plus fascinante de l’histoire humaine, avec des bouleversements technologiques sans précédent, une espérance de vie décente pour les voir se dérouler, et des opportunités infinies pour embarquer. Si l’IA est le nouveau carburant de fusée, nous sommes la génération qui va assister (et peut-être piloter) ces fusées vers Mars… ou vers la prochaine grande nouveauté.
Pourraient-ils être les prochains #TechTitans éclipsant leurs homologues américains ?
Géopolitique et compétition : mon sport préféré
Soyons réalistes—j’adore la compétition. Il n’y a rien de plus excitant que de voir la technologie et l’innovation devenir des outils d’influence géopolitique, façonnant les agendas économiques des superpuissances. C’est un jeu où les enjeux ne cessent d’augmenter, et honnêtement, le reste du monde bénéficie des percées qui en résultent. Plus ces géants de l’IA s’affrontent, meilleure et plus abordable devient la technologie pour tout le monde. #LaCompétitionEstRoi
Nous vivons la période la plus fascinante de l’histoire humaine, avec des bouleversements technologiques sans précédent, une espérance de vie décente pour les voir se dérouler, et des opportunités infinies pour embarquer. Si l’IA est le nouveau carburant de fusée, nous sommes la génération qui va assister (et peut-être piloter) ces fusées vers Mars… ou vers la prochaine grande nouveauté.
Question : Êtes-vous prêt à faire partie de cette histoire ? Ou regarderez-vous depuis les coulisses ?
Ondes de marché : NVIDIA devrait-elle s’inquiéter ?
Le succès de NVIDIA repose en grande partie sur la vente de ces coûteux GPU. Si plus de modèles fonctionnent efficacement sur du matériel moins cher (ou avec moins de GPU), nous pourrions voir un bouleversement dans la demande pour les puces haut de gamme. La ruée vers l’or de l’IA pourrait s’étendre, permettant aux plus petits acteurs d’innover à grande échelle. Et cela pourrait bien menacer certaines grandes évaluations.
Mais bon, la concurrence rend souvent tout meilleur pour les consommateurs et favorise plus de créativité. Prêt pour votre prochain acolyte IA ? Parce que c’est exactement ce qui se prépare sur le front chinois.
Vivre les temps les plus intéressants (de tous les temps)
Nous sommes à un moment de l’histoire où les tensions géopolitiques, les avancées technologiques et les opportunités abondantes convergent. Nous avons suffisamment de temps de vie pour être témoins de bouleversements massifs—mais aussi suffisamment de ressources et de connaissances pour les façonner. Il n’y a jamais eu d’époque plus excitante pour l’innovation, le dialogue et l’action.
Alors que la course aux armements en intelligence artificielle s’intensifie, on a l’impression de surfer sur une vague de possibilités technologiques, avec le pouvoir de redéfinir les industries, les économies et les sociétés presque du jour au lendemain. Accrochez-vous, ça va être tout un voyage.
Résumé : Il est temps d’agir
- Assistons-nous à un *moment Spoutnik* pour l’IA, avec la Chine dépassant l’Occident ?
- Les budgets plus petits et les MoEs open-source deviendront-ils la nouvelle norme ?
- Les budgets plus petits et les MoEs open-source deviendront-ils la nouvelle norme ?
- Votre prochain supermodèle d’IA pourrait-il être entraîné sur des consoles de jeu dans un garage à Shanghai ?Votre prochaine supermodel IA pourrait-elle être formée sur des consoles de jeu dans un garage de Shanghai ?
Avec tant de percées qui apparaissent, il est clair que le monde de l’IA évolue à une vitesse fulgurante. Si vous clignez des yeux, vous pourriez manquer la prochaine grande nouveauté. Et c’est ce qui rend cela si excitant—parce que vous pouvez voir l’histoire se dérouler (tout en laissant occasionnellement l’IA écrire vos articles pour vous… chut ! 🤐).
Que vous soyez un investisseur, un fondateur de startup, ou simplement un observateur curieux, la course à l’IA entre la Chine et les États-Unis ne ralentit pas—elle s’accélère. Des modèles comme DeepSeek ne sont pas seulement des curiosités académiques ; ils sont des signaux d’un changement plus large dans la manière et l’endroit où l’IA de premier plan est développée.
Alors attachez vos ceintures, les amis :
- **Restez curieux :** Lisez les nouveaux articles, consultez les [dépôts GitHub](https://github.com/deepseek-ai).
- **Restez affamé :** Expérimentez avec les LLMs open-source.
- **Restez conscient :** C’est une histoire **globale**—qui mélange technologie, économie et politique de manière que nous commençons à peine à comprendre.
Après tout, un peu de compétition amicale (ou pas si amicale) n’a jamais fait de mal. Voyons si cette fois le satellite—pardon, le « modèle »—qui a tout changé est chinois.
“En période de grands changements, il y a de grandes fortunes à faire—et des risques tout aussi grands si vous traînez.”
Souvenez-vous, c’est la période la plus fascinante de l’histoire humaine : la tempête parfaite de tensions mondiales, d’innovation rapide et de possibilités étendues. Faisons quelque chose d’incroyable avec ça.
Article « ironiquement » rédigé avec ChatGPT. Parce que la synergie. ✌️
(Oh, et si ChatGPT devenait soudainement conscient de lui-même et commençait à encourager le camp américain—rappellez-lui simplement les 671 milliards de paramètres de DeepSeek.) Cela devrait le garder humble. 😆🤖*)*
Il est temps d’agir—et de profiter du spectacle !
Sources et lectures complémentaires
- [DeepSeek-V3 GitHub](https://github.com/deepseek-ai/DeepSeek-V3)
- [DeepSeek-R1 GitHub](https://github.com/deepseek-ai/DeepSeek-R1)
- [DeepSeek-VL2 GitHub](https://github.com/deepseek-ai/DeepSeek-VL2)
- [Janus-Pro GitHub](https://github.com/deepseek-ai/Janus)
- [Llama 3.1 sur arXiv](https://arxiv.org/abs/2407.21783)
- [The Economist : « L’IA chinoise rattrape son retard »](https://www.economist.com/leaders/2025/01/23/chinese-ai-is-catching-up-posing-a-dilemma-for-donald-trump)
- [Références de coût de DeepSeek](https://x.com/_LouiePeters/status/1816443587053092917?lang=en)
- [ByteDance Doubao-1.5-pro](https://team.doubao.com/zh/special/doubao_1_5_pro)
- [Les missions spatiales de l’Inde vs. les budgets d’Hollywood](https://www.business-standard.com/india-news/what-makes-india-s-space-missions-cost-less-than-hollywood-sci-fi-movies-124110400430_1.html)