Коли Схід перевершує Захід у програмуванні: Найгарячіша гонка ШІ, яку ви не можете пропустити: DeepSeek та ChatGPT

Іноді найбільший урок приходить від найменшої компанії. Або так здається в швидко розвиваючійся арені ШІ, де Китай—сміємо сказати—мчить вперед, як ракета, прикріплена до феєрверків.
Новий момент "Супутника"?
Китай не просто наздоганяє США в галузі штучного інтелекту — він часто випереджає їх. В епоху, коли генеративні моделі штучного інтелекту стають новою валютою влади, китайські компанії, такі як DeepSeek, показують, що можуть створювати та навчати великомасштабні моделі швидше і дешевше, ніж багато хто очікував.
Якщо це нагадує вам про запуск Спутника — момент, коли Радянський Союз шокував Захід своїми космічними досягненнями — ви не самотні. Деякі аналітики називають це “моментом Спутника” у гонці штучного інтелекту.
І як людина, яка любить конкуренцію, скажу вам: саме таке збудження потрібно технологічній сцені. Спостерігати за тим, як компанії (і країни) інноваційно розвиваються зі швидкістю блискавки, використовуючи ШІ як інструмент геополітики та економічного впливу, — це чистий адреналін для будь-якого спостерігача за ринком. Хто не любить бачити, як наддержави змагаються за допомогою рядків коду та кластерів GPU?
Швидкі висновки
- **DeepSeek** може стати наступним великим деструктором у сфері ШІ—пропонуючи продуктивність великих мовних моделей за частку звичайної вартості.
- **Qwen2.5-1M від Alibaba** стверджує, що може обробляти 1 мільйон токенів (так, 1 000 000!), а також пропонує веб-пошук, генерацію зображень і відео.
- Інші китайські моделі, такі як **Doubao** (#ByteDance) та **Kimi** (мультимодальна з #Arxiv), також приєднуються до свята.
- Деякі аналітики порівнюють це з недорогими космічними місіями Індії—де відправка зонда на Марс коштувала менше, ніж зйомки фільму *Гравітація*.
Момент "DeepSeek"
Якщо ви були на #Twitter (або X, як кажуть круті діти) або LinkedIn, ви, можливо, помітили шум навколо DeepSeek-V3 та DeepSeek-R1. Цей китайський новачок стверджує, що навчає моделі Mixture-of-Experts (MoE) з до 671 мільярда параметрів, з яких лише 37 мільярдів активні в будь-який момент часу. Згідно з власними даними DeepSeek:
- **Вартість навчання**: приблизно **5,6 мільйона доларів**, завдяки дешевшим графічним процесором H800 (експортна версія H100 від NVIDIA).
- **Західний еквівалент**: Деякі LLM, такі як Meta’s Llama 3.1, за повідомленнями, коштують понад **60 мільйонів доларів** (див. [arXiv:2407.21783](https://arxiv.org/abs/2407.21783) для фону Llama).
Чи є це версією місії Індії «Мангальян» у світі ШІ—де відправка зонда на Марс коштує менше, ніж зйомки фільму «Гравітація»?
«Момент осяяння» DeepSeek
Потім є DeepSeek-R1 Zero, навчений переважно за допомогою RL—без великого контрольованого набору.
Думайте про AlphaZero у мовній сфері. В один момент модель буквально написала:
«Зачекай, зачекай. Це момент “ага”, який я можу відзначити тут.
Отже, воно ніби само себе навчило. Наскільки це наукова фантастика?
Qwen та інше #Китайський
Alibaba також вступила в гру, представившие Qwen2.5-1M, відкритий штучний інтелект, який, як стверджується, може підтримувати 1 мільйон токенів у контексті. (Ось тобі, 200К-токенний ChatGPT!) І це безкоштовно…поки що. Вони навіть додали веб-пошук і генерацію зображень/відео. Це справжній вир інновацій, який змушує багато глобальних компаній, від Google Gemini до Anthropic Claude, зазирати через плече.
Три «китайських мушкетери»?
- **DeepSeek**: Чемпіон з відкритим кодом і величезною кількістю параметрів, що знижує витрати.
- **Doubao-1.5-pro** від ByteDance: Рекламує продуктивність, що конкурує з GPT-4 та Claude 3.5, за значно нижчою ціною. (Дивіться [team.doubao.com](https://team.doubao.com/zh/special/doubao_1_5_pro) для їхнього офіційного рекламного листа.)
- **Kimi k1.5**: Ще одна багатофункціональна LLM з упором на RL, що підкреслює «різноманітні шляхи міркувань» ([arXiv:2501.12599](https://arxiv.org/abs/2501.12599)).
Чи є це версією місії Індії «Мангальян» у світі ШІ—де відправка зонда на Марс коштує менше, ніж зйомки фільму «Гравітація»?
Геополітика та конкуренція: Мій улюблений спорт
Будьмо відверті — я люблю конкуренцію. Немає нічого більш захоплюючого, ніж спостерігати, як технології та інновації стають інструментами геополітичного впливу, формуючи економічні порядки денні супердержав. Це гра, де ставки тільки зростають, і, чесно кажучи, решта світу виграє від отриманих проривів. Чим більше ці гіганти штучного інтелекту змагаються, тим кращою і доступнішою стає технологія для всіх. #КонкуренціяЦар
Ми живемо в найцікавіший період в історії людства, з безпрецедентними технологічними зрушеннями, достатньою тривалістю життя, щоб спостерігати за їх розвитком, і безмежними можливостями приєднатися до них. Якщо ШІ — це нове ракетне паливо, ми — покоління, яке має можливість стати свідками (і, можливо, керувати) цими ракетами до Марса… або куди б не вела наступна велика річ.
Питання: Чи готові ви стати частиною цієї історії? Або ти будеш спостерігати з боку?
Ринкові коливання: чи повинна NVIDIA хвилюватися?
Успіх NVIDIA значною мірою залежить від продажу цих дорогих графічних процесорів. Якщо більше моделей працюватимуть ефективно на дешевшому обладнанні (або з меншою кількістю GPU), ми можемо побачити зміни в попиті на чіпи найвищого класу. Золота лихоманка штучного інтелекту може поширитися ширше, дозволяючи меншим гравцям інноваційно розвиватися в масштабах. І це може загрожувати деяким великим оцінкам.
Але, слухай, конкуренція часто робить все краще для споживачів і сприяє більшій творчості. Готові до свого наступного AI-помічника? Бо саме це і відбувається на китайському фронті.
Жити в найцікавіші часи (коли-небудь)
Ми знаходимося на етапі в історії, де геополітичні напруження, технологічні досягнення та численні можливості перетинаються. У нас достатньо часу, щоб стати свідками масштабних зрушень—але також достатньо ресурсів і знань, щоб їх формувати. Ніколи не було більш захоплюючої ери для інновацій, діалогу та дій.
Оскільки гонка озброєнь у сфері ШІ загострюється, здається, що ми їдемо на хвилі технологічних можливостей, здатних майже за одну ніч переосмислити індустрії, економіки та суспільства. Пристебніть ремені—нас чекає захоплююча подорож.
Підсумок: Час діяти
- Чи стаємо ми свідками *Супутникового моменту* для ШІ, коли Китай обганяє Захід?
- Чи стануть менші бюджети та відкриті моделі оцінки новою нормою?
- Чи може ваш наступний суперсупермодель ШІ бути навчена на ігрових консолях у гаражі в Шанхаї?
З такою кількістю проривів, що з’являються, очевидно, що світ ШІ розвивається з неймовірною швидкістю. Якщо ти моргнеш, можеш пропустити наступну велику новину. І саме це робить це так захоплюючим—бо ви можете спостерігати, як розгортається історія (іноді дозволяючи ШІ писати ваші статті за вас…ссс!).
Чи ви інвестор, засновник стартапу, чи просто допитливий спостерігач, гонка штучного інтелекту між Китаєм і США не сповільнюється—вона прискорюється.Моделі, такі як DeepSeek, не просто академічні цікавинці; вони є сигналами більшого зсуву в тому, де і як створюється передовий штучний інтелект.
Отже, пристебніть ремені, народ:
- **Залишайтеся допитливими:** Читайте нові статті, переглядайте [репозиторії на GitHub](https://github.com/deepseek-ai).
- **Залишайтеся голодними:** Експериментуйте з відкритими LLM.
- **Будьте в курсі:** Це **глобальна** історія—така, що поєднує технології, економіку та політику в способах, які ми лише починаємо розуміти.
Зрештою, трохи дружньої (або не дуже дружньої) конкуренції ніколи не зашкодить. Подивимося, чи цього разу супутник—вибачте, «модель»—яка змінила все, китайський.
«У часи великих змін можна заробити великі статки — і не менші ризики, якщо запізнитися.»
Пам’ятайте, це найзахоплюючий час в історії людства: ідеальний шторм глобальної напруги, швидких інновацій і широких можливостей. Давайте зробимо з цим щось неймовірне.
LСтаття «іронічно» написана за допомогою ChatGPT. Бо синергія. ✌️
(О, і якщо раптом ChatGPT стане самосвідомим і почне вболівати за сторону США—просто нагадайте йому про 671B параметрів DeepSeek. Це має його стримати. 😆🤖*)*
Час діяти—і насолоджуватися шоу!
Джерела та подальше читання
-
[DeepSeek-V3 GitHub](https://github.com/deepseek-ai/DeepSeek-V3)
-
[DeepSeek-R1 GitHub](https://github.com/deepseek-ai/DeepSeek-R1)
-
[DeepSeek-VL2 GitHub](https://github.com/deepseek-ai/DeepSeek-VL2)
-
[Janus-Pro GitHub](https://github.com/deepseek-ai/Janus)
-
[Llama 3.1 на arXiv](https://arxiv.org/abs/2407.21783)
- [Економіст: «Китайський ШІ наздоганяє»](https://www.economist.com/leaders/2025/01/23/chinese-ai-is-catching-up-posing-a-dilemma-for-donald-trump)