Чому маленькі AI-моделі перемагають GPT-5

Опубликовано: 19 Май 2026
на канале: Ганна Пилєва: дивовижний data-світ

729

Безкоштовний міні-курс «Як увійти в ML з потенціалом ЗП до $12к/міс» 👉 https://www.dataloves.academy/mini-co...

У січні 2025-го китайський стартап DeepSeek показав: модель за кілька мільйонів доларів працює не гірше за ChatGPT. Ринок обвалився на мільярди. А модель на 14 мільярдів параметрів почала перемагати моделі, які в 5 разів більші. Ера «хто більший — той розумніший» закінчилась. Розбираємо, як це сталось і що це означає для вашої кар'єри.

Що дізнаєтесь у відео:

Чому Microsoft Phi-4 на 14 млрд параметрів обганяє DeepSeek-R1 на 70 млрд — і як це взагалі можливо
Три техніки, які роблять малі моделі розумнішими: дистиляція, квантизація та LoRА — простими словами
Як ціни на ШІ впали в 50 разів за 3 роки — і що це означає для бізнесу
Gemma, Llama, Phi — що відбувається у світі малих мовних моделей прямо зараз
Чому навички оптимізації моделей стають одними з найцінніших у 2025–2026 роках
Як індивідуальні розробники тепер можуть конкурувати з корпораціями завдяки RTX 4090 і QLoRA?

Таймкоди:

0:00 — DeepSeek обвалив ринок і запустив нову еру ШІ
0:41 — Ера «менше — краще»: серія Phi від Microsoft
0:53 — Phi-2 проти Llama-2: модель у 25 разів менша — розумніша
1:04 — Phi-3 Mini на iPhone без інтернету: ШІ у кишені
1:21 — Phi-4 Reasoning б'є DeepSeek-R1: результат на AIME — 78%
1:32 — Google Gemma 3N і Gemma 3: у 7 разів менша за флагман
1:59 — Meta Llama 3.2: менша вдвічі — розумніша за Mistral 7B
2:11 — Як це працює? Три головні техніки
2:27 — Техніка 1: Дистиляція знань — як DeepSeek насправді отримали
3:11 — Техніка 2: Квантизація — 87% менше пам'яті, 99% якості
3:43 — Техніка 3: LoRA — дотюнити модель без повного ремонту
4:14 — Обвал цін: з $20 до 40 центів за мільйон токенів
4:40 — Маршрутизація запитів: як економити 98% бюджету
4:59 — Енергоспоживання: різниця між малою і великою моделлю — у 83 рази
5:22 — Що це означає для вашої кар'єри в ML
5:44 — Малі моделі — майбутнє агентного ШІ (дослідження Nvidia)
6:05 — Навички оптимізації моделей стають найціннішими у вакансіях
6:21 — Демократизація ШІ: RTX 4090 і QLoRA проти корпорацій
6:31 — Підсумок: рої малих моделей — архітектура майбутнього

КУРСИ ТА НАВЧАННЯ
Курс "Аналітик даних в IT" 👉 https://www.dataloves.academy/courses...
Курс "Machine Learning для людей" 👉 https://www.dataloves.academy/courses...

📌 Підпишіться на канал для чесного розбору AI, Data Science та кар'єри в IT

💬 Напишіть у коментарях: яку малу модель ви вже пробували або хочете спробувати першою?