DeepSeek V4 Pro: 1,6 трильйона параметрів за ціною, яка руйнує бізнес-модель OpenAI

Китайська лабораторія DeepSeek випустила дві моделі з відкритими вагами та підтримкою 1 млн токенів — і зробила це за $1,74 за мільйон токенів на вході, тоді як конкуренти беруть у 10 разів більше.

24.04.2026, 14:49

83

Поділиться:

RazomUA - DeepSeek V4 Pro: 1,6 трильйона параметрів за ціною, яка руйнує бізнес-модель OpenAI — Ілюстративне фото: Depositphotos

24 квітня 2026 року DeepSeek опублікувала превʼю-версії двох моделей серії V4 — DeepSeek-V4-Pro та DeepSeek-V4-Flash. Обидві підтримують контекстне вікно до 1 мільйона токенів і розповсюджуються під ліцензією MIT, тобто будь-хто може завантажити, модифікувати й розгорнути їх комерційно.

Що всередині

V4-Pro — це 1,6 трильйона параметрів при 49 мільярдах активних. Flash — 284 мільярди загальних і 13 мільярдів активних. Обидві побудовані на архітектурі Mixture-of-Experts: модель не активує всі параметри одночасно, що дозволяє значно знизити вартість інференсу. За даними Hugging Face, у сценарії з контекстом у 1 млн токенів V4-Pro потребує лише 27% від обчислювальних витрат DeepSeek-V3.2 і 10% від розміру KV-кешу попередника.

Технічно це досягається завдяки гібридній увазі — комбінації Compressed Sparse Attention і Heavily Compressed Attention, яка суттєво підвищує ефективність на довгих контекстах. Для розробника чи аналітика це означає, що модель може обробити роман, кодову базу або корпус документів в одному запиті.

Бенчмарки: де обходить, де поступається

На практиці V4-Pro перевершує Claude Opus 4.6 на Terminal-Bench 2.0 (67,9% проти 65,4%) — бенчмарку реального автономного виконання команд із тригодинним тайм-аутом — і впевнено лідирує на LiveCodeBench (93,5% проти 88,8%). Водночас, за даними buildfastwithai.com, Claude утримує перевагу на SWE-bench Verified (80,8% проти 80,6%) і більш суттєву — на тестах фактологічної точності HLE та математичному HMMT 2026.

«V4 забезпечує продуктивність класу GPT-5 приблизно за 1/10 ціни»
NxCode, аналітичний огляд цінової політики DeepSeek API, квітень 2026

За словами незалежного дослідника Саймона Вілісона, який протестував обидві моделі через OpenRouter, V4-Pro є найбільшою відкритою моделлю на сьогодні — більшою за Kimi K2.6 (1,1T) і GLM-5.1 (754B) і вдвічі більшою за попередній DeepSeek V3.2 (685B).

Ціна, яка змінює рівняння

DeepSeek встановила такі тарифи API: Flash — $0,14 за мільйон токенів на вході та $0,28 на виході; Pro — $1,74 і $3,48 відповідно. Для порівняння: V4-Flash коштує у 12,4 разу дешевше, ніж Pro, при тому що на SWE-bench Verified відстає лише на 1,6 відсоткового пункту (79,0% проти 80,6%).

Для компанії, яка будує агентний воркфлоу — наприклад, автоматизований code review або аналіз тисяч документів щодня, — різниця у вартості токенів є не академічним питанням, а статтею бюджету. Аналітики NxCode підрахували, що R1 від DeepSeek обходиться у 27 разів дешевше за аналогічну reasoning-модель від OpenAI. V4 продовжує цю логіку.

Брукінгський інститут ще на початку 2025 року, після виходу DeepSeek-R1, зафіксував ширший структурний ефект: DeepSeek довела, що проривні моделі може будувати не лише Big Tech із необмеженим бюджетом, а команди, які системно оптимізують відкриті напрацювання. Компанія виросла з хедж-фонду, що використовував ШІ для торгових рішень, — і саме здатність до інженерної оптимізації, а не сирий капітал, стала її конкурентною перевагою.

Відкритість як стратегія

Ліцензія MIT означає, що будь-яка компанія може взяти V4-Pro (865 ГБ на Hugging Face) або Flash (160 ГБ) і розгорнути власний інфраструктурний стек — без роялті та залежності від API стороннього постачальника. Це прямий виклик закритим моделям OpenAI й Anthropic, монетизація яких побудована саме на API-доступі.

Разом із тим DeepSeek офіційно застерігає: моделі виходять у статусі preview, чат-шаблон у форматі Jinja відсутній, а старі точки доступу deepseek-chat і deepseek-reasoner будуть повністю вимкнені 24 липня 2026 року.

Якщо V4-Pro у повній версії підтвердить бенчмаркові результати preview — і якщо Unsloth або інші команди випустять квантизовані варіанти, придатні для локального розгортання на споживчому залізі, — питання полягає не в тому, чи зміниться ринок корпоративного ШІ, а в тому, скільки часу залишиться у закритих провайдерів, перш ніж цінова різниця у 10 разів стане для їхніх клієнтів неприйнятним аргументом на користь лояльності.

Новини світу

1

Митниця, бренд одягу, фото в Vogue Italia — як знайти професію серцем. Дар'я Найдюк

2

Білогородка підписала меморандум з МСОР — 11 захисників вже отримують протезування

3

Жив швидко, любив сильно, воював поруч зі своїми. Офіцер Сергій Піщалка

4

Пасхальне перемир'я Путіна, удари по Новоросійську і тіньовий флот Росії — дайджест тижня

5

Американські протези для українських воїнів: як MCP повертає людей до життя

Політика

Естонська розвідка: Росії нема сенсу відкривати Балтійський фронт — але саме це робить її небезпечною

Полковник Антс Ківісельг не виключає нового фронту не тому, що бачить ознаки підготовки, а тому, що Кремль уже довів: раціональний аналіз — ненадійний інструмент прогнозування.

29 хвилин тому

Технології

П'ять областей, де оптоволокно вже не розкіш: Мінцифра назвала лідерів підключення

Енергонезалежний інтернет на базі xPON охоплює дедалі більше українських домівок. Які регіони вирвалися вперед — і що це означає для решти країни.

1 годину тому

Бізнес

Серцево-судинні ліки за е-рецептом: чому держава вирішила розширити «Доступні ліки» саме зараз

З серпня 2025 року до програми реімбурсації додадуть понад 30 нових діючих речовин, зокрема препарати для серця та судин. Паралельно всі аптеки країни вперше зобов'язані приєднатися до програми.

1 годину тому

Поїхав на чужому авто до Хмельницького — і там його знайшли

Пащинський скасував тарифні рішення Ірпіньводоканалу: що стоїть за цим розпорядженням

Заступниця поштового відділення привласнила пенсії 23 людей: як схема «списання у видаток» обходить контроль

DeepSeek V4 Pro: 1,6 трильйона параметрів за ціною, яка руйнує бізнес-модель OpenAI

Що всередині

Бенчмарки: де обходить, де поступається

Ціна, яка змінює рівняння

Відкритість як стратегія

Новини світу

Цифрова революція в Німеччині: як технології та закон вивели ескорт-індустрію з «тіні»

Брудне розлучення: США виходять із ВООЗ і лишають $260 млн боргу — що це означає для здоров’я й безпеки України

Пара окулярів Макрона підняла акції майстерні iVision Tech на 30% — що за цим стоїть

Митниця, бренд одягу, фото в Vogue Italia — як знайти професію серцем. Дар'я Найдюк

Білогородка підписала меморандум з МСОР — 11 захисників вже отримують протезування

Жив швидко, любив сильно, воював поруч зі своїми. Офіцер Сергій Піщалка

Пасхальне перемир'я Путіна, удари по Новоросійську і тіньовий флот Росії — дайджест тижня

Американські протези для українських воїнів: як MCP повертає людей до життя

Естонська розвідка: Росії нема сенсу відкривати Балтійський фронт — але саме це робить її небезпечною

П'ять областей, де оптоволокно вже не розкіш: Мінцифра назвала лідерів підключення

Серцево-судинні ліки за е-рецептом: чому держава вирішила розширити «Доступні ліки» саме зараз

Без транспондера над Балтикою: чому Росія свідомо сліпить цивільну авіацію

НБУ вперше назвав 13 страховиків «значимими» — тепер вони мусять реформувати управління до кінця року

Молдова вийшла з енергетичного НС: лінія, знищена російськими дронами, запрацювала за п'ять днів

Не пропустіть важливе