Що сталося
Міністерство цифрової трансформації повідомило, що навесні 2026 року розпочнеться бета‑тестування першої національної великої мовної моделі (LLM), яку навчають на унікальних українських даних. Технічним партнером проєкту виступив оператор Київстар, який фінансує розробку і передасть модель у державну власність.
"Україна навесні 2026 року запустить бета‑тестування першої національної LLM..."
— Мінцифра (повідомлення)
Технічна база та строки
Модель адаптують на базі відкритої LLM від Google — Gemma, під українську мову та локальний контекст. До тестування залучена незалежна група експертів, яка оцінюватиме технічну якість, етичність і відповідність до українських реалій. У січні заплановано завершення першої бази текстів, покращений токенізатор і систему оцінювання; навесні — початок публічного тестування. Назву для моделі мають обрати громадяни через голосування в застосунку «Дія».
Чому це важливо: безпека, мова, держпослуги
Це не просто технологічний проєкт — це елемент інформаційної та цифрової безпеки. Модель, навчена на локальних даних, краще розумітиме український контекст, специфіку мови й нормативно‑правові реалії, а отже може підвищити якість державних сервісів, автоматизованих відповідей і аналітики. Окрім того, наявність національної LLM зменшує залежність від іноземних сервісів у критичних сферах.
Джерела даних і контроль
Команда збирає терабайти даних не лише з відкритих джерел, а й із медіа, університетів та понад 90 державних установ — збір розпочався в грудні 2025 року. Паралельно розробляється юридичний фреймворк для безпечної роботи з даними, а експерти формують національні бенчмарки для оцінювання моделі.
"До тестування залучена незалежна група експертів, яка перевіряє технічну якість, етичність, знання мови та розуміння українських реалій."
— Офіційне повідомлення Мінцифри
Ризики й запобіжники
Серед ризиків — питання приватності, упереджень у даних і можливість зловживань. Частина заходів, які вже застосовують: незалежна перевірка, національні бенчмарки, юридичні рамки та публічне тестування, яке дозволить громадськості й спеціалістам виявляти проблемні випадки. Важливо, щоб фінансування й технічна підтримка були сталими, а контроль — прозорим.
Що може змінитися для громадянина
Поступово модель може підвищити якість чат‑підтримки у держпослугах, автоматизувати підготовку документів і локалізованих сервісів, а також стати інструментом освіти та медіа‑аналітики. Водночас ефективність залежатиме від якості даних та прозорості процесу.
Висновок
Проєкт поєднує технологію, державну політику та громадський контроль. Якщо декларації перетворяться на сталі процедури та прозорий нагляд — Україна отримає не лише інструмент сервісів, а й важливий актив мовної та інформаційної безпеки. Чи стане це довгостроковим ресурсом — залежить від того, як держава і суспільство налагодять управління і фінансування після бета‑тесту.