70 000 книжок з архівів і нуль бюджетних гривень: як Україна будує власний ШІ

«Сяйво» — перша національна велика мовна модель — навчається на архівних текстах, яких раніше не торкався жоден ШІ-проєкт. Але найнезвичніше в цьому державному проєкті — держава його не фінансує.

10.04.2026, 14:13

386

Поділиться:

RazomUA - 70 000 книжок з архівів і нуль бюджетних гривень: як Україна будує власний ШІ — Ілюстративне фото: Depositphotos

Укрдержархів передав для навчання ШІ-моделі «Сяйво» близько 10 терабайтів даних — це еквівалент приблизно 70 000 книжок. За словами т.в.о. міністра Мінцифри Олександра Борнякова, значна частина цих матеріалів раніше ніколи не використовувалась у подібних проєктах. Для розуміння масштабу: вся англомовна Вікіпедія важить приблизно 21 ГБ — архів передав майже вп'ятеро більше.

Державний проєкт без державних грошей

Найнезвичніша деталь «Сяйва» — схема фінансування. «Київстар» повністю бере на себе витрати на розробку, після завершення якої модель буде передана державі. Як пояснює Борняков у колонці для AIN, логіка проста: «в умовах війни кожна бюджетна гривня має йти на оборону». Натомість оператор отримає репутаційний і комерційний актив — та першість у доступі до моделі.

Технічну основу обрали відкриту: Gemma 3 від Google, яку команда Мінцифри разом із Київстар дотренує на українських даних. Ця ж архітектура вже лягла в основу перших українських LLM — MamayLM та Lapa LLM, а також болгарської BgGPT. Тобто «Сяйво» — це не побудова з нуля, а глибока адаптація готової відкритої моделі під мову і контекст.

50+ організацій і проблема паперу

До ініціативи вже долучилися понад 50 організацій — бізнес, медіа, університети, наукові установи. Мінцифри продовжує відкритий набір партнерів: шукають новини, підручники, наукову літературу, художні тексти й архівні матеріали.

«Найважливіша частина роботи — підготовка даних. Для ефективної української моделі потрібні не лише тексти з інтернету, а й історичні архіви та інші письмові джерела».
Sud.ua, про підготовку датасету «Сяйва»

Але тут є конкретна проблема: значна частина матеріалів досі існує лише на папері. Цифровізація архівів, яка в мирний час була б питанням зручності, раптом стала критичною для якості моделі.

Назву обирали 136 000 людей

«Сяйво» перемогло в голосуванні в застосунку «Дія» серед понад 136 000 учасників — з результатом 22 601 голос із десяти фіналістів, відібраних із понад 3000 пропозицій. Відрив від другого місця склав близько трьох тисяч голосів.

Відкрите бета-тестування для всіх охочих заплановане на кінець весни 2026 року. Довгострокова мета амбітніша: до 2030 року Україна хоче увійти в топ-3 світу з розвитку ШІ.

Реальне питання, яке з'ясується вже під час бети: чи дасть 10 ТБ архівних текстів — разом із решткою датасету — достатньо якісне «розуміння» контексту, щоб «Сяйво» перевершило загальнодоступні моделі саме там, де ті традиційно провалюються: в нюансах радянської бюрократичної спадщини, діалектах і документах, які ніколи не потрапляли до інтернету.

Новини світу

Садок «Барвінок» у Білогородці: реконструкція за грантом ЄІБ чи закриття? Що насправді відбувається

1

Зеленський написав Путіну — той відмовився | Удари по Криму та Петербургу | Огляд тижня

2

Застави для корупціонерів замість дронів? Відверто про виживання, довіру та ППО громадdeepl

3

Більше ніж гра: Виховання патріотів та вшанування героїв у Білогородці

4

Перша Єшива незалежної України: від фундаменту під ракетами до відкриття

5

СВІТ ВХОДИТЬ У ФАЗУ ХАОСУ ТА ВІЙНИ НА ВИСНАЖЕННЯ

Політика

Версаль проти невігластва: як Макрон золотом і історією дотиснув Трампа

Французька дипломатія в кращих традиціях короля-Сонце: під час саміту G7 Макрон нагадав Трампу, що незалежність США 250 років тому врятувала саме Франція — і зробив це велично, у золоті Версаля.

2 дні тому

Культура

4 млрд євро прямих і 24 млрд доларів непрямих: що стоїть за цифрами збитків культурі

Пошкоджено майже 4500 об'єктів — від сільських клубів до пам'яток ЮНЕСКО. Міністерка культури Бережна вперше публічно назвала непрямі збитки: вони у шість разів перевищують прямі.

4 дні тому

Війна

ЮНЕСКО рахує зруйновані пам'ятки, але уникає слова «Росія» — і це не випадковість

Організація верифікувала понад 340 пошкоджених об'єктів культурної спадщини України, але в офіційних формулюваннях не називає виконавця атак. Міністерка культури Бережна вимагає змінити цю практику — і за нею стоїть ціла дипломатична логіка.

4 дні тому

Фейк з чужим логотипом: як Росія намагається зіпсувати репутацію українських фанів перед ЧС-2026

Три дні гроз, і потім — збирання: чому червневі шквали б'ють не лише по парасолях

Боєць вижив у боях під Краматорськом — і помер у київській лікарні. Тепер це кримінальна справа

70 000 книжок з архівів і нуль бюджетних гривень: як Україна будує власний ШІ

Державний проєкт без державних грошей

50+ організацій і проблема паперу

Назву обирали 136 000 людей

Новини світу

Рубіо проти фон дер Ляєн: США тиснуть на Європу через Еболу — і погрожують ускладнити в'їзд на ЧС-2026

Кремль у французькому ефірі: Макрон назвав Федорову «агентом державної пропаганди РФ» — скандал сколихнув Сенат, Парламент і Єлісейський палац

Брудне розлучення: США виходять із ВООЗ і лишають $260 млн боргу — що це означає для здоров’я й безпеки України

Зеленський написав Путіну — той відмовився | Удари по Криму та Петербургу | Огляд тижня

Застави для корупціонерів замість дронів? Відверто про виживання, довіру та ППО громадdeepl

Більше ніж гра: Виховання патріотів та вшанування героїв у Білогородці

Перша Єшива незалежної України: від фундаменту під ракетами до відкриття

СВІТ ВХОДИТЬ У ФАЗУ ХАОСУ ТА ВІЙНИ НА ВИСНАЖЕННЯ

Версаль проти невігластва: як Макрон золотом і історією дотиснув Трампа

4 млрд євро прямих і 24 млрд доларів непрямих: що стоїть за цифрами збитків культурі

ЮНЕСКО рахує зруйновані пам'ятки, але уникає слова «Росія» — і це не випадковість

Один виробник — 60% глибоких ударів: як Fire Point стала хребтом українського діпстрайку

Борг — 113% ВВП, мінімалка — 11 155 грн: уряд розрахував три роки війни і без неї

«Росія повинна укласти угоду» — але що саме Трамп і Зеленський узгодили в Мар-а-Лаго

Не пропустіть важливе