70 000 книг из архивов и ноль бюджетных гривень: как Украина строит собственный ИИ

«Сияние» — первая национальная большая языковая модель — обучается на архивных текстах, которых ранее не касался ни один ИИ-проект. Но самое необычное в этом государственном проекте — государство его не финансирует.

10.04.2026, 14:13

384

RazomUA - 70 000 книг из архивов и ноль бюджетных гривень: как Украина строит собственный ИИ — Ілюстративне фото: Depositphotos

Укргосударственный архив передал для обучения ИИ-модели «Сияние» около 10 терабайтов данных — это эквивалент приблизительно 70 000 книг. По словам и.о. министра Минцифры Александра Борнякова, значительная часть этих материалов ранее никогда не использовалась в подобных проектах. Для понимания масштаба: вся англоязычная Википедия весит приблизительно 21 ГБ — архив передал почти в пять раз больше.

Государственный проект без государственных денег

Наиболее необычная деталь «Сияния» — схема финансирования. «Киевстар» полностью берет на себя расходы на разработку, после завершения которой модель будет передана государству. Как объясняет Борняков в колонке для AIN, логика проста: «в условиях войны каждая бюджетная гривня должна идти на оборону». В свою очередь оператор получит репутационный и коммерческий актив — и первенство в доступе к модели.

Техническую основу выбрали открытую: Gemma 3 от Google, которую команда Минцифры вместе с Киевстаром дотренирует на украинских данных. Эта же архитектура уже легла в основу первых украинских LLM — MamayLM и Lapa LLM, а также болгарской BgGPT. То есть «Сияние» — это не построение с нуля, а глубокая адаптация готовой открытой модели под язык и контекст.

50+ организаций и проблема бумаги

К инициативе уже присоединились более 50 организаций — бизнес, медиа, университеты, научные учреждения. Минцифры продолжает открытый набор партнеров: ищут новости, учебники, научную литературу, художественные тексты и архивные материалы.

«Наиболее важная часть работы — подготовка данных. Для эффективной украинской модели нужны не только тексты из интернета, но и исторические архивы и другие письменные источники».
Sud.ua, о подготовке датасета «Сияние»

Но здесь есть конкретная проблема: значительная часть материалов до сих пор существует только на бумаге. Цифровизация архивов, которая в мирное время была бы вопросом удобства, вдруг стала критической для качества модели.

Название выбирали 136 000 человек

«Сияние» победило в голосовании в приложении «Дия» среди более чем 136 000 участников — с результатом 22 601 голос из десяти финалистов, отобранных из более чем 3000 предложений. Отрыв от второго места составил около трех тысяч голосов.

Открытое бета-тестирование для всех желающих запланировано на конец весны 2026 года. Долгосрочная цель амбициознее: к 2030 году Украина хочет войти в топ-3 мира по развитию ИИ.

Реальный вопрос, который выяснится уже во время беты: даст ли 10 ТБ архивных текстов — вместе с остальной частью датасета — достаточно качественное «понимание» контекста, чтобы «Сияние» превзошло общедоступные модели именно там, где те традиционно проваливаются: в нюансах советского бюрократического наследия, диалектах и документах, которые никогда не попадали в интернет.

Новости мира

Детский сад «Барвинок» в Белогородке: реконструкция по гранту ЕIБР или закрытие? Что на самом деле происходит

1

Зеленский написал Путину — тот отказался | Удары по Крыму и Санкт-Петербургу | Обзор недели

2

Залог для коррупционеров вместо дронов? Откровенно о выживании, доверии и ПВО общин

3

Больше, чем игра: воспитание патриотов и чествование героев в Белогородке

4

Первая ешива независимой Украины: от фундамента под ракетами до открытия

5

Мир вступает в фазу хаоса и войны на истощение

Политика

Версаль против невежества: как Макрон золотом и историей придавил Трампа

Французская дипломатия в лучших традициях короля-Солнца: во время саммита G7 Макрон напомнил Трампу, что независимость США 250 лет назад спасла именно Франция — и сделал это величественно, в золотых покоях Версаля.

2 дня назад

Культура

4 млрд евро прямых и 24 млрд долларов косвенных: что стоит за цифрами убытков культуре

Повреждено почти 4500 объектов — от сельских клубов до памятников ЮНЕСКО. Министр культуры Бережная впервые публично назвала косвенные убытки: они в шесть раз превышают прямые.

4 дня назад

Война

ЮНЕСКО считает разрушенные памятники, но избегает слова «Россия» — и это не случайность

Организация верифицировала более 340 поврежденных объектов культурного наследия Украины, но в официальных формулировках не называет исполнителя атак. Министр культуры Береженая требует изменить эту практику — и за ней стоит целая дипломатическая логика.

4 дня назад

Фейк с чужим логотипом: как Россия пытается испортить репутацию украинских фанов перед ЧМ-2026

Три дня гроз, а потом — уборка: почему июньские шквалы бьют не только по зонтикам

Боец выжил в боях под Краматорском — и умер в киевской больнице. Теперь это уголовное дело

70 000 книг из архивов и ноль бюджетных гривень: как Украина строит собственный ИИ

Государственный проект без государственных денег

50+ организаций и проблема бумаги

Название выбирали 136 000 человек

Новости мира

Рубио против фон дер Ляен: США давят на Европу из-за Эболы — и угрожают затруднить въезд на ЧМ-2026

Кремль в французском эфире: Макрон назвал Федорову «агентом государственной пропаганды РФ» — скандал потряс Сенат, Парламент и Елисейский дворец

Грязный развод: США выходят из ВОЗ и оставляют долг в $260 млн — что это означает для здоровья и безопасности Украины

Зеленский написал Путину — тот отказался | Удары по Крыму и Санкт-Петербургу | Обзор недели

Залог для коррупционеров вместо дронов? Откровенно о выживании, доверии и ПВО общин

Больше, чем игра: воспитание патриотов и чествование героев в Белогородке

Первая ешива независимой Украины: от фундамента под ракетами до открытия

Мир вступает в фазу хаоса и войны на истощение

Версаль против невежества: как Макрон золотом и историей придавил Трампа

4 млрд евро прямых и 24 млрд долларов косвенных: что стоит за цифрами убытков культуре

ЮНЕСКО считает разрушенные памятники, но избегает слова «Россия» — и это не случайность

Один производитель — 60% глубоких ударов: как Fire Point стала хребтом украинского дипстрайка

Долг — 113% ВВП, минимальная зарплата — 11 155 грн: правительство рассчитало три года войны и без неё

«Россия должна заключить договор» — но что именно Трамп и Зеленский согласовали в Мар-а-Лаго

Не пропустите важное