Gemma 3 від Google стане основою української LLM

Міністерство цифрової трансформації та Київстар обрали відкриту модель Gemma 3 як базу для створення української великої мовної моделі. Її адаптуватимуть під українську, донавчатимуть на національних даних і тестуватимуть власними бенчмарками.

827
Поділиться:

Міністерство цифрової трансформації разом із Київстаром визначили Gemma 3 від Google як опорну модель для навчання національної великої мовної моделі.

Технічні можливості Gemma 3

Gemma 3 підтримує близько 140 мов, серед яких є українська. Модель розрахована на роботу з довгими контекстами — до 128 000 токенів — і має мультимодальні функції, що дозволяють опрацьовувати не лише текст, а й зображення.

Налаштування під українську

Планують адаптувати модель до специфіки української: модернізувати токенайзер для кращого розпізнавання слів, донавчити на унікальних україномовних корпусах і створити власні тестові набори для оцінки якості.

Раніше Gemma застосовували в українських проєктах, зокрема Lapa LLM та MamayLM, а також у розробці болгарської моделі BgGPT.

Окрім того, чат-бот Дія.AI планують перевести з Gemini на національну мовну модель. В Україні також сформували команду, яка працюватиме над створенням власної великої мовної моделі.

Новини світу

Політика

Конгрес місцевих та регіональних влад при Президентові України зібрав очільників громад з усієї країни. Від Білогородської — сільський голова Антон Овсієнко. На кону не протоколи, а конкретна відповідь: чи буде у людей світло, вода і тепло, якщо ворог вдарить по інфраструктурі.

34 хвилини тому
Технології

Стартап Aeon оголосив партнерство з українським виробником дронів для інтеграції ракети Zeus на квадрокоптерні платформи. Система ще не пройшла бойового тестування — і саме це визначає реальну цінність анонсу.

43 хвилини тому
Фінанси

Claude Mythos самостійно знайшов тисячі критичних вразливостей у кожній великій операційній системі та браузері. Anthropic це визнає, але стверджує, що модель утримується заради захисту — а не атаки.

44 хвилини тому