Gemma 3 від Google стане основою української LLM

Міністерство цифрової трансформації та Київстар обрали відкриту модель Gemma 3 як базу для створення української великої мовної моделі. Її адаптуватимуть під українську, донавчатимуть на національних даних і тестуватимуть власними бенчмарками.

581
Поділиться:

Міністерство цифрової трансформації разом із Київстаром визначили Gemma 3 від Google як опорну модель для навчання національної великої мовної моделі.

Технічні можливості Gemma 3

Gemma 3 підтримує близько 140 мов, серед яких є українська. Модель розрахована на роботу з довгими контекстами — до 128 000 токенів — і має мультимодальні функції, що дозволяють опрацьовувати не лише текст, а й зображення.

Налаштування під українську

Планують адаптувати модель до специфіки української: модернізувати токенайзер для кращого розпізнавання слів, донавчити на унікальних україномовних корпусах і створити власні тестові набори для оцінки якості.

Раніше Gemma застосовували в українських проєктах, зокрема Lapa LLM та MamayLM, а також у розробці болгарської моделі BgGPT.

Окрім того, чат-бот Дія.AI планують перевести з Gemini на національну мовну модель. В Україні також сформували команду, яка працюватиме над створенням власної великої мовної моделі.

Новини світу

Спорт

Дмитро Котовський та Ангеліна Брикіна пронесли прапор України ареною Верони — не просто символічний жест, а важливий акт міжнародної видимості в час, коли увага світу має стратегічне значення.

12 хвилин тому
Політика

У Брюсселі наполягають на конкретних правилах після рішення Верховного суду США. Розбираємо, чому це важливо для України та які короткострокові ризики і можливості це породжує.

13 хвилин тому
Політика

Прем'єр Гренландії відхилив пропозицію Дональда Трампа — не з байдужості до допомоги, а як захист моделі охорони здоровʼя й політичної автономії. Розбираємо, чому це важливо в ширшому геополітичному контексті.

1 годину тому