Das Ministerium für digitale Transformation hat zusammen mit Kyivstar Gemma 3 von Google als Referenzmodell für das Training eines nationalen großen Sprachmodells bestimmt.
Technische Möglichkeiten von Gemma 3
Gemma 3 unterstützt etwa 140 Sprachen, darunter Ukrainisch. Das Modell ist für die Arbeit mit langen Kontexten ausgelegt — bis zu 128.000 Token — und verfügt über multimodale Funktionen, die es ermöglichen, nicht nur Text, sondern auch Bilder zu verarbeiten.
Anpassung an das Ukrainische
Es ist geplant, das Modell an die Besonderheiten des Ukrainischen anzupassen: den Tokenizer zu modernisieren, um Wörter besser zu erkennen, es mit einzigartigen ukrainischsprachigen Korpora weiter zu trainieren und eigene Testdatensätze zur Qualitätsbewertung zu erstellen.
Zuvor wurde Gemma in ukrainischen Projekten angewendet, unter anderem in Lapa LLM und MamayLM, sowie bei der Entwicklung des bulgarischen Modells BgGPT.
Außerdem soll der Chatbot Дія.AI von Gemini auf das nationale Sprachmodell umgestellt werden. In der Ukraine wurde außerdem ein Team gebildet, das an der Entwicklung eines eigenen großen Sprachmodells arbeiten wird.