Gemma 3 von Google wird zur Grundlage eines ukrainischen LLM

Das Ministerium für digitale Transformation der Ukraine und Kyivstar haben das offene Modell Gemma 3 als Grundlage für die Entwicklung eines ukrainischen großen Sprachmodells ausgewählt. Es wird an die ukrainische Sprache angepasst, mit nationalen Daten weitertrainiert und mithilfe eigener Benchmarks getestet.

264
Aktie:

Das Ministerium für digitale Transformation hat zusammen mit Kyivstar Gemma 3 von Google als Referenzmodell für das Training eines nationalen großen Sprachmodells bestimmt.

Technische Möglichkeiten von Gemma 3

Gemma 3 unterstützt etwa 140 Sprachen, darunter Ukrainisch. Das Modell ist für die Arbeit mit langen Kontexten ausgelegt — bis zu 128.000 Token — und verfügt über multimodale Funktionen, die es ermöglichen, nicht nur Text, sondern auch Bilder zu verarbeiten.

Anpassung an das Ukrainische

Es ist geplant, das Modell an die Besonderheiten des Ukrainischen anzupassen: den Tokenizer zu modernisieren, um Wörter besser zu erkennen, es mit einzigartigen ukrainischsprachigen Korpora weiter zu trainieren und eigene Testdatensätze zur Qualitätsbewertung zu erstellen.

Zuvor wurde Gemma in ukrainischen Projekten angewendet, unter anderem in Lapa LLM und MamayLM, sowie bei der Entwicklung des bulgarischen Modells BgGPT.

Außerdem soll der Chatbot Дія.AI von Gemini auf das nationale Sprachmodell umgestellt werden. In der Ukraine wurde außerdem ein Team gebildet, das an der Entwicklung eines eigenen großen Sprachmodells arbeiten wird.

Weltnachrichten