Quellen für das Training
Materialien stammen von mehr als 90 staatlichen Einrichtungen — von Gerichtsregistern und Bildungsverlagen bis hin zu regionalen Archiven und Dokumenten, die mit den Aktivitäten Russlands während der großangelegten Invasion in Verbindung stehen. Diese Korpora werden als Grundlage für das Training eines nationalen großen Sprachmodells verwendet, das auf der offenen Gemma-Architektur von Google basieren wird.
Trainingsort und Schutz
Das Training wird im Ausland auf geschützten Grafikprozessoren stattfinden, die von Google bereitgestellt werden. Nach Abschluss soll das Modell in ukrainischen Rechenzentren ausgerollt werden. Zu den Technologiepartnern des Projekts gehört Kyivstar; ein genauer Starttermin ist noch nicht festgelegt.
Das Entwicklerteam bereitet sich auf mögliche Cyberangriffe vor. Das Ministerium für digitale Transformation warnt, dass das System unmittelbar nach dem öffentlichen Start ein Ziel werden könnte, wie es bereits bei anderen KI‑Diensten der Fall war. Es werden Maßnahmen gegen 'prompt injection' geprüft — Versuche, schädliche Anweisungen in Benutzeranfragen einzuschleusen.
Kürzlich wurde angekündigt, dass das ukrainische große Sprachmodell mithilfe von Gemma trainiert werden soll. In der Ukraine wurde bereits ein Team gebildet, das an der Entwicklung der nationalen LLM arbeiten wird.