Ce qui s'est passé
Le Ministère de la Transformation numérique a annoncé que, au printemps 2026, commencera le bêta‑test du premier grand modèle de langage (LLM) national entraîné sur des données ukrainiennes uniques. Le partenaire technique du projet est l'opérateur Kyivstar, qui finance le développement et transférera le modèle à la propriété de l'État.
"L'Ukraine lancera au printemps 2026 le bêta‑test du premier LLM national..."
— Ministère de la Transformation numérique (communiqué)
Base technique et calendrier
Le modèle sera adapté à partir du LLM ouvert de Google — Gemma — pour la langue ukrainienne et le contexte local. Un groupe indépendant d'experts participe aux tests et évaluera la qualité technique, l'éthique et la conformité aux réalités ukrainiennes. La finalisation d'une première base de textes, un tokeniseur amélioré et un système d'évaluation sont prévus pour janvier ; au printemps, début des tests publics. Le nom du modèle sera choisi par les citoyens via un vote dans l'application «Дія».
Pourquoi c'est important : sécurité, langue, services publics
Ce n'est pas qu'un projet technologique — c'est un élément de la sécurité informationnelle et numérique. Un modèle entraîné sur des données locales comprendra mieux le contexte ukrainien, la spécificité de la langue et les réalités juridiques et réglementaires, et pourra donc améliorer la qualité des services publics, des réponses automatisées et de l'analytique. De plus, l'existence d'un LLM national réduit la dépendance aux services étrangers dans les secteurs critiques.
Sources de données et contrôle
L'équipe collecte des téraoctets de données non seulement à partir de sources ouvertes, mais aussi auprès des médias, des universités et de plus de 90 institutions publiques — la collecte a débuté en décembre 2025. Parallèlement, un cadre juridique est en cours d'élaboration pour un traitement sécurisé des données, et des experts mettent en place des benchmarks nationaux pour évaluer le modèle.
"Un groupe indépendant d'experts est impliqué dans les tests, qui vérifie la qualité technique, l'éthique, la maîtrise de la langue et la compréhension des réalités ukrainiennes."
— Communiqué officiel du Ministère de la Transformation numérique
Risques et garde‑fous
Parmi les risques figurent les questions de confidentialité, les biais dans les données et le risque d'abus. Certaines mesures déjà mises en place : vérification indépendante, benchmarks nationaux, cadres juridiques et tests publics permettant au public et aux spécialistes d'identifier les cas problématiques. Il est important que le financement et le soutien technique soient durables et que le contrôle soit transparent.
Ce que cela peut changer pour le citoyen
Progressivement, le modèle pourrait améliorer la qualité du support par chat dans les services publics, automatiser la préparation de documents et de services localisés, et devenir un outil pour l'éducation et l'analyse médiatique. Dans le même temps, son efficacité dépendra de la qualité des données et de la transparence du processus.
Conclusion
Le projet combine technologie, politique d'État et contrôle citoyen. Si les déclarations se traduisent par des procédures durables et une surveillance transparente, l'Ukraine obtiendra non seulement un outil de service, mais aussi un actif important pour la sécurité linguistique et informationnelle. Pour que cela devienne une ressource à long terme, tout dépendra de la manière dont l'État et la société organiseront la gouvernance et le financement après la bêta.