Україна запустила розробку власної національної великої мовної моделі "Сяйво". Уряд планує розробку штучного інтелекту, здатного інтерпретувати український культурний контекст, історичний спадок та регіональні мовні особливості, включно з діалектами.
Про це повідомив в.о. міністра цифрової трансформації Олександр Борняков. Наразі проєкт перебуває на стадії формування ключових технологічних рішень.
"Створюємо національну велику мовну модель, яка розумітиме український контекст, історію та діалекти. Для її навчання збираємо унікальні дані, які раніше були недоступні для тренування ШІ", — повідомив Борняков.
Сяйво — український аналог ChatGPT: деталі проєкту
Ключовим активом LLM "Сяйво" є доступ до унікальних масивів інформації. 50 інституцій вже приєдналися до ініціативи, формуючи базу для навчання моделі. Найбільший внесок забезпечили державні архіви — 10 терабайтів даних, які раніше залишалися поза полем інтересу глобальних AI-гравців.
Це тексти, що відображають історичні процеси, мовну еволюцію та культурні особливості країни. Саме такі дані формують конкурентну перевагу, яку складно відтворити найбільшими міжнародними компаніями.

Фокус на нішевий продукт
На відміну від міжнародно відомих мовних моделей, які прагнуть охопити максимум мов і контекстів, "Сяйво" обирає траєкторію максимальної українізації. Фокус рідною мовою, регіональних діалектів і локальному контекстові дозволяє створити продукт із високою відповідністю щодо внутрішнього ринку.
Таким чином LLM має знайти широке коло використання — від автоматизації документообігу в державному секторі до персоналізованих рішень у фінтеху, медіа та e-commerce.
Коли очікувати власний ШІ
Розвиток "Сяйва" напряму залежить від темпів оцифрування даних. Станом на 2026 рік Україна має близько 150 мільйонів цифрових копій документів. До кінця року очікується перевищення позначки у 200 мільйонів.
"Це перший кейс, коли архіви діляться своїми фондами для розвитку цифрових сервісів в Україні. Вже зараз Україна належить до світових лідерів з оцифрування архівів, і до кінця 2026 року кількість наявних цифрових копій виросте зі 150 млн до понад 200 млн, які можуть бути використані для тренування нашої національної LLM", — повідомив в.о. міністра цифрової трансформації Олександр Борняков.
До кінця 2026 року "Сяйво" має перетворитися з амбітної ідеї на повноцінний інструмент, інтегрований у державні та комерційні сервіси.
Українська національна ШІ: скільки коштує створити власну LLM і хто за це платить
Україна входить у перелік країн, які пробують зібрати власну велику мовну модель, але робить це за нетиповою для ринку ціною. Перший етап проєкту, який реалізують Мінцифри та "Київстар", оцінюється приблизно у $2 млн.
Проте, загальна вартість розробки сучасних LLM у провідних технологічних компаніях часто коштує десятки або сотні мільйонів доларів, якщо йдеться про повноцінне навчання моделі з нуля.

Хто платить за український ШІ
Фінансування першого етапу повністю бере на себе телеком-оператор "Київстар", який виступає операційним і інфраструктурним партнером держави. Компанія відповідає за:
- оренду обчислювальних потужностей (GPU-кластери),
- формування команди розробки,
- підготовку інфраструктури для навчання моделі.
Держава, зі свого боку, забезпечує доступ до даних, координацію проєкту та регуляторну рамку.
Без власних дата-центрів
Окремий фактор економії грошей — відсутність інвестицій у власну фізичну інфраструктуру. На старті модель тренуватимуть у хмарних середовищах міжнародних провайдерів. Будівництво власних GPU-центрів у нинішніх умовах вважається надто дорогим і довгим шляхом.
Що входить у стартовий бюджет $2 млн
За словами учасників проєкту кошти покриють лише початковий етап:
- fine-tuning відкритої мовної моделі,
- роботу інженерних і дослідницьких команд,
- оренду обчислювальних ресурсів,
- створення першої бета-версії системи.
Фактично йдеться не про повноцінний запуск продукту, а про прототип національної LLM.
Ключова технологічна ставка — використання вже чинних відкритих моделей та їх адаптація під українську мову, юридичний та державний контекст. Такий підхід дозволяє скоротити витрати, але обмежує потенціал системи порівняно з міжнародними моделями.
Попри відносно невеликий бюджет стартового етапу, проєкт має довгостроковий характер. Після запуску бета-версії очікується масштабування — інтеграція з державними сервісами, комерційні API-рішення та розширення інфраструктури.
У перспективі витрати можуть зрости кратно — залежно від того, наскільки глибоко Україна захоче інтегрувати ШІ у державне управління та бізнес.
