Субота, 16 Травня, 2026
Субота, 16 Травня, 2026
ГоловнаНовиниДержавні архіви стали базою для ШІ-моделі Сяйво: що ховають 10 ТБ даних...

Державні архіви стали базою для ШІ-моделі Сяйво: що ховають 10 ТБ даних та скільки це коштує Україні

Україна запустила розробку власної національної великої мовної моделі "Сяйво". Уряд планує розробку штучного інтелекту, здатного інтерпретувати український культурний контекст, історичний спадок та регіональні мовні особливості, включно з діалектами. 

Про це повідомив в.о. міністра цифрової трансформації Олександр Борняков. Наразі проєкт перебуває на стадії формування ключових технологічних рішень.

"Створюємо національну велику мовну модель, яка розумітиме український контекст, історію та діалекти. Для її навчання збираємо унікальні дані, які раніше були недоступні для тренування ШІ", — повідомив Борняков.

Сяйво — український аналог ChatGPT: деталі проєкту

Ключовим активом LLM "Сяйво" є доступ до унікальних масивів інформації. 50 інституцій вже приєдналися до ініціативи, формуючи базу для навчання моделі. Найбільший внесок забезпечили державні архіви — 10 терабайтів даних, які раніше залишалися поза полем інтересу глобальних AI-гравців.

Це тексти, що відображають історичні процеси, мовну еволюцію та культурні особливості країни. Саме такі дані формують конкурентну перевагу, яку складно відтворити найбільшими міжнародними компаніями.

LLM Сяйво тренуватимуть на Укрдержархів / фото: https://t.me/bornyakovalex

Фокус на нішевий продукт

На відміну від міжнародно відомих мовних моделей, які прагнуть охопити максимум мов і контекстів, "Сяйво" обирає траєкторію максимальної українізації. Фокус рідною мовою, регіональних діалектів і локальному контекстові дозволяє створити продукт із високою відповідністю щодо внутрішнього ринку.

Таким чином LLM має знайти широке коло використання — від автоматизації документообігу в державному секторі до персоналізованих рішень у фінтеху, медіа та e-commerce. 

Коли очікувати власний ШІ

Розвиток "Сяйва" напряму залежить від темпів оцифрування даних. Станом на 2026 рік Україна має близько 150 мільйонів цифрових копій документів. До кінця року очікується перевищення позначки у 200 мільйонів.

"Це перший кейс, коли архіви діляться своїми фондами для розвитку цифрових сервісів в Україні. Вже зараз Україна належить до світових лідерів з оцифрування архівів, і до кінця 2026 року кількість наявних цифрових копій виросте зі 150 млн до понад 200 млн, які можуть бути використані для тренування нашої національної LLM", — повідомив в.о. міністра цифрової трансформації Олександр Борняков.

До кінця 2026 року "Сяйво" має перетворитися з амбітної ідеї на повноцінний інструмент, інтегрований у державні та комерційні сервіси. 

Українська національна ШІ: скільки коштує створити власну LLM і хто за це платить

Україна входить у перелік країн, які пробують зібрати власну велику мовну модель, але робить це за нетиповою для ринку ціною. Перший етап проєкту, який реалізують Мінцифри та "Київстар", оцінюється приблизно у $2 млн.

Проте, загальна вартість розробки сучасних LLM у провідних технологічних компаніях часто коштує десятки або сотні мільйонів доларів, якщо йдеться про повноцінне навчання моделі з нуля. 

Михайло Федоров та Олександр Комаров / фото: Telegram FEDOROV

Хто платить за український ШІ

Фінансування першого етапу повністю бере на себе телеком-оператор "Київстар", який виступає операційним і інфраструктурним партнером держави. Компанія відповідає за:

  • оренду обчислювальних потужностей (GPU-кластери),
  • формування команди розробки,
  • підготовку інфраструктури для навчання моделі.

Держава, зі свого боку, забезпечує доступ до даних, координацію проєкту та регуляторну рамку.

Без власних дата-центрів

Окремий фактор економії грошей — відсутність інвестицій у власну фізичну інфраструктуру. На старті модель тренуватимуть у хмарних середовищах міжнародних провайдерів. Будівництво власних GPU-центрів у нинішніх умовах вважається надто дорогим і довгим шляхом.

Що входить у стартовий бюджет $2 млн

За словами учасників проєкту кошти покриють лише початковий етап:

  • fine-tuning відкритої мовної моделі,
  • роботу інженерних і дослідницьких команд,
  • оренду обчислювальних ресурсів,
  • створення першої бета-версії системи.

Фактично йдеться не про повноцінний запуск продукту, а про прототип національної LLM.

Ключова технологічна ставка — використання вже чинних відкритих моделей та їх адаптація під українську мову, юридичний та державний контекст. Такий підхід дозволяє скоротити витрати, але обмежує потенціал системи порівняно з міжнародними моделями.

Попри відносно невеликий бюджет стартового етапу, проєкт має довгостроковий характер. Після запуску бета-версії очікується масштабування — інтеграція з державними сервісами, комерційні API-рішення та розширення інфраструктури.

У перспективі витрати можуть зрости кратно — залежно від того, наскільки глибоко Україна захоче інтегрувати ШІ у державне управління та бізнес.

Актуально

МВФ готує перший перегляд програми EFF на $8,1 млрд: у фокусі податки, тіньова економіка та бюджет

Найближчими тижнями в Україну прибуде місія Міжнародного валютного фонду,...

Українські продукти можуть з'явитися у тисячах магазинів Туреччини: Migros шукає виробників

Представники Посольства України в Турецькій Республіці планують провести переговори...

АМКУ дозволив Сільпо придбати активи мереж Арсен, Союз і Квартал

Таким чином підтвердилися раніше поширені чутки: саме Сільпо стане одним із головних спадкоємців локацій Євротеку.

ТРЦ River Mall додав у застосунок функцію пошуку авто на паркінгу

Функція працює як на відкритому, так і на підземному паркінгу. Для використання потрібні увімкнений інтернет і Bluetooth.

Аврора дозволила надсилати вторсировину поштою: як працює новий сервіс Avrora Green

Команда проєкту відзначає, що ті, хто надсилає відходи поштою, зазвичай підходять до процесу особливо ретельно.

Український стартап Swarmer втрачає 40% вартості після IPO на Nasdaq — що сталося

У березні 2026 року вихід українського оборонного стартапу Swarmer...

Roshen, АВК та Malbi Foods наростили прибутки попри війну та високі ціни на какао: хто заробив найбільше

У 2025 році український ринок кондитерських виробів продемонстрував рекордне...

В Україні закриються всі супермаркети Арсен, Фреш, Союз та Квартал після 24 років на ринку

Власник мережі Михайло Весельський назвав це плановим і стратегічним виходом із ринку.

Цікаві записи

Схожі публікації