Slovensko má vlastnú verziu AI: Odborník vysvetľuje, ako ju vieme využiť v praxi

  • Slovenský jazykový model Qwen3-14B-SK je na svete
  • V čom sa líši od GPT-5 a aké sú jeho výhody, vysvetľuje odborník
Slovenský LLM model hodnotí Branislav Šmidt
  • Slovenský jazykový model Qwen3-14B-SK je na svete
  • V čom sa líši od GPT-5 a aké sú jeho výhody, vysvetľuje odborník
ČLÁNOK POKRAČUJE POD REKLAMOU

Slovensko postupne začína nasadzovať umelú inteligenciu na rôznych úrovniach. AI sa v posledných rokoch stala jednou z najdynamickejšie sa rozvíjajúcich technológií. Väčšina veľkých jazykových modelov, ktoré dnes poháňajú chatboty, prekladače či digitálnych asistentov, však vzniká predovšetkým pre angličtinu. Menšie jazyky, medzi ktoré patrí aj slovenčina, sa v globálnych dátach objavujú len v obmedzenom množstve. Výsledkom bývajú nepresnosti, slabšie pochopenie kontextu či menej prirodzený jazyk, uvádza TechBox

  • Aké konkrétne úlohy by mohol slovenský jazykový model zvládnuť lepšie než medzinárodné AI systémy?
  • Je realistické, aby slovenské firmy začali takýto model využívať vo vlastných produktoch a službách?
  • Aké prekážky dnes bránia širšiemu nasadeniu slovenských jazykových modelov v praxi?
  • Ak by sa jeho vývoj ďalej podporoval, kde by sme mohli jeho praktické využitie vidieť o päť až desať rokov?

Aj preto má vývoj vlastného jazykového modelu pre slovenčinu veľký význam. Slovenskí vedci nedávno predstavili model Qwen3-14B-SK. Odborníci realizovali jeho tréning tak, aby lepšie rozumel slovenskému jazyku, jeho gramatike, kultúrnym súvislostiam aj regionálnym špecifikám. Model vznikol úpravou pôvodného multilingválneho systému Qwen3-14B a jeho dodatočným trénovaním na rozsiahlych slovenských textových dátach.

Slovensko má veľký jazykový model

Na projekte spolupracovali viaceré slovenské vedecké inštitúcie, vrátane odborníkov zo Slovenskej akadémie vied či Technickej univerzity v Košiciach. Pri trénovaní využili veľké jazykové korpusy, slovníky aj encyklopedické zdroje, ktoré modelu poskytli pevný jazykový základ a širšie poznatky o slovenskom prostredí. Tréning zároveň prebiehal na výkonných európskych superpočítačoch.

Portál VTM uvádza, že výsledkom je systém, ktorý by mal presnejšie pracovať so slovenským jazykom, lepšie chápať historické a kultúrne reálie a prirodzenejšie reagovať v konverzáciách. Vývojári zároveň zdôrazňujú, že projekt má širší význam než len technologický. Podľa nich ide aj o krok smerom k väčšej technologickej autonómii a k ochrane kultúrnej identity v digitálnom priestore.

O tom, čo nový jazykový model vlastne znamená, prečo je dôležitý a na čo ho dokážeme využiť v praxi, sme sa zhovárali s expertom na generatívnu AI, konzultantom a školiteľom v oblasti umelej inteligencie Branislavom Šmidtom. 

V čom sa slovenský jazykový model Qwen3-14B-SK líši od veľkých globálnych modelov, ktoré už dnes používajú slovenčinu?

V niekoľkých dôležitých aspektoch. Po prvé, zameranie veľkých modelov ako GPT-5, Claude alebo Gemini je všeobecné – v zásade vedia všetko od matematiky, cez kódovanie až po 100+ jazykov. Ale Qwen3-14B-sk je špecialista práve na slovenčinu. Tímy z TUKE, SAV a Jazykovedného ústavu použili čínsky open-source model Qwen3-14B od Alibaby a dotrénovali ho na slovenských dátach.

Po druhé, veľkosť. Qwen3-14B-sk má necelých 15 miliárd parametrov. Najväčšie modely ich majú stovky miliárd až bilióny. Je to ako porovnávať rodinný dom s mrakodrapom, oba sú síce domy, ale robia iné veci.

Po tretie, koncentrácia slovenčiny v tréningu. Slovenčina je v dátach veľkých modelov rádovo stokrát menej zastúpená ako angličtina. Pre GPT alebo Claude je to jeden z desiatok jazykov, ktorý sa priučili akoby mimochodom. Qwen3-14B-sk videl počas tréningu slovenský webový korpus Araneum Slovacum, plus spracovaný Slovník slovenského jazyka a Encyklopédiu Beliana – teda zdroje, ktoré veľké modely takto detailne nepoznajú. 

Treba dodať jednu vec. Zatiaľ neboli zverejnené žiadne benchmarky. Tvrdenie, že tento model bude lepší v slovenčine je teda založené zatiaľ skôr na predpokladoch ako na meraných dátach.

Jedna vec je niečo vytvoriť, iná je to využiť v praxi. Kde by mohol mať takýto model najväčší praktický prínos na Slovensku – vo verejnej správe, firmách alebo vo vzdelávaní?

Najväčší potenciál vidím vo verejnej správe. Nie preto, že by bol výkonnejší ako GPT-5, ale z právnych dôvodov. S postupným nábehom EÚ regulácie AI Act a pri citlivosti občianskych dát je model, ktorý si úrad vie nasadiť on-premise – teda na vlastnú infraštruktúru, bez toho, aby dáta opúšťali organizáciu či Slovensko, reálna výhoda.

Vo firmách dáva zmysel pri práci s internými slovenskými dokumentmi: zmluvy, reporty, znalostná báza. Veľa firiem to dnes rieši cez OpenAI a podobné veľké modely, no niektoré by radšej mali lokálnu alternatívu, ktorá nikam neposiela ich dáta a pracuje dobre so slovenčinou.

Vzdelávanie je zatiaľ menej realistické. Školy nemajú vybudovanú základnú infraštruktúru ani ľudí. Učiteľom a školám dnes skôr pomôže zabezpečené a efektívne využívanie napríklad ChatGPT alebo Claude.

Vedel/a si o tomto projekte?

Aké konkrétne úlohy by mohol slovenský jazykový model zvládnuť lepšie ako medzinárodné AI systémy?

Napríklad, úzko definované úlohy, kde sa oplatí byť špecialistom. Rozpoznávanie slovenských mien firiem, inštitúcií a miest v texte a kontexte. Správne skloňovanie a gramatika v generovaných výstupoch – čo je slabina aj najväčších modelov pri dlhších slovenských textoch a špecifikách. A potom všetko, čo súvisí so slovenskými reáliami: historické osobnosti, miestopis, odborná terminológia zo Slovníka slovenského jazyka a Beliany, ktoré má model priamo v tréningových dátach.

Pekná paralela je poľský Bielik, ktorý je v rovnakej kategórii ako Qwen3-14B-sk. Podľa niektorých poľských benchmarkov dosahuje na poľštine výkon porovnateľný s modelmi 6- až 30-krát väčšími. Dedikovaný menší model dokáže na doménovo špecifických úlohách a lokálných textoch prekonať veľké jazykové modely typu ChatGPT.

Je potrebné si však uvedomiť, že komplexné uvažovanie, matematika, kódovanie, analýza anglických zmlúv, multimodálne úlohy s obrázkami, tam Qwen3-14B-sk nemôže konkurovať najvýkonnejším modelom. To jednoducho nie je kapacitne možné a nie je to ani cieľom.

Môže takýto model reálne zlepšiť spracovanie slovenských textov, napríklad pri preklade, sumarizácii alebo zákazníckej podpore?

Pri sumarizácii a zákazníckej podpore v zásade áno, ale až po ďalšej práci. Model je v súčasnom stave výskumný prototyp, nie finálny produkt na nasadenie. Autori sami priznávajú tri veci. Občas sa opakuje, halucinuje na úrovni modelov podobnej veľkosti a nemá žiadny funkčný bezpečnostný filter. Nasadiť ho dnes na slovenskú zákaznícku linku by bolo nezodpovedné.

Pri preklade je pridaná hodnota možná, aj keď na trhu existujú alternatívy ako Google Translate a DeepL, ktoré zvládajú slovenčinu veľmi slušne a sú to špecializované prekladové nástroje. Jazykový model tu nemusí byť lepším riešením. Závisí to od konkrétnych potrieb.

Je realistické, aby slovenské firmy začali takýto model využívať vo vlastných produktoch a službách?

Dnes ešte nie. Ale o 12 až 24 mesiacov možno, ak sa okolo modelu vybuduje ekosystém.

Aby ste vedeli model nasadiť do produkcie, potrebujete buď výkonný hardvér (model potrebuje rádovo desiatky gigabajtov pamäte na grafickej karte), alebo cloudového partnera. Potrebujete monitoring, logging, ľudí, ktorí to vedia udržiavať. A spravidla potrebujete model doladiť na vašu doménu, odvetvie.

Prevádzková ekonomika je ďalšia vec. Self-hosting takéhoto modelu na prenajatej špičkovej grafickej karte pri 24/7 prevádzke môže byť pomerne nákladný. Break-even oproti API od GPT-5 alebo Claude nastáva pri veľmi vysokých objemoch, ktoré väčšina slovenských firiem jednoducho nedosahuje. Pre väčšinu firiem je dnes využívanie modelov typu ChatGPT či Claude cez API lacnejšie aj efektívnejšie.
Kde to dáva zmysel, už dnes fungujú experimenty, testovacie projekty, výskum a prostredia s požiadavkou na maximálnu dátovú suverenitu.

Aké prekážky dnes bránia širšiemu nasadeniu slovenských jazykových modelov v praxi?

Hlavnou výzvou je najmä absencia benchmarkov. Bez merateľných dát sa firma neodváži model nasadiť, lebo nepozná výkonové parametre. Ďalej sú to zatiaľ chýbajúce bezpečnostné nastavenia a testovanie bezpečnosti a tiež mantinely v slovenčine. Určitou nevýhodou je aj malý tím. Kým Qwen3-14B-sk vytvorili v zásade traja výskumníci, veľké modely stavajú stovky ľudí. A tiež, chýbajúci ekosystém okolo modelu –dokumentácia, integrácie, komunita, ľudia, ktorí ho dokážu nasadiť do produkcie. To je realita malého trhu.

Dobrou správou je, že nič z tohto nie je neriešiteľné. Poľsko ide rovnakou cestou s modelom Bielik od roku 2024 a dnes má fungujúcu komunitu, vlastné benchmarky aj dátové sety. Dá sa to, ale vyžaduje si to zdroje: čas, peniaze a ľudí. Slovensko má reálnu šancu inšpirovať sa okolitými krajinami a ísť podobnou cestou.

Ako dôležité je, aby malé jazykové komunity mali vlastné AI modely namiesto úplnej závislosti od zahraničných systémov?

Čítaj viac z kategórie: Rozhovory

Zdroje: TechBox, VTM

Najnovšie videá

Trendové videá