Pāriet uz galveno saturu
  • LV
  • ENG
DIGITĀLĀS HUMANITĀRĀS ZINĀTNES LATVIJĀ
  • sākums
  • notikumi
    • CLARIN & DARIAH pavasara konference
    • Baltijas DH forums
  • resursi
    • Resursi un rīki
    • Video bibliotēka
  • Semināri
  • BSSDH
  • Projekti
    • DigiLATE
    • Teiktās dziesmas
    • VTI
    • DHELI
    • VPP LATE
    • DH VPP
    • Nordplus
  • Par mums

Radīts mākslīgā intelekta rīks latgaliešu valodas runas atpazīšanai un transkribēšanai

25. marts, 2025 pl. 15:02

Screenshot_2025-03-25_at_15_04_49.jpg

LU Matemātikas un informātikas institūta (LU MII) Mākslīgā intelekta laboratorijas pētnieki apmācījuši pirmo mākslīgā intelekta (MI) modeli latgaliešu valodas runas atpazīšanai un uz tā bāzes izstrādājuši praktiski izmantojamu latgaliešu valodas runas transkribēšanas rīku. Jaunais MI modelis un rīks ir brīvi pieejami gan galalietotājiem, gan valodu tehnoloģiju risinājumu izstrādātājiem.

“Latgaliešu valoda ir neatņemams Latvijas lingvistiskais un kultūrvēsturiskais mantojums un būtiska nacionālās identitātes daļa aptuveni 165 000 mūsu valsts iedzīvotāju, tādēļ ir svarīgi nodrošināt latgaliešu valodas pilnvērtīgu pastāvēšanu un attīstību arī digitālajā telpā,” norāda LU MII Mākslīgā intelekta laboratorijas vadītājs Normunds Grūzītis. “Esam gandarīti, ka kopā ar partneriem mums ir izdevies izveidot pirmo praktiski izmantojamo MI modeli, kas spēj saprast un pierakstīt latgaliešu valodā runāto. Latviešu valodai šādi risinājumi ir pieejami jau vairāk nekā desmit gadus, un nu arī latgaliešu valodai runas tehnoloģiju nodrošinājums pietuvinājies līmenim, kāds tas ir latviešu valodai.”


Jaunā MI modeļa mašīnapmācība latgaliešu valodas runas atpazīšanai tika paveikta vien mēneša laikā, sagatavojot vairāku gadu laikā iegūtos valodas datu paraugus modeļa apmācībai un izmantojot LU MII mākslīgā intelekta skaitļošanas infrastruktūru. Lai iegūtu nepieciešamos datus, Valsts pētījumu programmā “Letonika” kopš 2022. gada tika veidoti runas korpusi latviešu un latgaliešu valodai – daudzveidīgi runas datu paraugi ar transkripcijām un lingvistisko marķējumu, kopumā vairāku simtu stundu apjomā. Tas ietver arī sabiedrisko iniciatīvu “Balsu talka” un “Bolsu tolka” laikā savāktos latviešu un latgaliešu valodas runas paraugus. Paralēli tam ES finansētajā izglītības un pētniecības projektā “Valodu tehnoloģiju iniciatīva” tika izveidota tehnoloģiskā bāze valodas modeļu mašīnapmācībai.

“Pirms MI modeļa izveides latgaliešu valodai vispirms izveidojām šādu modeli latviešu valodai, jo tai ir pieejams ievērojami vairāk apmācības datu. Pēc tam izveidoto latviešu valodas modeli turpinājām apmācīt ar latgaliešu valodas datiem,” piebilst Normunds Grūzītis.

LU MII izstrādātais latgaliešu valodas runas transkribēšanas rīks LATE-LTG ir brīvi pieejams vietnē https://ltg.late.ailab.lv, savukārt apmācītais MI modelis ir pieejams ar atvērtā pirmkoda licenci, tostarp komerciālai izmantošanai. LATE platforma paver plašas pielietojuma iespējas, tostarp teksta diktēšanai, audio un video ierakstu atšifrēšanai, subtitru veidošanai, kā arī  latgaliešu rakstu valodas apguvei.

Latgaliešu un latviešu valodas MI modeļu apmācībai nepieciešamo runas korpusu izveidē un attīstībā piedalās Rēzeknes Tehnoloģiju akadēmijas, LU Matemātikas un informātikas institūta un LU Literatūras, folkloras un mākslas institūta pētnieki, savukārt Latvijas Atvērto tehnoloģiju asociācijai bijusi būtiska loma “Balsu talkas” veiksmīgā organizēšanā un īstenošanā.

Jaunākie ieraksti

  • CLARIN–DARIAH pavasara konferences fokusā – digitālo humanitāro zinātņu infrastruktūru attīstība
    9 marts, 2026
  • Notiks seminārs “Datu vizualizācija humanitāro zinātņu pētniekiem”
    9 marts, 2026
  • CLARIN & DARIAH pavasara konference 2026: Humanitāro zinātņu digitālā infrastruktūra
    10 febr., 2026
  • Baltijas digitālo humanitāro zinātņu vasaras skolas 2026 datums un vieta ir zināmi
    8 janv., 2026
  • Iznākusi raidieraksta “Digitālās humanitārās zinātnes” 12. epizode “Programmēšana un mākslīgais intelekts DH”
    16 dec., 2025
  • DHELI seminārs
    26 nov., 2025
  • Notiks seminārs “Kvantitatīvās pieejas vēsturiskajai vizuālajai kultūrai – Padomju kinohroniku piemērs”
    30 okt., 2025
digitalhumanities.lv uzturēšanu atbalsta projekts “Latvijas Universitāte un institūti Eiropas pētniecības telpā – izcilība pētniecībā un sadarbībā” (Nr. 1.1.1.5/3/25/I/011)