Digitālie resursi un mākslīgā intelekta tehnoloģijas
latviešu valodas ilgtspējai


DigiLATEs projekta dalībnieki no LU MII piedalās LU HZF Latvistikas un baltistikas nodaļas rīkotajā starptautiskajā zinātniskajā konferencē "Gramatika un semantika": Gunta Nešpore-Bērzkalne – priekšlasījums "Vairākvārdu leksēmu varianti elektroniskajā vārdnīcā „Tēzaurs”; Baiba Valkovska un Roberts Darģis – stenda referāts "Vārdu skices „Nacionālajā korpusu kolekcijā”"; doktorante Agute Klints – stenda referāts "Hierarhiskās attieksmes „Latviešu valodas leksiskajā tīklā”".
Projekts “Digitālie resursi un mākslīgā intelekta tehnoloģijas latviešu valodas ilgtspējai” (Nr. VPP-IZM-Letonika-2025/1-0004) tiek īstenots Valsts pētījumu programmā "Letonika latviskas un eiropeiskas sabiedrības attīstībai".
Projekta Nr.: VPP-IZM-Letonika-2025/1-0004
Projekta īstenošana: 2025. gada 22. decembris – 2028. gada 21. decembris
Projekta kopējais finansējums: 1 320 600 EUR
Projekta finansētājs: LR Izglītības un zinātnes ministrijas Latvijas Zinātnes padome
Projekta partneri: Latvijas Universitātes Matemātikas un informātikas institūts (vadošais partneris), Latvijas Universitātes Humanitāro zinātņu fakultāte, RTU Rēzeknes akadēmija
Projekta vadītāja: Ilze Auziņa (LU MII)
Kontaktinformācija: [email protected] (LU MII)
Kopsavilkums
Projekta “Digitālie resursi un mākslīgā intelekta tehnoloģijas latviešu valodas ilgtspējai” (DigiLATE) mērķis ir nodrošināt latviešu valodas ilgtspēju digitālajā vidē, attīstot fundamentālus latviešu valodas resursus, pilnveidojot digitālās pētniecības infrastruktūru un izstrādājot inovatīvus, iekļaujošus mākslīgā intelekta risinājumus. Šajā projektā apvienojušās Latvijas vadošās valodniecības, datorlingvistikas un digitālo humanitāro zinātņu institūcijas, kuru mērķis ir radīt nozīmīgus digitālos latviešu un latgaliešu valodas resursus. DigiLATE plānots izveidot un analizēt runas atpazīšanas un sintēzes sistēmas, latviešu valodas lietojumiem novērtēt lielos valodas modeļus, radīt jaunus runas, teksta un zīmju valodas korpusus, kā arī pilnveidot galvenās latviešu valodas resursu platformas Tēzaurs.lv un Korpuss.lv. Lai turpinātu mūsdienīgu valodas datu attīstību, paredzēti arī lingvistiski pētījumi par spontānās runas sintaktisko un prosodisko marķēšanu, kā arī pētījumi, kas nodrošina dabiskās valodas apstrādes tehnoloģiju izstrādi latgaliešu valodai. DigiLATE inovācijas valodniecībā un mākslīgā intelekta tehnoloģijās nostiprinās Latvijas pozīcijas digitālajās humanitārajās zinātnēs, kā arī nodrošinās sabiedriskās zinātnes attīstību un iekļaujošus mākslīgā intelekta risinājumus cilvēkiem ar īpašām vajadzībām. Projekta rezultāti kā atvērtie dati būs pieejami atbilstoši FAIR principiem un tiks integrēti tādās Eiropas pētniecības infrastruktūrās kā CLARIN un DARIAH.
Projekta uzdevumi: (a) ģeneratīvā mākslīgā intelekta pētniecība un attīstība lietošanai latviešu valodas uzdevumos; (b) latviešu valodas digitālo resursu pilnveide, nodrošinot to integrāciju Eiropas valodas resursu infrastruktūrā; (c) latviešu valodas tehnoloģiju attīstība, tostarp risinājumi cilvēkiem ar invaliditāti; (d) latviešu zīmju valodas tehnoloģiju attīstība.
Projekta virzieni uzdevumu īstenošanai:
WP1 Mākslīgā intelekta modeļu novērtēšana un pielāgošana latviešu valodai
WP2 Latviešu valodas resursu attīstība un integrācija Eiropas daudzvalodu iniciatīvās un infrastruktūrā
WP3 Pētījumi jaunu valodas resursu un rīku attīstībai
WP4 Latviešu valodas digitālo resursu un rīku infrastruktūras pilnveide
WP5 Latviešu zīmju valodas resursu attīstība un eksperimentāli risinājumi
