Mākslīgā intelekta asistents daudzvalodu sapulču pārvaldībai

Statuss uz 01.02.2021

2021. gada I ceturksnī pētījumā “Mākslīgā intelekta asistents daudzvalodu sapulču pārvaldībai” (1.1.1.1/19/A/082) turpināts darbs aktivitātē 1.1 “Vairāku runātāju runas atpazīšana”, un uzsākts darbs aktivitātē 2.1 “Sapulču plānošana, izmantojot mākslīgo intelektu”. Šajā atskaites periodā tika sagatavoti pētījuma plāni apakšaktivitātēm, apzināti galvenie problēmjautājumi un uzdevumi, kā arī uzsākta pētījumiem nepieciešamo datu kopu un jaunāko literatūras avotu apkopošana un analīze. 

 Aktivitātē 1.1 “Vairāku runātāju runas atpazīšana” tika konstatēts, ka runātāju diarizācijas un runātāju atpazīšanas uzdevumā var tikt pielietoti modeļi un datu kopas citām valodām, bet pārklājošas runas atpazīšanas uzdevumā var lietot sintētiskus datus. Līdztekus tika analizēti algoritmiski risinājumi, kas ļautu veikt audioierakstu ar vairākiem mikrofoniem un korekti apvienot ASR atpazīšanas rezultātus.

 Aktivitātē 2.1 “Sapulču plānošana, izmantojot mākslīgo intelektu” iesākta apakšaktivitātes sagatavošana, apzināti galvenie pētāmie jautājumi, uzsākta pētījumam nepieciešamo datu kopu un jaunāko literatūras avotu apzināšana un analīze. Pētītas iespējas izmantot neironu tīklos balstītus mašīnmācīšanās risinājumus sapulču efektīvākai plānošanai un potenciāli derīgu laikspraugu atrašanai. Aplūkotas esošu metožu un risinājumu izmantošanas iespējas.

Publicēts: 01.02.2021

Mākslīgā intelekta asistents daudzvalodu sapulču pārvaldībai

2020. gada  8.septembrī tika parakstīts līgums starp Centrālo finanšu un līguma aģentūru un Sabiedrību Tilde par darbības programmas “Izaugsme un nodarbinātība” 1.1.1.specifiskā atbalsta mērķa “Palielināt Latvijas zinātnisko institūciju pētniecisko un inovatīvo kapacitāti un spēju piesaistīt ārējo finansējumu, ieguldot cilvēkresursos un infrastruktūrā” 1.1.1.1. pasākuma “Praktiskas ievirzes pētījumi” ietvarā īstenojamo projektu:

Mākslīgā intelekta asistents daudzvalodu sapulču pārvaldībai (1.1.1.1/19/A/082).

Projekta īstenotājs - Sabiedrība Tilde .

Projekts ilgs no 2020. gada 1. Oktobra līdz 2023. gada 30. septembrim.
Projekta kopējas attiecināmās izmaksas ir 616 396.03 EUR, t.sk., ERAF atbalsts 425 783.82EUR.
Projekta īstenošanas vieta – Vienības gatve 75a, Rīga, Latvija

Šis starpdisciplinārais projekts pētīs jaunas, mākslīgā intelekta tehnoloģijās balstītas metodes un izstrādās eksperimentālu daudzvalodu mākslīgā intelekta balss asistenta prototipu sanāksmju pārvaldības automatizēšanai, tostarp:

• vairāku dalībnieku sanāksmju organizēšana, izmantojot uz dialogu balstītu virtuālo asistentu;
• daudzvalodu runas atpazīšanas nodrošināšana akustiski sarežģītā vidē;
• daudzvalodu sanāksmju sekmēšana, nodrošinot sanāksmju automatizētu runas tulkošanu reāllaikā;
• automātiski nodrošināt sanāksmju atšifrējumus;
• automātiski ģenerē jēgpilnus īsus sapulces protokolus.

Pateicoties mākslīgā intelekta (MI) tehnoloģiju attīstībai, virtuālie asistenti — programmatūras risinājumi, kas ļauj cilvēkiem sazināties ar skaitļošanas ierīcēm dabiskajā valodā, — kļūst arvien populārāki, taču to iespējas un valodu atbalsts joprojām ir būtiski ierobežots. Virtuālo asistentu izmantošana sapulču pārvaldībā joprojām ir izstrādes agrīnajā posmā un saskaras ar dažādiem tehnoloģiskiem un lingvistiskiem izaicinājumiem, kuru starpā jāmin akustika un audio kvalitāte, runas atpazīšana sapulču ierakstiem, vienlaicīga runāšana, atsevišķu runātāju runas īpatnības un nepieciešamība pārtulkot runu reāllaikā.

Projekts risina šīs problēmas, pētot jaunas, dziļās mašīnmācību metodes cilvēka un datora mijiedarbībai, reālā laika runas tulkošanai un semantiski nozīmīgu sanāksmju protokolu ģenerēšanai valodās, kurās pieejami mazāki resursi. Projekta mērķis ir izveidot unikālu integrētu risinājumu, proti, MI asistentu, kas ietvertu būtiskus elementus daudzvalodu sanāksmju automatizēšanai, un to efektivitātes palielināšanai. Šis mērķis tiks sasniegts, īstenojot kompleksu starpdisciplināru pieeju, kas nodrošinās pirmreizīgu sadarbību starp lingvistiem, speciālistiem balss un skaņas apstrādē, datorzinātniekiem un mašīntulkošanas speciālistiem, kas apvienosies vairākos rūpnieciskās pētniecības procesos, kas vērsti uz praktiski pielietojamu metožu izpēti, lai:

• uzlabotu runas atpazīšanas kvalitāti daudzbalsīgā un akustiski izaicinošā vidē;
• nodrošinātu daudzvalodu runas atpazīšanu un prezentēšanu reāllaikā;
• veidotu jēgpilnu runājošā satura mašīntulkošanu reāllaikā;
• nodrošinātu automatizētu sapulces protokolu, apkopojot galvenos sarunu punktus, secinājumus un lēmumus;
• veicinātu inovatīvu un progresīvu attīstību automatizētās runas atpazīšanas, mašīntulkošanas un teksta analīzes jomās, valodās ar mazākiem resursiem, piemēram, latviešu

Publicēts: 02.10.2020