Kā top mākslīgais intelekts latviešu valodai?

Autore : Madara Mieriņa

Pāris minūšu brauciena attālumā no Rīgas centra, nost no ielas putekļiem un trokšņiem, kādā koku ieskautā Pārdaugavas dārzā atrodas Tildes māja, kurā strādā vairāki desmiti Latvijas dedzīgāko un gudrāko prātu. Šīs noteikti ir Latvijas mākslīgā intelekta mājas, jo no Tildes veidotajām programmām un risinājumiem mākslīgais intelekts piemīt gan mašīntulkošanai un balss tehnoloģijām, gan valodas analīzei un virtuālajiem asistentiem.

Par to, kā top visdažādākie tehnoloģijas labumi, kas ir pieejami mazo valodu lietotājiem un palīdz saglabāt latviešu valodas vērtību, stāsta Tildes komanda ― pētniecības un izstrādes direktors Raivis Skadiņš, starptautiskā biznesa attīstības vadītājs Kaspars Kauliņš un valodas sistēmu biznesa attīstības vadītāja Diāna Butina.

“Pats mākslīgā intelekta sākums ir vajadzība,” stāsta Kaspars. “Ja patērējam daudz resursu kāda darba veikšanai ― laiku, naudu, cilvēku darbu ― un varam kaut ko automatizēt, tiek izstrādātas piemērotas tehnoloģijas.”

Diāna norāda, ka jaunas programmas un rīkus neizdomā viens cilvēks, bet gan komanda. Kopā darbojas gan pētnieki, gan izstrādātāji. Vienmēr tiek domāts par reālo lietojumu dzīvē. “Tā tas ir,” saka Diāna. “Ja eksperimenti ir veiksmīgi pētnieciskajā jomā, domājam, kā varam tos lietot ikdienā. Domājam parasti visi komandā, dažkārt kādam ārpus komandas darbiem ir radusies kāda laba ideja, kas patiešām arī der.”

Lai strādātu šādā komandā, nepietiek vien ar gudrību, ir jābūt vēlmei un degsmei pētīt un radīt. Radošums un atvērtība jaunajam iet roku rokā. Ikkatram no mums ir vēlme un ieinteresētība radīt pasaules līmeņa iespējas mūsu valodai.

“Būtībā vienmēr ir divi virzieni, kas tiek paturēti prātā. Viens ir pētnieciskais un tehnoloģijas attīstības virziens, otrs ― reālais, praktiskais, kad skatāmies, kādu labumu jaunais risinājums var nest reāliem cilvēkiem un uzņēmējiem,” par darba gaitu stāsta Diāna.

“Modernās mākslīgā intelekta tapšanas metodes ir saistītas ar mašīnmācīšanos,” turpina Raivis. “Visa pamatā ir balstīšanās uz lielu apjomu datiem. Ja jebkurā jomā varētu savākt un apkopot datus, mašīna tos apgūtu.” Piemēram, Tildes runas atpazīšanas datos ir simtiem stundu ar ierunātu tekstu, kas ir anotēts. Varam likt datoram mācīties izveidot vajadzīgos modeļus, kā no runātā var nonākt pie rakstītā. Tā ir mašīnmācīšanās, un tas ir nepārtraukts process, datus var papildināt un likt mašīnai mācīties vēl un vēl, un tas arī notiek.

Mašīnmācīšanās atgādina teātra metodi, kad režisors liek spēlēt visu izrādi no sākuma līdz beigām arī tad, kad aktieri vēl it nemaz nav apguvuši tekstu. Tiek izspēlēts viss, un tad var labi redzēt arī vājās vietas, kurām jāpievēršas īpaši.

Diāna piekrīt, ka ne vienmēr kaut ko var radīt ļoti ātri. Arī jaunu rīku izstrāde ir atkarīga no tā, cik labi tajā mirklī ir izstrādāta tehnoloģija. Citreiz paiet gadi, kamēr tiek radīta bāzes tehnoloģija. Dažkārt izstrāde notiek ātri, bet kopumā ar pāris mēnešiem ir jārēķinās.

Ļoti palīdz un darbu noteikti paātrina lietotāju iesaiste produkta izstrādē un testēšanā. Nesen palaidām Tildes Balss lietotni, kuras izstrādes ietvaros bija pozitīva sadarbība ar lietotāju iesaisti jau agrīnā stadijā.

Lai gan dažkārt sabiedrībā ir jūtama neuzticēšanās jaunajām tehnoloģijām, bažas par šādu risinājumu drošumu kliedē Raivis. “Mākslīgais intelekts darbojas, meklējot sakarības,” viņš skaidro. “Ņemsim piemēru ar ārstu.” (Kaspars iestarpina, ka pasaulē jau ir tādas mākslīgā intelekta sistēmas, kas var noteikt diagnozi, protams, ir arī tādas, kas jau veic dažādas operācijas.) Ko dara dakteris? Dakteris saskata sakarības un prot noteikt, ka, ja mums ir temperatūra un iesnas, mēs, visticamāk, esam saaukstējušies.

Mēs uzticamies dakterim, jo viņam ir daudzu gadu pieredze un viņš ir redzējis dažādus gadījumus. Bet, ja savācam šīs sakarības no daudziem dakteriem ― 100 000 sakarību, kuras neviens ārsts atsevišķi dzīvē nekad nav redzējis un nekad nespēs ieraudzīt, ― mākslīgajam intelektam tā zemapziņa ir spēcīgāka, jo viņš ir redzējis vairāk piemēru.

Vai ir droši braukt ar mākslīgā intelekta vadītām automašīnām? Mēs domājam, ka varam uzticēties pieredzējušam sacīkšu braucējam ― viņš ir bijis dažādās situācijās, zina, ko darīt, kad mašīna saslīd. “Iedomāsimies 10 000 mašīnu, kurās ir ielikti visi iespējamie sensori, un tās ir palaistas uz ielas. Pēc gada tās ir savākušas tik lielu datu apjomu, ka dators analizējot saprot, ko šādā brīdī darīt ― viņš zina, ko 10 000 šoferu ir darījuši,” stāsta Raivis.

Kaspars bilst, ka ar mākslīgā intelekta tehnoloģiju lietošanas pieaugumu pasaulē parādās arī likumdošanas neskaidrības, par kurām neviens iepriekš nav domājis ― piemēram, kurš būs vainīgs autoavārijās. Jāņem vērā arī dažādi ētikas aspekti ― kādus lēmumus uzticēt robotam būtu pārlieku riskanti un tie būtu jāatstāj cilvēku ziņā.

Raivis piemetina, ka tikpat neskaidrs ir jautājums par to, vai robotiem ir tiesības mācīties. Lai iegūtu zināšanas, ārsts izpēta informāciju par slimību no daudzu pacientu datiem. Bet vai robots to drīkst? Nē, jo dati ir sensitīvi un tajos ir ziņas par pacientiem. Lai kaut ko noskaidrotu, dodamies uz bibliotēku un meklējam nezināmo grāmatās, bet vai mašīna drīkst iegūt informāciju no grāmatām? Nē, jo grāmatas ir aizsargātas ar autortiesībām. Mēs iepazīstam pasauli, ejot pa ielu. Bet vai robots to drīkst? Nē, jo kādam var rasties iebildumi par to, ka viņa pagalms tiek filmēts bez atļaujas. “Bet kā tad bez šīs informācijas robots var mācīties?” Raivja jautājums paliek neatbildēts.