Pētniecības projekti Tilde kā pētniecības uzņēmums aktīvi piedalās ES līdzfinansētos projektos, tādējādi veicinot novatoriskas idejas un sagatavojot savai attīstībai nepieciešamo pētījumu bāzi. Esam izveidojuši ciešu sadarbību ar vadošajām Eiropas universitātēm un valodu tehnoloģiju uzņēmumiem zināšanu apmaiņas un progresīvo pētījumu jomā. Vairākos vērienīgos ES pētniecības projektos esam strādājuši par dažādu ES Septītās pamatprogrammas (7. PP) projektu koordinatoriem. Pētniecības projekti ir saistīti ar mūsu pētniecības kompetences pamatjomām: Aktuālie projekti Lai pilnībā izmantotu milzīgo potenciālu, kāds ir jau izstrādātajām statistiskās mašīntulkošanas (SMT) atvērtajām tehnoloģijām, mēs ierosinām veidot novatorisku tiešsaistes sadarbības platformu datu apmaiņai un mašīntulkošanas datu krāšanai. Šajā platformā varēs augšupielādēt publiski pieejamus un patentējamus MT mācību datus un veidot daudzas publiskas vai patentētas MT sistēmas, apvienojot datus un nosakot to prioritāti. Projektā lietotāju iesniegtajiem datiem varēs izmantot vismodernākās esošās SMT metodes, lai uzlabotu mašīntulkošanas kvalitāti, kā arī tematisko un valodu klāstu.
Viens no lielākajiem automātiskās tulkošanas turpmākas attīstības šķēršļiem daudzās valodās un nozarēs ir valodas resursu trūkums. Projekta ACCURAT pētījumu galvenais mērķis ir atrast, analizēt un novērtēt jaunas metodes, kā kompensēt šo valodas resursu trūkumu, izmantojot salīdzināmu tekstu korpusus, lai ievērojami uzlabotu MT kvalitāti ierobežotu resursu valodās šauras specializācijas nozarēs.
Projekta META-NORD mērķis ir izveidot atvērtu lingvistisko infrastruktūru Baltijas valstīs un Ziemeļvalstīs (Dānijā, Igaunijā, Īslandē, Latvijā, Lietuvā, Norvēģijā, Somijā un Zviedrijā). Projekta uzdevums ir apkopot dažādus valodas resursus, ko izmanto dažādas mērķauditorijas grupas zinātniskajās aprindās un dažādās nozarēs, savstarpēji saistīt šos valodas resursus un nodrošināt to plašu pieejamību (META-NORD projekta pamats ir sintaktiski marķēti korpusi, vārdu tīkli un daudzvalodu terminoloģija). Projekts tiek īstenots ciešā saistībā ar META-NET un citiem saistītiem pasākumiem, lai izveidotu Eiropas mēroga atvērtu resursu apmaiņas platformu. Projekta tīmekļa vietne
Projekta TTC mērķis ir izmantot mašīntulkošanas (MT) rīkus, datorizētās tulkošanas (CAT) rīkus un daudzvalodu satura pārvaldības rīkus, lai automātiski ģenerētu bilingvālus terminoloģijas resursus no salīdzināmu tekstu korpusiem piecās Eiropas valodās (angļu, franču, vācu, spāņu valoda, kā arī viena ierobežoto resursu valoda — latviešu valoda), kā arī ķīniešu un krievu valodā. Projekta tīmekļa vietne
Projekts veicinās cilvēku ar invaliditāti un gados vecāku cilvēku sociālo līdzdalību, nodrošinot starpvalodu un multimodālu atbalstu, lai piekļūtu informācijas bāzei par palīgrīkiem un palīgtehnoloģijām. Pēdējā laika panākumi šajā jomā ir Eiropas portālā EASTIN (www.eastin.info) apkopotās palīgtehnoloģiju informācijas bāzes. Šis portāls tiks uzlabots un kļūs vēl pieejamāks, izmantojot valodas tehnoloģiju.
Projekta Tripod pamatmērķis bija pārveidot piekļuvi milzīgajiem vizuālās multivides resursiem. Projektā Tripod ar novatorisku starpdisciplīnu pieeju tika izmantots milzīgs līdz šim neapgūtu, precīzu un regulāri atjauninātu semantiskās informācijas avotu klāsts, lai izveidotu jaunus intuitīvās meklēšanas pakalpojumus, kas sniegtu lietotājiem iespēju šajā aizvien augošajā resursā viegli piekļūt tieši viņiem nepieciešamajam attēlam. Projekta tīmekļa vieta
Projektā MIAUCE tika pētīti un izstrādāti paņēmieni, kā analizēt lietotāju multimodālo izturēšanos reālos apstākļos. Multimodālās izturēšanās veidi ir skatiens/uzmanības noturēšana, acu mirkšķināšana un ķermeņa kustības. Tika izpētīti un izstrādāti paņēmieni, kā analizēt lietotāju multimodālo izturēšanos kontrolētā vidē. Analīzes rezultātā iegūto informāciju var pielāgot lietotāju vajadzībām un situācijai. Projekta mērķis ir izstrādāt paņēmienus cilvēka kontrolētai mijiedarbībai ar apkārtni, nevis cilvēka mijiedarbībai ar datoru vai savstarpējai cilvēku mijiedarbībai. Projekta tīmekļa vietne
Projektā CLARITY tika izstrādāti starpvalodu informācijas ieguves paņēmieni, kurus var izmantot arī, ja pieejami minimāli tulkošanas resursi, piemēram, valodu modeļi, lai samazinātu tulkošanas procesā sastopamo daudznozīmību, metodes vārdu tulkošanai bez standarta tulkošanas informācijas, un paņēmieni, kā tulkot no vienas valodas citā, izmantojot starpniekvalodu. Projektā tika izpētītas ieguves metodes, apstrādājot jauktus runas dokumentu un dažādās valodās sarakstītu dokumentu kopumus. Tika pētīti vairāki sistēmas lietojamības uzlabošanas un starpvalodu un runas dokumentu efektīvākas parādīšanas un organizēšanas paņēmieni. Pamatojoties uz jēdzienu hierarhijām, tika izstrādāts rīks dokumentu organizēšanai tiešsaistē, dokumenta stila identificēšanas metode un dokumenta pamatdomas noteikšanas metode, lai tulkotu nelielus dokumentu kopsavilkumus. Tika pētīta starpvalodu informācijas ieguves problēma Baltijas valstu valodās un izstrādāti risinājumi.
Projekts EuroTermBank tika realizēts Eiropas Komisijas eContent programmā 2004. 2007. gadā, un tā mērķis bija veicināt terminoloģijas datu pieejamību un apmaiņu, tiešsaistes terminoloģijas datu bāzē vācot, apkopojot un izplatot esošos un neapkopotos terminoloģijas resursus. Sākotnēji EuroTermBank uzdevums bija palīdzēt uzlabot terminoloģijas infrastruktūru vairākās Eiropas Savienības jaunajās dalībvalstīs (Latvijā, Lietuvā, Igaunijā, Polijā, Ungārijā), tomēr projekta darbība tagad ir izvērsusies citās ES valstīs un pat ārpus ES.
Projekta SOLIM mērķis ir uzlabot kontekstatkarīgo informācijas analīzi, paplašinot vismodernākās ontoloģijas valodas un papildināt tās ar izpratni par telpu, uzlabojot automātisko spriešanu. Tādējādi semantisko sistēmu pasaulē tiks ieviesti telpas un pārmaiņu jēdzieni, un tās vairs nebūs statiskas.
SEMO Projekta SEMO mērķis ir izstrādāt jaunu intelektisko tehnoloģiju, kas izgūst metadatus no papīra un elektroniskiem dokumentiem neatkarīgi no to veida, struktūras vai valodas. Papīra dokumenti vispirms tiek digitalizēti, pēc tam apstrādāti ar rakstzīmju optiskās atpazīšanas (OCR — optical character recognition) programmatūru, bet pēc tam tiek ievadīti sistēmā metadatu izguvei. Metadatu izguves rīks analizē ievadīto strukturēto failu, atpazīst metadatu tipu, klasificē un pēc tam izgūst dokumenta saturu. Speciālā pārbaudes procedūrā tiek vērtēta atpazīšanas un izguves kļūdu iespējamība un novērtēta katra apstrādātā dokumenta kvalitāte. |




