Kaip automatiniai internetiniai teksto vertėjai keičia europiečių prieigą prie daugiakalbių ES naujienų

Kaip automatiniai internetiniai teksto vertėjai keičia europiečių prieigą prie daugiakalbių ES naujienų

microstock.lt
6 balandžio, 2024
0 comments

Kalba kaip siena, kalba kaip tiltas

Yra kažkas paradoksalaus Europos Sąjungoje – politiniame darinyje, kuris oficialiai pripažįsta dvidešimt keturias kalbas ir kasmet išleidžia milijardus eurų vertimams, tačiau eilinis pilietis iš Klaipėdos ar Kordobos dažnai negali perskaityti to, kas vyksta Briuselyje, savo gimtąja kalba. Oficialūs dokumentai verčiami, taip, bet naujienų srautas – tas kasdieninis politikos gyvenimas, kuris formuoja viešąją nuomonę – dažnai lieka užrakintas už kalbos barjero.

Ir štai čia įvyko kažkas, ko niekas ypatingai neplanuojo, bet kas pakeitė viską: automatiniai vertėjai tapo pakankamai geri, kad juos pradėtų naudoti ne tik studentai, verčiantys namų darbus, bet ir žurnalistai, politikai, aktyvistai, pensininkai, norintys suprasti, kas gi iš tikrųjų rašoma Vokietijos ar Prancūzijos spaudoje apie jų šalį. Šis pokytis – tylus, technologinis, beveik nepastebimas – galbūt yra vienas reikšmingiausių demokratinių pokyčių Europoje per pastaruosius dešimt metų.

Nuo babeliško chaoso iki DeepL epochos

Prisiminkime, kaip atrodė automatinis vertimas dar 2010-aisiais. „Google Translate” egzistavo, bet jo rezultatai dažnai buvo tokie, kad juos skaityti buvo arba juokinga, arba pavojinga – priklausomai nuo konteksto. Sakiniai, kurie lietuviškai skambėjo kaip poetinė nesąmonė, teksto prasmė, iškreipta iki neatpažįstamumo, terminai, verčiami pažodžiui ir todėl reiškiantys visiškai ką kita. Žurnalistai, kurie bandė remtis tokiais vertimais, darė klaidas. Rimtas klaidas.

Viskas pradėjo keistis apie 2017-uosius, kai į rinką įžengė DeepL – Kelne įsikūrusi kompanija, kuri naudojo giluminio mokymosi neuroninių tinklų architektūrą, iš esmės kitokią nei statistiniai metodai, kuriais rėmėsi ankstesnė karta vertimo įrankių. Rezultatai buvo stulbinantys. Žmonės, kurie vertė tekstus profesionaliai, pradėjo kalbėti apie tai pusiau šnabždomis – tarsi prisipažindami kažką gėdingo: DeepL vertimai kartais buvo geresni nei jų pačių grubūs juodraščiai.

Šiandien situacija dar labiau pasikeitė. „Google Translate” taip pat perėjo prie neuroninių tinklų ir dramatiškai pagerėjo. Atsirado specializuoti įrankiai žurnalistams, naujienų agentūroms, institucijoms. Europos Parlamento vertimo tarnyba eksperimentuoja su mašininiu vertimu kaip pagalbine priemone. Ir svarbiausia – šie įrankiai tapo prieinami kiekvienam, nemokamai, tiesiogiai naršyklėje.

Ką tai reiškia konkrečiam skaitytojui Vilniuje ar Valensijoje

Pabandykime įsivaizduoti konkretų žmogų. Tarkime, tai Rūta – penkiasdešimtmetė mokytoja iš Kauno, kuri domisi Europos politika, skaito lietuviškus portalus, bet nuolat jaučia, kad kažko trūksta. Ji žino, kad „Spiegel” ar „Le Monde” rašo apie ES reikalus išsamiau, giliau, su kitokiu kampu. Bet vokiečių ji nemoka, prancūzų – taip pat.

Dar prieš penkerius metus Rūta turėjo dvi galimybes: arba pasikliauti tuo, ką lietuviški portalai nusprendė išversti ir paskelbti (o tai – labai selektyvi, redaguota versija Europos žiniasklaidos), arba tiesiog atsisakyti ir susitaikyti su informacijos trūkumu. Dabar ji gali atidaryti „Spiegel” straipsnį, paspausti naršyklės vertimo mygtuką arba nukopijuoti tekstą į DeepL, ir per kelias sekundes skaityti lietuvišką versiją, kuri, nors ir ne tobula, perteikia esmę, argumentus, faktus.

Tai skamba paprastai, bet demokratinės implikacijos yra gilios. Europos žiniasklaidos ekosistema nustoja būti hermetiškai uždaryta kalbų silosais. Pilietis gali palyginti, kaip tą patį įvykį apibūdina vokiečių, prancūzų, lenkų, ispanų žiniasklaida. Gali pastebėti, kad tai, kas lietuviškuose portaluose pateikiama kaip „ES pozicija”, iš tikrųjų yra viena iš kelių konkuruojančių interpretacijų.

Žurnalistika transformacijos sūkuryje

Automatiniai vertėjai keičia ne tik skaitytojų, bet ir žurnalistų darbą – ir čia situacija yra sudėtingesnė, nei gali pasirodyti iš pirmo žvilgsnio. Viena vertus, jie atveria galimybes, kurių anksčiau tiesiog nebuvo. Mažų šalių žurnalistai, dirbantys nedidelėse redakcijose su ribotais biudžetais, dabar gali sekti užsienio spaudą kur kas plačiau nei anksčiau.

Lietuvos atveju tai ypač aktualu. Šalis yra nedidelė, žiniasklaidos rinka – maža, redakcijų biudžetai – kuklūs. Turėti nuolatinius korespondentus Briuselyje, Berlyne, Paryžiuje – tai prabanga, kurią gali sau leisti vos vienas kitas leidinys. Tačiau su automatiniais vertėjais žurnalistas gali kasdien peržvelgti keliasdešimt užsienio šaltinių, identifikuoti svarbias istorijas, suprasti kontekstą ir tada jau dirbti toliau – ieškoti lietuviško kampo, kalbinti ekspertus, tikrinti faktus.

Tačiau yra ir kita pusė. Automatinis vertimas sukuria pagundą – ir kai kurie jai pasiduoda – tiesiog išversti svetimą tekstą ir paskelbti jį kaip savo. Tai nėra žurnalistika. Tai yra turinio agregavimas, kuris gali atrodyti kaip žurnalistika, bet nėra. Ir kai šis procesas vyksta masiškai, kai dešimtys portalų publikuoja iš esmės tuos pačius išverstus tekstus, žiniasklaidos ekosistema nuskursta, net jei kiekybiškai atrodo, kad turinio daugėja.

Praktinis patarimas žurnalistams: automatinis vertimas turėtų būti tik pirmasis žingsnis, ne paskutinis. Jis padeda suprasti, apie ką kalbama, bet ne pakeičia savarankišką reportažą. Geriausias modelis – naudoti mašininį vertimą kaip žvalgybos įrankį, o ne kaip galutinį produktą.

Kur technologija vis dar klumpa

Būtų nesąžininga nekalbėti apie ribas. Automatiniai vertėjai padarė milžinišką pažangą, bet jie vis dar klumpa ties dalykais, kurie žmogui atrodo savaime suprantami.

Pirmiausia – kultūrinis kontekstas. Kai vokiečių žurnalistas rašo apie „Realpolitik” arba prancūzas mini „laïcité”, tai nėra tik žodžiai – tai konceptai, turintys gilias istorines ir kultūrines šaknis. Automatinis vertėjas gali perteikti žodžius, bet ne visada – prasmę. Skaitytojas, kuris nežino šio konteksto, gali perskaityti vertimą ir manyti, kad supranta, bet iš tikrųjų gauna tik paviršių.

Antra problema – ironija ir sarkazmas. Politinė žurnalistika mėgsta šiuos įrankius, ir automatiniai vertėjai su jais susidoroja prastai. Sakinys, kuris originale yra aštri kritika, vertime gali pasirodyti kaip nuoširdus komplimentas. Ir atvirkščiai.

Trečia – specifinė terminija. ES institucijų kalba yra savotiškas žargonas, kuris skiriasi nuo kasdienės kalbos. Žodžiai kaip „komitologija”, „trialogai”, „subsidiarumo principas” – tai ne tik techniniai terminai, bet ir konceptai, kurie turi labai tikslias reikšmes. Kai šie terminai verčiami netiksliai, skaitytojas gali susidaryti klaidingą supratimą apie tai, kaip veikia ES sprendimų priėmimo procesas.

Praktinė rekomendacija skaitytojams: kai skaitote automatiškai išverstą tekstą apie svarbų politinį klausimą, visada verta patikrinti bent kelis raktinius terminus originalo kalba. Jei kažkas atrodo nelogiška arba prieštaringa, tikėtina, kad problema yra vertime, ne originaliame tekste.

Europos žiniasklaidos ekosistema: fragmentacija ar integracija?

Yra optimistinis ir pesimistinis scenarijus, ir tiesa, kaip dažnai būna, slypi kažkur tarp jų.

Optimistinis scenarijus sako: automatiniai vertėjai sukuria bendrą Europos žiniasklaidos erdvę. Pilietis iš Talino gali skaityti tą patį, ką pilietis iš Lisabonos. Skirtingų šalių žurnalistai gali sekti vienas kito darbus, mokytis iš skirtingų požiūrių, bendradarbiauti. Europos viešoji erdvė, apie kurią politologai kalbėjo kaip apie svajonę, tampa kiek realesnė.

Pesimistinis scenarijus sako: automatiniai vertėjai sukuria iliuziją supratimo ten, kur jo nėra. Žmonės skaito išverstus tekstus ir mano, kad supranta kitų šalių politinę kultūrą, bet iš tikrųjų gauna tik paviršutinišką, kartais iškraipytą versiją. Tai gali būti net pavojingiau nei nežinojimas – nes žmogus, kuris žino, kad kažko nežino, yra atsargesnis nei žmogus, kuris mano žinantis, bet klysta.

Yra ir trečias aspektas, apie kurį kalbama mažiau: galios asimetrija. Automatiniai vertėjai veikia kur kas geriau didelėms kalboms nei mažoms. Anglų, vokiečių, prancūzų, ispanų – šioms kalboms yra milžiniški mokymo duomenų rinkiniai, ir vertimų kokybė yra aukšta. Lietuvių, latvių, estų, maltietiškos, airių – čia situacija yra sudėtingesnė. Tai reiškia, kad mažų šalių piliečiai gauna prastesnę prieigą prie automatinio vertimo kokybės nei didelių šalių gyventojai. Paradoksas: technologija, kuri turėtų demokratizuoti prieigą prie informacijos, iš dalies atgamina esamas galios struktūras.

Institucijų atsakas ir politikos dimensija

Europos institucijos žiūri į šią transformaciją su mišriais jausmais. Europos Parlamentas turi vieną didžiausių vertimo tarnybų pasaulyje – šimtai žmonių verčia dokumentus į visas oficialias ES kalbas. Tai brangus, lėtas, bet aukštos kokybės procesas. Automatinis vertimas kelia klausimą: ar šis modelis vis dar prasmingas?

Atsakymas nėra paprastas. Oficialūs teisiniai dokumentai reikalauja tikslaus, patikrinto vertimo – čia klaida gali turėti teisinių pasekmių. Bet naujienų pranešimai, piliečiams skirti paaiškinimai, viešosios konsultacijos – čia galbūt mašininis vertimas su žmogaus redagavimu galėtų būti efektyvesnis sprendimas.

Kelios ES institucijos jau eksperimentuoja su šiuo modeliu – vadinamuoju „post-editing” principu, kai mašina verčia, o žmogus patikrina ir ištaiso. Tyrimai rodo, kad tai gali sumažinti laiką ir išlaidas, išlaikant priimtiną kokybę. Tačiau vertėjų profesinės organizacijos į tai žiūri su pagrįstu susirūpinimu – ir ne tik dėl savo darbo vietų, bet ir dėl to, kad „priimtina kokybė” ir „tinkama kokybė” demokratiniam procesui gali būti skirtingi dalykai.

Čia verta paminėti ir „eTranslation” – Europos Komisijos sukurtą mašininio vertimo platformą, kuri yra prieinama viešosioms institucijoms nemokamai. Tai bandymas sukurti europietišką alternatyvą komercinėms platformoms, kuri būtų pritaikyta ES specifinei terminologijai ir atitiktų duomenų apsaugos reikalavimus. Platforma nuolat tobulinama, bet jos žinomumas tarp eilinių piliečių yra labai mažas – kas yra atskira problema.

Kai technologija susitinka su demokratija: ateities kontūrai

Grįžkime prie Rūtos iš Kauno – arba prie bet kurio Europos piliečio, kuris nori suprasti, kas vyksta žemyne, kuriame jis gyvena. Automatiniai vertėjai jam davė kažką realaus ir vertingo: galimybę peržengti kalbos sieną, kuri anksčiau buvo nepereinama. Tai nėra maža.

Bet kartu reikia būti sąžiningais apie tai, ko technologija negali duoti. Ji negali duoti konteksto, kuris ateina iš metų praleistų suprantant kitos šalies politinę kultūrą. Ji negali duoti kritinio mąstymo, kuris leidžia atskirti, kada vertimas yra patikimas, o kada – klaidinantis. Ji negali pakeisti žurnalistikos, kuri remiasi šaltiniais, tikrina faktus ir kuria originalų turinį.

Ateityje tikėtina, kad automatiniai vertėjai taps dar geresni – ypač su didelių kalbų modelių integracija, kuri leidžia suprasti ne tik žodžius, bet ir kontekstą. Jau dabar eksperimentuojama su sistemomis, kurios gali ne tik išversti tekstą, bet ir pridėti kultūrinius paaiškinimus, pažymėti vietas, kur vertimas gali būti netikslu, nurodyti alternatyvias interpretacijas.

Tačiau technologinis optimizmas neturėtų užgožti struktūrinių problemų. Europos žiniasklaidos ekosistema yra susiskaldžiusi ne tik dėl kalbų, bet ir dėl verslo modelių, nacionalinių politinių kultūrų, skirtingų žurnalistikos tradicijų. Automatiniai vertėjai gali padėti peržengti kalbos barjerą, bet jie negali sukurti bendros Europos viešosios erdvės iš nieko.

Tam reikia kažko daugiau: investicijų į daugiakalbę žurnalistiką, paramos tarpvalstybiniams žiniasklaidos projektams, medijų raštingumo ugdymo, kuris moko piliečius kritiškai vertinti tiek originalius, tiek išverstus tekstus. Automatiniai vertėjai yra puikus įrankis – bet įrankis visada yra tik tiek geras, kiek geri yra žmonės, kurie jį naudoja, ir kiek gera yra sistema, kurioje jis veikia.

Galbūt svarbiausia pamoka yra tokia: technologija atvėrė duris, kurių anksčiau nebuvo. Bet pro tas duris vis tiek reikia eiti pačiam – su smalsumo, kritinio mąstymo ir noro suprasti, o ne tik perskaityti, bagažu. Ir tai, kad dabar galime eiti – tai jau yra kažkas.