Itzultzaile automatikoek nola funtzionatzen dute?

Argazkia: Beranduegi

Testuak itzultzeko tresna erabilienen artean aurkitzen dira itzultzaile automatikoak. Itzulpena egiteko erabilitako teknikaren arabera akatsak izateko aukera asko daude eta kontuz erabili beharreko tresna bat da.

Itzultzaile automatikoak tresna oso baliagarriak izan dira azken hamarkadan. Interneten erabilera handitzen joan den heinean, informazioa hainbat hizkuntzatan bilatu eta ulertzeko errazagoa egin nahian itzultzea praktika ohikoa bihurtu da. Baita bidaiatzerako orduan ere, hizkuntza desberdinak hitz egiten diren tokietan errazago mugitzea ahalbidetu duelako. Esaterako, ikasleak beraien lanak egiterako orduan, enpresatako komunikazio arduradunek kartelak eta prentsa oharrak egiterakoan, publizistak eta era askotako erabiltzaileak dituzte itzultzaile automatikoak. Hala ere, itzulpen hauek zuzenean erabiltzea arriskutsua da, ez duelako beti itzulpen zehatza ematen eta berrikusi beharra dagoelako hanka sartzeak ekiditeko. Denok ikusi ditugu itzulpen automatikoak eragindako akatsak hainbat erakundek egindako komunikazioetan.

Itzulpen sistema hauetan erantzuna era automatikoan sortzen da. Erantzun hau sortzeko bi teknika erabiltzen dira nagusiki: estatistikan oinarritutako sistemak eta erregeletan oinarritutako sistemak. Lehenengoak, hitzen kontaketan eta probabilitate estimazioetan oinarritzen dira. Testu-bildumak erabiltzen dituzte eredu estatistikoak sortzeko oinarri gisa eta bilatzaileak eredu horretan oinarrituta itzulpen probableena eskaintzen du. Hala ere, arazoak ditu esaldiak eta esanahi bat baino gehiago dituzten hitzak itzultzerako orduan. Teknika honen adibide ezagunena Google Translate da. Bigarrenak aldiz, oinarri linguistikoa dute. Hiztegiak eta hizkuntzari lotutako erregelak erabiltzen dituzte itzulpenak egiteko oinarri gisa eta estatistikoak baino emaitza zentzukoagoak eman arren, hitz polisemikoak hainbat arazo sortzen dituzte. Erregeletan oinarrituta gaztelaniatik euskarara automatikoki itzultzen duen sistema baten adibidea Matxin da, testuaz gain dokumentuak eta webguneak itzultzen dituen zerbitzua.

Arazo guzti hauek konpondu nahian, ikerlariak bide desberdinak aztertzen ari dira. Sare neuronalak izan duten arrakastaz baliatuta, ikasketa sakona (edo “deep learning”) aplikatzeari ekin diote itzulpengintza automatikoan. Metodo berri honek hitzen esanahia bektoreen bitartez eta egitura sintaktikoa matrizeen biderketa bidez adierazten du. Erabili ahala ikasteko ahalmena du eta akatsak gutxitzeko gaitasuna handiagoa da gero eta gehiago erabiltzen bada.Era honetako itzulpen teknika aztertzen ari da EHUko IXA taldea, TADeep eta Modela proiektuetan. Ingelesa, gaztelania eta euskara hautatu dituzte probatarako hizkuntza bezala: lehenengo biak duten informazio bolumenagatik eta euskara morfologikoki anitza eta ordenazio askekoa izategatik. Teknika hau aztertzen ari diren izen ezagunagoak Google, Systran edo Microsoft izan daitezke. Azken hau testuaz gain hitz egiten ari garena ere itzultzen duen aplikazio bat garatzen ari da.

Nahiz eta itzulpengintza automatikoan aurrerapenak egon eta itzulpen zehatzagoak izateko teknikak garatzen ari diren, ez da ahaztu behar itzulitako emaitza makina batek sortzen duela. Beraz, akatsik ez egiteko beti berrikusi eta moldatu beharko da itzulitakoa, batez ere esaldiak itzultzerako orduan kohesioa eta koherentzia mantendu dezan.

ALBISTEAK MUGIKORREAN

Debagoieneko albiste nabarmenenak eta azken ordukoak Whatsapp edo Telegram bidez jaso gura dituzu? Harpidetu zaitez doan!

WHATSAPP: Bidali ALTA 688 69 00 07 telefono zenbakira –Whatsapp bidez–.

TELEGRAM: Batu zaitez @GoienaAlbisteak kanalera.