Testu hutsarekin lanean


Kodeketa lehenetsia

Testu hutseko fitxategiak - gehienetan .txt luzapena daukate. - testu-informazioa besterik ez dute gordetzen. Ez dago modu argirik zein hizkuntzatako testua gordetzen duten jakiteko. Asko sinplifikatuz, horrek esan nahi du ordenagailuak erabakitzen duela testua ordenagailuaren hizkuntza berean dagoela.


Bistaratze nahasiak

Errusiarra bazara, seguru asko zure ordenagailuak errusieraz egiten du lan: menuak errusieraz daude, irekitzen dituzun fitxategiak errusierazkoak dira, etab. Kasu gehienetan, ordenagailuak uste zuzena dauka fitxategi gehienen edukiari buruz: errusierazko testuak gordetzen dituzte eta, beraz, pantailan ezin dira errusierazko karaktereak besterik erakutsi.

Haatik, japonieratik errusierara itzultzen duzun itzultzailea bazara, eta testu hutsekoak diren japonierazko fitxategiak jasotzen badituzu, ordenagailuak errusiera daukaten fitxategiak direla uste izango du. Izan ere, fitxategiak berak ez dauka informaziorik barruan gorderik daukan testuaren hizkuntzari buruz.

Japonierazko fitxategiaren edukia ondokoa izan daiteke:

とは、コンピュータを利用した翻訳ツールです。

Baina zure testu-editoreak beste modu honetan erakutsi dezake:

OmegaTВ∆ВЌБAГRГУГsГЕБ[Г^ВрЧШЧpµšЦ|ЦуГcБ[ГЛВ≅ВЈБB

Edukiak errusieraz daudela uste duelako... Baina ez da errusiera. Errusieraz erakutsitako japonierazko karaktereak dira.

OmegaT ez da desberdina. OmegaT-k uste du testu hutseko fitxategien edukia automatikoki ordenagailuak lehenetsitako moduan erakutsi daitekeela. Horrek emaitza egokia ematen du ordenagailuak fratsesez lan egiten badu eta ingelesezko fitxategiak jasotzen badituzu, edo ordenagailua alemanezkoa bada eta italierazko fitxategiak jasotzen badituzu.


Karaktere-sortak eta kodeketak

Zergatik da emaitza ona ingelesa eta frantsesa nahastean eta okerra errusiera eta japoniera nahastean? Ingelesak eta frantsesak karaktere-sorta bera erabiltzen dutelako. Bere izena, Latin-1 edo bere aldaeretako bat. Duela gutxira arte, errusierak eta japonierak ez zuten karaktere-sortarik partekatzen. Errusierazko karaktere-sorta gehienek ez dute japoniera kontuan hartzen, ezta alderantziz ere. Emaitza goian erakutsi dena da.

Bezero japoniarrak japonierazko ordenagailu batekin egiten du lan eta japoniera daukaten testu-fitxategiak sortzen ditu. Bezeroaren ordenagailuak hautatutako karaktere-sorta sistema eragilearen eta beste hainbat ezarpenen araberakoa izango da, baina seguru asko errusierazko ordenagailuak gaizki interpretatuko du jatorrizko ordenagailuaren (japonierazko) karaktere-sorta hautatua.

Karaktere-sorta jakin bat darabilen testu-informazioa nola transmititzen den (alegia, fitxategian nola dagoen idatzita, ordenagailuak interpretatu eta erakutsi ahal dezan), kodeketaren araberakoa da. Ordenagailuak fitxategia irakurtzen duenean, bere kodeketaren arabera "dekodetzen" du eta karaktere-sortaren arabera erakusten du. Oro har, kodeketa bati karaktere-sorta bat dagokio...


OmegaT-ren konponbidea

OmegaT-k hiru bide dauzka arazo hau konpontzeko. Hiru bideek Aukerak menuko fitxategi-iragazkiak erabiltzea suposatzen dute.

  1. Testu hutseko fitxategien (hau da, .txt luzapena duten fitxategien) kodeketa zehaztu.
    Fitxagien iragazkien leihoko Testu-fitxategiak atalean, aldatu Sorburu-fitxategien kodeketa <auto>-tik zure .txt fitxategiari dagokion kodeketara.
  2. Aldatu testu hutseko zure fitxategien luzapenak, esaterako .txt-tik .jp-ra japonierako testuetan.
    Fitxagien iragazkien leihoko Testu-fitxategiak atalean, gehitu *.jp sorburu-fitxategien eredua eta hautatu sorburu- eta helburu-kodeketetarako parametro egokiak.
  3. Ireki zure sorburu-fitxategia bere kodeketa modu zuzenean ulertuko duen testu-editore batean eta gorde fitxategia "UTF-8" kodeketa erabiliz.
    Aldatu bere luzapena .txt-tik .utf8-ra.
    OmegaT-k fitxategia UTF-8 motakoa bailitzan interpretatuko du.

Egun, OmegaT-k honela ulertzen ditu testu hutseko fitxategiak

Zure kabuz egiaztatu dezakezu hori, Aukerak menuko Fitxategien iragazkiak aukera hautatuz.

OmegaT-k zerrenda labur hau prestatu du testu hutseko zenbait fitxategi errazago kudeatu ahal ditzazun.

Esaterako, txekieraz dagoen testu-fitxategi bat edukiz gero (gehienetan ISO-8859-2 kodeketa erabiliko duena), luzapena aldatu eta .txt ordez .txt2 idatziz, OmegaT-k modu zuzenean interpretatuko ditu bere edukiak.


Legezko oharrak