sábado, 24 de noviembre de 2012

Gestión de corpus y alineación


Últimamente las herramientas del traductor han cambiado mucho y ahora una de las más útiles y usadas es el ordenador. Casi todos los textos se traduce en la pantalla del ordenador utilizando los recursos encontrados en Internet. Por eso tan importante es saber buscar la información en Internet y utilizarla en nuestras traducciones. En Internet podemos encontrar textos paralelos a nuestra traducción, o sea, textos parecidos en las que aparecen las mismas expresiones, vocabulario etc. o incluso los mismo textos que son traducidos unos de otros En este caso podemos hablar de corpus paralelos (aquí vale la pena mencionar que según la RAE en español se debería usar solo la palabra “corpus” tanto en singular como en plural, es incorrecto emplear la palabra inglesa “corpora” en singular).. Los corpus pueden ser de varios tipos (bilingües, multilingües etc.) y ahora sobre todo son relacionados con la lingüística computacional (los textos en formato digital). Sin embargo, existe un ejemplo histórico de corpus paralelo multilingüe: la piedra de Rosetta.
WinAlign de Trados
No obstante, para que los corpus nos sirvan para algo tenemos que alinear los textos paralelos (el texto origen y su traducción). Los textos deberían incluir el mismo número de párrafos y frases. Este proceso de alineación de textos es laborioso y nos puede llevar mucho tiempo, por eso vale la pena conocer algunos programas que nos puedan ayudar en elaborar nuestro corpus paralelo propio. En la clase hablamos de las herramientas de código libre Bitext2TMX y LF Aligner, que nos permiten alinear dos textos para crear una futura memoria de traducción. También nos adentramos en el WinAlign de Trados y el alineador de DéjàVu que son las herramientas incluidas en paquetes de esas memorias de traducción. También, en la clase conocimos la versión demo de otro analizador de corpus bilingüe: ParaConc.

Bitext2TMX
Trabajamos un poco con Bitext y me pareció una herramienta de software libre bastante sencilla e intuitiva a la hora de su instalación y uso. Cuando introduzcamos al programa el texto original y su traducción éste los alineará y nos mostrará esa alineación en pantalla. Los textos que subamos al programa tienen que estar en formato .txt porque es el único formato que el programa reconoce. Sin embargo Bitext no hace todo por nosotros. A veces hay que mejorar la alineación porque algunos párrafos o frases no coinciden propiamente. Es la tarea del traductor eliminar las líneas vacías y subir y/o bajar las que están desordenadas. Después, podemos guardar nuestra alineación y obtenemos nuestro archivo .tmx que vamos a usar en la memoria de la traducción.

No hay comentarios:

Publicar un comentario