viernes, 30 de noviembre de 2012

Virtaal: una herramienta interesante


Virtaal es una herramienta de software libre muy interesante estrenado y manteniendo por Translate.org.za. Es un programa CAT muy sencillo, intuitivo y con la interfaz muy agradable. Resulta adecuado tanto para los que empiezan su aventura con traducción asistida por ordenador como para personas más avanzadas. Virtaal está construido a base de Translate Toolkit por eso puede colaborar con muchos formatos de traducciones e localizaciones (exactamente con todos los archivos entendidos por Translate Toolkit como XLIFF, Gettext PO y MO, distintos archivos Qt: .qm, .ts, .qph, Wordfast MT, TBX, TMX y glosarios de OmegaT).
Virtaal tiene muchas opciones muy interesante pero no voy a describirlas todas. Sin embargo, hay algunas que han llamado mi atención:
·         Corrección automática de errores comunes: si cometemos algún error ortográfico (por ejemplo cambiamos el orden de las letras o comemos alguna letra) el programa automáticamente lo corrige (como Word)

·         Completado automático de palabras largas: el programa propone sugerencias para las palabras más largas que se ha usado anteriormente. Así, podemos aumentar la velocidad al teclear.

·         Ayuda terminológica y las sugerencias de memorias de traducción: Virtaal ofrece distintas sugerencias de traducción de cadenas completas del texto original a partir del archivo actual pero también de traducciones previas memorizadas por el programa. Ésas se muestran bajo el área de edición u se puede elegir entre ellas la que más nos conviene.


Más información sobre el programa se puede encontrar en su página oficial. También se puede descargarlo de allí.

Bibliografia:
Alastair Otter, Virtaal simplifies software translation, Tectonic, 2008-10-22: http://tectonic.co.za/?p=3416

Formato TMX


El formato TMX es algo totalmente nuevo para mí. Pero gracias a nuestras clases ya conozco la importancia de este formato para los traductores. Por eso quiero dedicar una entrada de mi blog para describir y explicar que es el formato TMX y para qué sirve.
El formato TMX (acrónimo en inglés de Translation Memory eXchange) es un formato estándar de XML y sirve para el intercambio de memorias de traducción entre distintos programas CAT. Es un formato más popular de MT que colabora con casi todas las herramientas CAT. Su propósito principal es facilitar el intercambio de datos de MT sin la pérdida de éstos tras el proceso de traducción. Mediante la aplicación del formato TMX es más viable la colaboración en proyectos de traducción de personas o empresas que usan sistemas de traducción asistida diferentes (porque es el formato estándar). El formato TMX también hace más fácil la migración de datos de un sistema de traducción asistida a otro.
Pincha aqui para acceder al programa TMX Maker que cambia el formato .txt en .tmx.
En mi opinión, la mayor ventaja del formato TMX es la posibilidad de colaborar con casi cada la herramienta de traducción porque el traductor no está atado solo a un programa CAT. Así pues, si el programa que usa desapareciera del mercado, podría trasladar su memoria de traducción a otra herramienta sin pérdida de información.

Un articulo con mucha 
más información sobre este formato de la revista Tradumática: http://www.fti.uab.es/tradumatica/revista/num0/articles/jgomez/art.htm

jueves, 29 de noviembre de 2012

Diferencia entre la traducción automática y las memorias de traducción.


Mucha gente a veces confunde las herramientas de traducción automática con las de memorias de traducción. Por eso, en esta entrada quiero explicar la diferencia entre ellas y describir el funcionamiento de esos programas.

1.      Traducción automática (TA o de inglés AT): es el proceso mediante el cual se utiliza software de ordenador para traducir un texto de un lenguaje natural (como el inglés) a otro (como el español). En un nivel básico, la traducción realiza una sustitución simple de las palabras atómicas de un lenguaje natural por las de otro. Eso significa que si usamos la traducción automática introducimos un texto en una lengua y obtenemos el mismo texto pero en la lengua meta. Normalmente las traducciones son muy básicas y sencillas, con un nivel de errores bastante elevado (todo depende del texto que traducimos). Ahora, una de las herramienta más popular de TA con gran variedad de idiomas es el traductor de Google. Sin embargo existen otros programas las que se puede encontrar aquí: http://www.foreignword.com/es/technology/mt/mt.htm (algunos también para descargar gratuito). Sin embargo, todo el rato diferentes compañías trabajan para desarrollar y mejorar la traducción automática. Se intenta crear herramientas que no solo traducen la palabra sino también “entienden” el contexto y adaptan la traducción a éste. Por eso se distingue diferentes tipos de TA: basada en reglas, en corpus y en el contexto. Más sobre cada de los tipos se puede leer en la página de Wikipedia:
 El desarrollo de TA va muy rápido por eso los traductores “humanos” se preguntan: en el futuro, las maquinas nos sustituirán? J
2.      Programas de memoria de traducción: memorias de traducción son “almacenes compuestos de textos originales en una lengua alineados con su traducción en otra lengua", es decir una base lingüística que se usa para almacenar un texto fuente y sus traducciones. Esta herramienta puede resultar de gran ayuda al traductor, llegando incluso a constituir una alternativa a los diccionarios. Las unidades (o frases) del texto original y de su traducción se guardan alineadas. Así, el traductor puede reaprovechar su traducción porque cuando en una nueva traducción el sistema encuentra alguna frase igual o parecida, propondrá la traducción precedente. Sin embargo, primero el traductor tiene que traducir el texto (o encontrar su traducción y alinearla) porque los programas de memorias de traducción no hacen las traducciones solos como los de TA. Además, los programas de MT contienen algunos recursos que facilitan el proceso de traducción, análisis del documento, búsqueda terminológica, gestión y revisión. Mas informaciones sobre las MT en la próxima entrada o en la página de Wikipedia: http://es.wikipedia.org/wiki/Memoria_de_traducci%C3%B3n


lunes, 26 de noviembre de 2012

Página de gran interés


Algo más que traducir es un blog de Pablo Muñoz Sánchez que encontré buscando la información sobre la localización de los videojuegos. Es una página muy interesante que contiene mucha información sobre la traducción de software de entretenimiento. Pablo es un traductor activo que sabe mucho sobre el tema de la localización y comparte con nosotros sus experiencias. Podemos aprender mucho de sus observaciones y comentarios. Él ganó éxito gracias a su blog. Quizá sea alguna indicación para nosotros?
¡Os recomiendo mucho ese blog!

Blog de Pablo Muñoz Sánchez Algo más que traducir: http://algomasquetraducir.com/


domingo, 25 de noviembre de 2012

El descubrimiento mío: glosbe


En la entrada sobre Linguee escribí que desgraciadamente todavía no hay la versión con lengua polaca. Sin embrago, últimamente he descubierto que hay otra página parecida a la de Linguee que muestra la traducción de palabras en contextos y donde sí que hay lengua polaca. La pagina  se llama Glosbe (http://glosbe.com/) y de verdad tiene mayor variedad de lenguas (incluso tan raras como gaélico, tátaro, mongol etc.). ¡La os recomiendo a todos!

sábado, 24 de noviembre de 2012

Gestión de corpus y alineación


Últimamente las herramientas del traductor han cambiado mucho y ahora una de las más útiles y usadas es el ordenador. Casi todos los textos se traduce en la pantalla del ordenador utilizando los recursos encontrados en Internet. Por eso tan importante es saber buscar la información en Internet y utilizarla en nuestras traducciones. En Internet podemos encontrar textos paralelos a nuestra traducción, o sea, textos parecidos en las que aparecen las mismas expresiones, vocabulario etc. o incluso los mismo textos que son traducidos unos de otros En este caso podemos hablar de corpus paralelos (aquí vale la pena mencionar que según la RAE en español se debería usar solo la palabra “corpus” tanto en singular como en plural, es incorrecto emplear la palabra inglesa “corpora” en singular).. Los corpus pueden ser de varios tipos (bilingües, multilingües etc.) y ahora sobre todo son relacionados con la lingüística computacional (los textos en formato digital). Sin embargo, existe un ejemplo histórico de corpus paralelo multilingüe: la piedra de Rosetta.
WinAlign de Trados
No obstante, para que los corpus nos sirvan para algo tenemos que alinear los textos paralelos (el texto origen y su traducción). Los textos deberían incluir el mismo número de párrafos y frases. Este proceso de alineación de textos es laborioso y nos puede llevar mucho tiempo, por eso vale la pena conocer algunos programas que nos puedan ayudar en elaborar nuestro corpus paralelo propio. En la clase hablamos de las herramientas de código libre Bitext2TMX y LF Aligner, que nos permiten alinear dos textos para crear una futura memoria de traducción. También nos adentramos en el WinAlign de Trados y el alineador de DéjàVu que son las herramientas incluidas en paquetes de esas memorias de traducción. También, en la clase conocimos la versión demo de otro analizador de corpus bilingüe: ParaConc.

Bitext2TMX
Trabajamos un poco con Bitext y me pareció una herramienta de software libre bastante sencilla e intuitiva a la hora de su instalación y uso. Cuando introduzcamos al programa el texto original y su traducción éste los alineará y nos mostrará esa alineación en pantalla. Los textos que subamos al programa tienen que estar en formato .txt porque es el único formato que el programa reconoce. Sin embargo Bitext no hace todo por nosotros. A veces hay que mejorar la alineación porque algunos párrafos o frases no coinciden propiamente. Es la tarea del traductor eliminar las líneas vacías y subir y/o bajar las que están desordenadas. Después, podemos guardar nuestra alineación y obtenemos nuestro archivo .tmx que vamos a usar en la memoria de la traducción.

viernes, 16 de noviembre de 2012

Funciones específicas de Word de gran utilidad para la traducción



Word nos propone algunas funciones muy útiles para la traducción. Yo las conozco a todas porque me gusta mucho la edición de textos y, en mi opinión, el aspecto ortotipográfico de la traducción es muy importante. Sin embargo, las funciones de Word no solo nos permiten mejorar la presentación del trabajo, sino también nos ayudan en la traducción y dejan ahorrar tiempo. J No voy a describir las funciones tan obvias como inserción de imágenes y objetos en un documento o creación de índice porque el nuevo Word (las versiones desde 2007) es muy “intuitivo” y fácil para el usuario y permite encontrar esas funciones muy fácilmente en la barra de arriba. Quiero describir las funciones más avanzadas, un poco mas difíciles, y seguramente no tan conocidos y populares.
1.      “Buscar y reemplazar”.
Es muy útil por ejemplo para:
·         cambiar una o varias palabras en todo el documento por otra(s)
·         buscar los errores más frecuentes que hacemos o que hacen otros (si estamos corrigiendo)
·         buscar dobles espacios y sustituirlos por uno
·         cambiar o quitar el formato de carácter (por ejemplo de negrita a cursiva o subrayar algunos fragmentos).
Todas las funciones bien descritas y explicadas se puede encontrar en la pagina de Microsoft Office, aquí: http://office.microsoft.com/es-es/word-help/buscar-y-reemplazar-texto-u-otros-elementos-HP005189433.aspx
También, en el articulo “Using MS Word’s Advanced Find and Replace Function” de Tibor Környei se presenta algunas opciones más avanzadas e interesantes. Haciendo el trabajo para la calificación seguí las instrucciones del autor y me ayudaron mucho a la hora de hacer los ejercicios. Las funciones descritas por el autor fueron totalmente nuevas para mí, pero al mismo tiempo muy útiles (sobre todo la te sustituir los dobles espacios por uno) y creo que volveré a usarlas en otros textos traducidos. El artículo se encuentra aquí: http://translationjournal.net/journal//15msw.htm
2.      Revisión ortográfica y gramatical
Normalmente Word detecta la lengua automáticamente (sin embargo podemos hacerlo también mecánicamente en la barra de abajo) y busca los errores subrayando palabras erróneas en rojo. Si hay varias opciones (por ejemplo caminara y caminará) intenta “entender” el contexto y subraya la palabra en azul o verde (depende de la versión) proponiendo la versión más adecuada. La corrección se emplea haciendo clic con el botón derecho del ratón. El programa nos propone palabras correctas dentro las que tenemos que elegir la adecuada. Algunas palabras cambia automáticamente, sin subrayado (por ejemplo cuando olvidemos el acento o cambiemos el orden de las letras) que facilita mucho el trabajo. Sin embargo, después de elaborar un texto podemos revisar la ortografía y gramática (pestaña Revisar) otra vez. Esta función nos indica donde, por ejemplo, deberíamos poner una coma o incluso cambiar alguna palabra, si no la ha detectado antes (por ejemplo “los” cambiar a “las”). Además, si Word no conoce alguna palabra (en mi caso no conoce la palabra “ortotipográfica” y la subraya en rojo) la podemos añadir al diccionario para que sea reconocible en otros documentos. Como hacerlo esta explicado con detalles en la pagina ya mencionada de Microsoft Office: http://office.microsoft.com/es-es/word-help/elegir-el-funcionamiento-de-la-revision-ortografica-y-gramatical-HP010354280.aspx?CTT=1#_Toc260387886
3.      Conversión de archivos
Fragmento del texto de nuestra profesora María José López Chollet (en “TIC para traductores”): “El traductor debe saber cómo convertir distintos tipos de archivos (p. ej. archivos de Word en archivos de texto), con el objeto de poder trabajar con software especial de traducción tales como bases de datos de terminología, memorias de traducción, etc.
Guardar un archivo como solo texto (texto sin formato) significa que el contenido textual del documento se guarda como una serie de códigos de carácter. 
Los documentos guardados de este modo pierden toda información de formato excepto la información más básica. Solo se conservarán las tabulaciones y los saltos de párrafo, pues estos elementos se codifican como caracteres.”
Entre las opciones se puede elegir “guardar sin formato” o simplemente guardar como formato diferente (por ejemplo .pdf). Nuestra elección depende de las necesidades, o sea, para que necesitamos el texto. Por un lado, si elegimos la opción “guardar sin formato” (“Guardar como” del Icono de Office) podemos incluso seleccionar la codificación (por ejemplo Unicode). El texto guardado “sin formato” después nos puede ayudar en manipular el contenido del mismo en varios programas diferentes (como programas de alineación de documentos o memorias de traducción). Por otro lado, podemos convertir el texto al formato .pdf. En este formato no se puede hacer cambios, sirve solo para imprimir o leer en línea más fácilmente. Para guardar un texto en formato .pdf hacemos lo mismo que antes: la
opción “Guardar como” del Logotipo de Office, y seleccionamos de la lista PDF o XPS.

viernes, 2 de noviembre de 2012

Wikipedia


A Wikipedia la conocemos todos. Es una fuente de información más popular de Internet y creo que cualquier persona que está leyendo este blog utiliza casi de forma diaria dicha plataforma; y un porcentaje representativo ha incluso participado en el proyecto editando entradas o utilizándolo como referencia. En la página oficial de Wikipedia española podemos leer: Wikipedia es una enciclopedia librenota y políglota de la Fundación Wikimedia —una organización sin ánimo de lucro—. Sus más de 20 millones de artículos en 282 idiomas y dialectos han sido redactados conjuntamente por voluntarios de todo el mundo, y prácticamente cualquier persona con acceso al proyecto puede editarlos. Iniciada en enero de 2001 por Jimmy Wales y Larry Sanger, es actualmente la mayor y más popular obra de consulta en Internet. Como herramienta tan potente pienso que vale la pena tenerla en cuenta porque puede resultar muy útil no solo para buscar información sino también como una herramienta en la labor de un traductor. Como tiene muchas versiones lingüísticas podemos usarla como un glosario: para encontrar términos específicos junto con sus explicaciones. Por ejemplo tenemos una palabra inglesa de medicina “stroma (animal tissue)” y queremos traducirla en español. Así pues, la ponemos en la ventanita de búsqueda de Wikipedia inglesa y cuando ya tenemos la explicación de término en ingles al margen izquierdo bajo “En otros idiomas” buscamos “español” y hacemos clic. Aquí tenemos la traducción al español con la explicación (“estroma”). También, en la explicación podemos encontrar vocabulario conectado con el tema de “estroma” que puede resultar útil para nuestra traducción (por ejemplo otros términos específicos, colocaciones, algunas explicaciones más). Sin embargo siempre hay que recordar que cualquier persona puede colaborar en el proyecto de Wikipedia por eso a veces la información que Wikipedia contiene es tendenciosa o falsa. Por eso, deberíamos acordar de comprobar el resultado en otros materiales y fuentes accesibles.
A menudo - y es ésta la cuestión que más nos interesa - las traducciones que se han efectuado de una lengua a otra son descuidadas y negligentes, lo que provoca malentendidos y falsos sentidos. Por eso nosotros, como futuros traductores, también podemos formar parte de este proyecto colaborativo y aportar nuestras traducciones propias o/y mejorar las ya hechas. Para hacer eso, hay que crear una cuenta de Wikipedia (yo he creado una como Katia W). Es muy simple, no hay que dar sus datos personales, basta solo el correo electrónico. Todo el proceso no tarda más de 2 minutitos. Cuando ya tenemos nuestra cuneta debemos acceder al "Portal de la comunidad” (en el margen izquierdo de la página) y repasar las normas generales y ayudas básicas que esta web proporciona. Para la orientación de nuevos usuarios, Wikipedia cuenta con una serie de ayudas como una introducción general a cuestiones básicas, una zona de pruebas para practicar creando nuevas entradas, e incluso un programa de tutorías en el que un conjunto de usuarios veteranos voluntarios se ofrecen a actuar como tutores (¡algo muy muy interesante!). Si queremos traducir alguna pagina bajamos hasta la sección “Cómo puedes colaborar” y pinchamos en el enlace “traducir al español”. A continuación en la sección “Lista de artículos propuestos y en desarrollo” elegimos el idioma del cual queremos traducir y cualquier de los artículos sugeridos. Valdría la pena traducir una página que todavía no existe en español (señalada en rojo) pero también se puede corregir alguna traducción dudosa. Ambos serán buenos ejercicios de traducción para nosotros. Cuando terminemos nuestra traducción, para ver cómo quedaría podemos elegir la opción “mostrar previsualización” y después, si nos gusta, pinchamos en “grabar la página”. Si no, podemos volver y mejorar el texto. Además, a la hora de traducir Wikipedia nos propone una serie de recomendaciones para un artículo, así como un taller idiomático en el que ofrecen apoyo en la traducción de pasajes, frases, modismos, argots, etc. No obstante, podemos no solo traducir sino también editar cualquier artículo de Wikipedia haciendo clic en la opción “Editar” arriba del artículo. Así, podemos corregir los errores estilísticos o la información errónea que aparecen en los textos. Siempre vale la pena consultar “Manual de estilo” de Wikipedia que nos puede ayudar mucho en la hora de corregir/traducir/escribir artículos.
En resumidas cuentas, por un lado, Wikipedia representa para futuros traductores como nosotros una oportunidad indudable para la práctica traductológica y la familiarización con entornos colaborativos de trabajo (por ejemplo trabajo en grupos sobre una traducción). Por otro lado, podemos servirnos de ella como base de datos terminológica o glosario; siempre teniendo en cuenta que el contenido es libre y abierto, puede ser modificado por cualquier persona, y por tanto, resulta necesario filtrar y corroborar la información que buscamos y encontramos.

Más información sobre procedimiento de corrección y revisión de la Wikipedia se puede encontrar en el artículo “La capacidad de autocorrección de la Wikipedia” de Álvaro Ibáñez publicado en la revista “La Linterna del Traductor”: