Se pretende explicar cómo aplicando herramientas libres existentes se pueden usar memorias de traducción con documentos Docbook-XML, lo cual ayuda a simplificar y acelerar el mantenimiento y sincronización de traducciones de documentos, lo cual ha sido hasta hoy necesariamente muy laborioso.
- enumerar los formatos - cómo se ha apañado la gente hasta ahora - el caso de los programas - el esfuerto de TLDP-ES y Juan Rafael
Partiendo de la idea de «Producto Acabado = Programa Software + Manual de Usuario» es obvio que las proyectos de aplicaciones libres acaben documentando a las mismas. Con el tiempo, en función de los orígenes históricos y el desarrollo de los proyectos y las tecnologías en el mercado se ha creado una pléyade de formatos paralelos que hacen todavía más complicado el poco simple esfuerzo de gestionar la creación y mantenimiento de documentación y sus traducciones.
Así es posible encontrarse desde texto más o menos estructurado, páginas del manual (man), ficheros PDF o PostScript, documentos compuestos con Tex/LaTeX o incluso con Troff, HTML (no siempre sintácticamente correcto), el formato info/texinfo de GNU, Linuxdoc-SGML (incorrectamente llamado formato SGML en estos ambientes), Docbook (en las veriones SGML y XML) y en menor medida RTF, MSDOC, OpenOffice/StarOffice. También hay muchísimo material en la web en HTML más o menos integrado en «CMS» que hacen difícil gestionarlos integralmente con el resto de doc.
Afortunadamente son muchos los esfuerzos que están convergiendo en XML en general y en Docbook en particular.
Los que lo hacen a diario saben que trabajar con documentación es desgraciadamente muy poco trivial. Mantener sincronizada la traducción de un documento lo complica aún más. En el mundo profesional eso está básicamente resuelto con el tipo de herramientas que cubre este artículo, pero que se sepa ninguna puede ser ejecutiva de forma nativa en plataformas linux/*ix y tampoco son libres.
Así pues y hasta ahora, si el trabajo de traducir ha sido duro y artesano, el de mantener actualizadas las traducciones lo ha sido muchísimo más, siendo muchos los documentos traducidos abandonados y muy seriamente desactualizados. Y desde el momento en el que existe la técnica de Memorias de Traducción (en adelante MMTT), es un despilfarro inmenso de tiempo, recursos y de conocimiento, en la forma de los pares de traducción que podrían haberse almacenado y reutilizado posteriormente.
Citamos a Corrigan y Foster
SUN: Translation memory systems, known as TM systems, work by looking up segments in a database containing a large number of previously translated segments and their translations. (Segments are pieces of source files, usually sentences, that can be translated reasonably independently.) The database might contain segments that match the input segment exactly or segments that are similar to the segment presented for translation. These translations are then provided to the translator as suggested translations for each segment.
Osea, es una tabla con, básicamente, dos columnas que asocian un segmento (una frase, una expresión o una palabra) en un idioma con su traducción a otro.
¿Y cuál es la ventaja competitiva de las MMTT? Son varias. Al menos:
Y además podemos imaginar otras ventajas.
Aplicaciones: - Trados - Wordtrans - Wordfast - DejaVù Estándares: - TMX - XLIFF
Vamos a mostrar el funcionamiento básico paso a paso.
Lo primero es crear la memoria:
El siguiente proceso sería el de actualización de la traducción porque el documento original ha sido modificado. Pensemos por ejemplo que se trata de un versión corregida del mismo, o una versión nueva de una especificación técnica.
Imaginemos que estamos trabajando en actualizar revisiones de especificaciones técnicas. En una de las versiones anteriores se propuso un borrador para una sección determinada que ha estado en discusión durante varias revisiones y alguna de ellas se retiró por cuestiones de implementación, por ejemplo. Como para cada una de esas revisiones se escribió una traducción, su memoria de traducción contiene el histórico de toda la vida del documento en forma de pares de segmentos traducidos.
Imaginemos ahora que en una de esas revisiones se considera que la tecnología ha cambiado y se recupera el viejo borrador como parte del documento. Al volver a procesar el original, en su más reciente versión, a través de la herramienta de gestión de la memoria de traducción, ésta encontrará las vieja traducción que se realizó varias versiones atrás y las recuperará automáticamente o al menos como sugerencias de traducción, que el traductor sólo tendrá que revisar rápidamente y aceptar. Cuanto más grande sea el texto, mayores serán el ahorro y la productividad.
- Ídem, con un poco de detalle - Los GUI############################## VOY POR AQUÍ ###################################
- presentar poxml - cómo descargarlo, cómo encontrar las fuentes, cómo participar en el desarrollo y cómo contribuir reportes. - explicar cada utilidad
- preparacion XML - preparacion PO - traducción - reconstrucción
- mantenerlo como un desarrollo independiente (como se hizo con scrollkeeper) - documentarlo - repaso de cariño a las aplicaciones. - especificaciones.
- Recomendación encarecida del uso de MMTT - Realimentaciones sobre este trabajo: - mejoras en loor de la claridad - erratas o defectos - otras sugerencias - Se buscan programatas para seguir trabajando en esta peli.
- Artículos de JR - el artículo del tío de Sun: http://developers.sun.com/dev/gadc/technicalpublications/articles/xliff.html - 44 - Norma XML - Norma TMX - Norma XLIFF