Usted está aquí: jueves 24 de agosto de 2006 Ciencias Cómo reconstruir la Torre de Babel

ENTORNO TECNOLOGICO

Cómo reconstruir la Torre de Babel

ECONOMIST INTELLIGENCE UNIT

Se puede decir con fundamento que es el artilugio más útil en la caja de herramientas del viajero espacial. En la Guía de la galaxia para exploradores, Douglas Adams lo describió como "un pez pequeño, amarillo y parecido a una sanguijuela", llamado pez de Babel, que uno se pegaba al oído. Entre tanto, en La guerra de las galaxias se le conocía simplemente como Traductor Universal de Idiomas. Sea cual fuere el nombre, no hay duda del valor práctico de un dispositivo capaz de verter cualquier idioma en otro.

Lo notable es que tales dispositivos están a punto de ser realidad, gracias a un software nuevo de "traducción estadística a máquina". A diferencia de métodos anteriores, que se apoyaban en reglas identificadas por lingüistas que después debían someterse a un tedioso procedimiento de codificación manual para la programación, este nuevo método no requiere ningún conocimiento lingüístico ni un entendimiento experto de un idioma para traducirlo.

El mes pasado investigadores de la Universidad Carnegie Mellon (UCM), de Pittsburgh (EU), comenzaron a trabajar en una máquina a la que, esperan, le bastará escuchar a hablantes de un idioma para aprenderlo, y tal vez más tarde sólo con ver televisión.

En los próximos años habrá una explosión de tecnologías de traducción, señala Alex Waibel, director del Centro Internacional de Tecnología Avanzada de Comunicación, cuyas sedes conjuntas son la Universidad de Karlsruhe, en Alemania, y la UCM. Predice que habrá transferencia automática en tiempo real, la cual permitirá escuchar películas o programas de televisión extranjeros en el propio idioma del espectador, así como máquinas de búsqueda que permitirán a los usuarios revisar archivos multilingües de documentos, de video y audio. Y con el tiempo tal vez lleguen a producirse aparatos electrónicos que funcionen como el pez de Babel, susurrando traducciones al oído mientras otra persona habla un idioma extranjero.

Puede parecer fantasioso, pero ya se ha desarrollado un sistema capaz de traducir discursos o conferencias de un idioma a otro, en tiempo real y sea cual fuere el tema tratado. El sistema no requirió de programación de reglas de gramática o de sintaxis: se le alimentó con gran número de discursos y con sus traducciones exactas (realizadas por humanos) a otro idioma, para realizar análisis estadístico. Una de las razones por las cuales funciona tan bien es que estos discursos procedían de Naciones Unidas y del Parlamento Europeo, donde se aborda una amplia gama de tópicos. "El conocimiento lingüístico se extrae en forma automática de estos enormes acervos de datos", explica Waibel. "La mayor parte del tiempo, los idiomas con los que trabajan los investigadores de traducción en sus laboratorios les resultan tan desconocidos que bien podrían ser extraterrestres."

La traducción estadística abarca un conjunto de técnicas, pero lo que tienen en común es el uso del análisis estadístico, más que reglas precisas, para verter texto de una lengua a otra. La mayoría de los sistemas comienzan con un gran cuerpo de texto bilingüe. Al analizar la frecuencia con que aparecen racimos de palabras muy próximas entre sí en los dos idiomas, es posible discernir cuáles conjuntos se corresponden entre uno y otro. Este enfoque ofrece mucha mayor flexibilidad que los sistemas basados en reglas, pues traduce idiomas con base en su uso real, más que en rígidas reglas gramaticales que no siempre se observan y a menudo tienen excepciones.

Abundan ejemplos de resultados ridículos producidos por los sistemas basados en reglas, incapaces de hacer frente a símiles, ambigüedades o mala gramática. En un caso, una oración escrita en árabe que significaba "La Casa Blanca confirmó la existencia de una nueva cinta de Bin Laden" fue traducida por un programa basado en reglas por "Nueva presencia blanca alpina cinta registrada para café confirma Laden". No sorprende, pues, que los investigadores en este campo hayan emigrado hacia la traducción estadística en los años pasados, comenta Waibel.

El enfoque estadístico, que comienza sin ningún conocimiento lingüístico, podría parecer una extraña forma de hacer las cosas, pero en realidad es notablemente similar al modo en que los humanos intentan traducir idiomas, señala Shou-de Lin, experto en traducción a máquina y hasta hace poco investigador del Instituto de Ciencias de la Información de la Universidad del Sur de California (ICI). "Mira el manuscrito y agrupa símbolos", explica, de manera muy similar a una mente humana que trata de resolver el mismo problema. Pero para que este método funcione es necesario alimentar los voraces sistemas de traducción con números enormes de textos de adiestramiento.

Los sistemas de traducción son de uso limitado si no pueden ser usados por personas en movimiento, como turistas que buscan un restaurante o soldados que hablan a pobladores en una zona de guerra. ¿Qué hay en reserva para remplazar el viejo libro de frases? En los dos años pasados la Agencia de Proyectos Avanzados de Investigación para la Defensa (DARPA, por sus siglas en inglés), unidad de investigación militar estadunidense, ha estado ensayando una serie de proyectos que reúnen software de reconocimiento de discursos, traducción a máquina y síntesis de voz en un dispositivo móvil. Uno de estos proyectos, desarrollado en la UCM y llamado Babilonia, puede hoy realizar traducciones del inglés al árabe iraquí y viceversa. Es un gran adelanto, señala Alan Black, uno de los investigadores del proyecto, no sólo porque los iraquíes pueden responder en su idioma en vez de comunicarse con gestos y movimientos de cabeza, sino porque es capaz de traducir oraciones totalmente nuevas en vez de limitarse a algunos cientos de frases preconcebidas. Está lejos de la perfección, sobre todo por la limitada capacidad de procesamiento de las computadoras de mano; estos sistemas tienden a ser para "dominios específicos", es decir, funcionan bien mientras la conversación se limite a determinado tema.

La siguiente fase, indica Black, será que los dispositivos de traducción puedan ser adiestrados en el campo. La idea es que cuando un viajero encuentre hablantes de un idioma desconocido se pueda adiestrar al aparato exponiéndolo a montones de charlas. En teoría, una vez adquirido un modelo idiomático, se puede dejar el aparato en modo de adiestramiento frente a la televisión, aunque tal vez sea mejor encontrar personas bilingües y pedirles repetir frases preconcebidas que contengan gran cantidad de información lingüística, precisa Black.

Aprender un idioma partiendo de cero, como los humanos, es mucho más difícil que la traducción estadística con textos paralelos. Pero, como el número de textos paralelos de alta calidad es limitado, en particular en idiomas más oscuros, se realizan grandes esfuerzos para desarrollar sistemas de traducción estadística que puedan arreglárselas sin ellos. La meta es utilizar técnicas estadísticas para adivinar la estructura inherente a un idioma y luego deducir lo que significa tal o cual palabra. Si se puede lograr, se abrirá el camino a un traductor universal.

¿Hasta dónde pueden llegar las máquinas traductoras? "No hay razón para que no puedan llegar a ser tan buenas como los humanos, si no es que mejores", sostiene Waibel. De hecho, el doctor Lin y su colega Kevin Knight han estado aplicando técnicas de traducción estadística para tratar de desentrañar antiguos jeroglíficos y escrituras que durante siglos han frustrado a los expertos. "Queremos traducir documentos que nadie ha visto jamás", señala Knight.

Si hay un marco común de referencia sobre el tema, no hay razón para que no sea posible traducir un lenguaje extraño, indica Waibel.

Traducción: Jorge Anaya

 
Compartir la nota:

Puede compartir la nota con otros lectores usando los servicios de del.icio.us, Fresqui y menéame, o puede conocer si existe algún blog que esté haciendo referencia a la misma a través de Technorati.