La Torre de Babel, símbolo de los problemas de comunicación
Si hay una empresa que no se queda quieta y que no deja de probar cosas es Google, que aparte del conocidísimo buscador con el que se hizo famosa, el correo electrónico gratuito de Gmail y Google Apps, tiene una cartera de servicios mucho más grande de lo que muchos de sus usuarios sospechamos.
Uno de estos servicios menos conocidos es el Traductor de Google, capaz de traducir automáticamente textos entre 52 lenguajes, lo que lo coloca a la cabeza de este tipo de sistemas, al menos en cuanto al número de idiomas soportados.
Tradicionalmente estos sistemas de traducción automática han sido objeto de burla porque no son capaces de analizar el contexto ni los posibles dobles sentidos, ni en muchos casos tienen en cuenta que una palabra puede tener más de un significado, con lo que se dan titulares tan hilarantes como aquel en el que se mencionaba la revista «Estafe» por haber traducido Time como verbo en lugar de como sustantivo.
Ni la inteligencia artificial -que de hecho tampoco es que haya avanzado mucho en general- ni el intentar enseñarle las reglas de un idioma a los programas de traducción han servido de mucho, con lo que la mayoría apenas son útiles para traducir los textos de naturaleza más literal como manuales o textos técnicos.
Pero Google, que si de algo sabe es de echarle potencia informática a los problemas y que tiene a su disposición una enorme potencia de cálculo dada la infraestructura que necesita para, ha decidido darle un enfoque distinto a su sistema y aplicar la estadística.
La idea es que si a un sistema de traducción le das miles o millones de textos y sus correspondientes traducciones realizadas por humanos es probable que sea capaz de aproximar mejor sus traducciones que aplicando reglas.
No es un enfoque nuevo, pues desde mediados de los noventa ya se viene ensayando, pero lo que lo pone aparte en el caso de Google es precisamente su capacidad técnica para manejar volúmenes ingentes de información, y si muchos sistemas de este estilo usan aproximadamente mil millones de palabras para modelar un lenguaje, el de Google usa unos cientos de miles de millones de palabras.
Al tratarse de un sistema basado en la estadística, cuantos más datos tenga -suponiendo que estos sean buenos- mejor funcionará, por lo que Google ha estado alimentándolo con textos de las sesiones de las Naciones Unidas, cuyas actas se traducen a seis idiomas, y de la Unión Europea, que se traducen a 23.
Para idiomas menos hablados ha recorrido la web buscando textos traducidos, ha incorporado también al sistema textos sacados de Google Libros, y ha puesto una serie de herramientas a disposición de los usuarios que los ayudan con la traducción y que luego vuelcan esos datos en este.
Según este sistema vaya mejorando, y aunque no es previsible que vaya a dejar sin trabajo a los traductores de carne y hueso, la visión de Google es que cada vez será más fácil poner en contacto a usuarios de Internet de todo el mundo.
Y su visión va mucho más allá del intercambio de textos en forma de correo electrónico o páginas web, ya que, por ejemplo, está desde hace poco probando un sistema que subtitula vídeos automáticamente en inglés, texto que luego puede ser traducido automáticamente a otros idiomas.
Lo mismo se puede hacer gracias a Google Goggles con textos fotografiados con un móvil a los que se aplique un sistema de reconocimiento óptico de caracteres y que una vez procesados pueden ser también traducidos.
O con el sistema que pasa de voz a texto y viceversa en teléfonos móviles.
Fuente: Cooking Ideas
No hay comentarios:
Publicar un comentario