Presentation by Diego Bartolome, tauyou CEO at the annual conference. It presents an overview of machine translation for freelance translators.
Language: Spanish
Objetivos de la charla Dar una perspectiva histórica de la TA Explicar brevemente los sistemas más habituales Generar discusión / ideas para mejorar ... aprender todos de todos ...
Con modestia La traducción automática es complicada Las máquinas no son personas No es lucha persona contra máquina Ayudarse y avanzar Escuchemos a ...
Los inicios Años 30: primeras patentes sistemas de reglas 1949: Informe de Warren Weaver Años 50: Experimento Georgetown – IBM Traducción 60 frases Ruso – Inglés 6 reglas + 250 unidades en vocabulario En 5 años, problema resuelto ... Reglas manuales + diccionarios bilingües
La realidad Sistemas instalados Objetivo: rapidez Mejoras basadas en Chomsky Lingüística generativa Gramática transformacional Pero las conclusiones es que nunca sería posible Por la ambigüedad Lo que lleva al ALPAC ...
Los años 60 Automatic Lang. Processing Advisory Committee Creado en 1964, liderado por John R. Pierce Informe en 1966 Conclusión básica Investigar más en lingüística computacional Dominios e idiomas limitados – herramientas Consecuencia Reducción de la inversión en TA
Un pequeño lapso ¡De sólo 10 años! Con alguna excepción 1968: Systran para los EEUU y la UE 1970: Logos 1977: Méteo en Canada Sistemas low cost Para documentos técnicos y comerciales Interlingua y transferencia
Finales de los 80 / principios de los 90 3 sistemas principales: Systran, Logos, Metal Interés renovado por 3 motivos principales Aumento de la capacidad computacional Reducción del coste de hardware y software Aparición de los modelos estadísticos (IBM) Métodos basados en ejemplos Principalmente en Japón Proyecto de S2S: Verbmobil
Detalle proyecto Verbmobil Traducción voz a voz en dominios controlados 8 años de investigación – década de los 90 86 millones de Euros invertidos 31 partners Varias spin-offs lanzadas – casos de éxito ... pero Mariño os explicará más
¿Qué está pasando en 2009? Plena efervescencia de sistemas Reglas Basados en ejemplos Estadísticos Basados en contexto Alternativas: crowdsourcing Importantes compañías involucradas IBM, SAP, Google, Microsoft ...
Traducción directa De origen a destino Mediante diccionarios y gramáticas Proceso Traducción palabra a palabra Reglas de reordenación Conclusión Frases sin sentido Puede ser útil en lenguaje controlado
Sistema basado en interlingua (I) Análisis de los idiomas Se crea una entidad común abstracta Idioma pivote A partir de ella, se genera la salida Ventaja: No reglas uno a uno Inconveniente: Creación interlingua (semántica) DLT en Utrecht, Fujitsu .. Antes METAL, Stanford ...
Traducción basada en ejemplos Objetivo: obtener la traducción en base a previas P.ej. memorias de traducción Nació a mediados de los 80 en Japón La clave Combinación de segmentos Técnicas optimizadas Uso de patrones - reglas
Más sobre la SMT Ventajas Rapidez de desarrollo de idiomas y dominios Superioridad en aplicaciones acotadas Alto volumen de texto multilingüe disponible No necesita intervención lingüística Inconvenientes Metodología estadística Cómo particularizar
Comparativa de métodos tesaurus representación universal otros X X datos paralelos X analizador semántico X X X parser X reglas de transferencia X X X diccionarios SMT EBMT Interlingua Transferencia
¿Qué hacen bien las máquinas? Ayudar al traductor Corrección en dominios limitados Amplitud de textos traducidos Velocidad de traducción Aprendizaje continuo
Retos de la traducción automática Disponibilidad de corpus – lenguas minoritarias Combinación sistemas estadísticos y por reglas Unir de forma eficiente traductor y máquina Evaluación de la calidad
Conclusiones La TA es una herramienta útil para los traductores Incremento productividad Disminución costes y tiempos de entrega También tiene inconvenientes No sirve para todo El futuro es híbrido y amplio