Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2009 ProZ conference in Barcelona

2009 ProZ conference in Barcelona

Presentation by Diego Bartolome, tauyou CEO at the annual conference. It presents an overview of machine translation for freelance translators.
Language: Spanish

More Decks by tauyou <language technology>

Other Decks in Technology

Transcript

  1. www.tauyou.com [email protected] Enjoy the world! Communication is not a problem

    anymore Human quality machine translation solutions © 2009 Ta with you Conferencia ProZ Octubre 2009
  2. © 2009 Ta with you Conferencia ProZ, Octubre 2009 2

    Introducción ¿De dónde vengo? ¿Dónde estoy? ¿Adónde voy?
  3. © 2009 Ta with you Conferencia ProZ, Octubre 2009 3

    ¿Para qué traducción automática? Usuario final Información web Cliente corporativo Documentación corporativa interna Traductores Herramienta de productividad (?)
  4. © 2009 Ta with you Conferencia ProZ, Octubre 2009 5

    Pregunta ¿Cuántos quieren a la traducción automática? ¿Cuántos la odian? Otras respuestas ...
  5. © 2009 Ta with you Conferencia ProZ, Octubre 2009 6

    Objetivos de la charla Dar una perspectiva histórica de la TA Explicar brevemente los sistemas más habituales Generar discusión / ideas para mejorar ... aprender todos de todos ...
  6. © 2009 Ta with you Conferencia ProZ, Octubre 2009 7

    El problema esencial Comprender el texto (a veces también por causa del creador)
  7. © 2009 Ta with you Conferencia ProZ, Octubre 2009 8

    Con modestia La traducción automática es complicada Las máquinas no son personas No es lucha persona contra máquina Ayudarse y avanzar Escuchemos a ...
  8. © 2009 Ta with you Conferencia ProZ, Octubre 2009 9

    Los inicios Años 30: primeras patentes sistemas de reglas 1949: Informe de Warren Weaver Años 50: Experimento Georgetown – IBM Traducción 60 frases Ruso – Inglés 6 reglas + 250 unidades en vocabulario En 5 años, problema resuelto ... Reglas manuales + diccionarios bilingües
  9. © 2009 Ta with you Conferencia ProZ, Octubre 2009 10

    La realidad Sistemas instalados Objetivo: rapidez Mejoras basadas en Chomsky Lingüística generativa Gramática transformacional Pero las conclusiones es que nunca sería posible Por la ambigüedad Lo que lleva al ALPAC ...
  10. © 2009 Ta with you Conferencia ProZ, Octubre 2009 11

    Los años 60 Automatic Lang. Processing Advisory Committee Creado en 1964, liderado por John R. Pierce Informe en 1966 Conclusión básica Investigar más en lingüística computacional Dominios e idiomas limitados – herramientas Consecuencia Reducción de la inversión en TA
  11. © 2009 Ta with you Conferencia ProZ, Octubre 2009 12

    Un pequeño lapso ¡De sólo 10 años! Con alguna excepción 1968: Systran para los EEUU y la UE 1970: Logos 1977: Méteo en Canada Sistemas low cost Para documentos técnicos y comerciales Interlingua y transferencia
  12. © 2009 Ta with you Conferencia ProZ, Octubre 2009 13

    Finales de los 80 / principios de los 90 3 sistemas principales: Systran, Logos, Metal Interés renovado por 3 motivos principales Aumento de la capacidad computacional Reducción del coste de hardware y software Aparición de los modelos estadísticos (IBM) Métodos basados en ejemplos Principalmente en Japón Proyecto de S2S: Verbmobil
  13. © 2009 Ta with you Conferencia ProZ, Octubre 2009 14

    Detalle proyecto Verbmobil Traducción voz a voz en dominios controlados 8 años de investigación – década de los 90 86 millones de Euros invertidos 31 partners Varias spin-offs lanzadas – casos de éxito ... pero Mariño os explicará más
  14. © 2009 Ta with you Conferencia ProZ, Octubre 2009 15

    ¿Qué está pasando en 2009? Plena efervescencia de sistemas Reglas Basados en ejemplos Estadísticos Basados en contexto Alternativas: crowdsourcing Importantes compañías involucradas IBM, SAP, Google, Microsoft ...
  15. © 2009 Ta with you Conferencia ProZ, Octubre 2009 16

    Detalle de sistemas Directa Transferencia Interlingua Basados en ejemplos En contexto Estadísticos
  16. © 2009 Ta with you Conferencia ProZ, Octubre 2009 17

    Pregunta ¿Cuál es el objetivo de la traducción? ¿Cuál es el objetivo de la traducción automática?
  17. © 2009 Ta with you Conferencia ProZ, Octubre 2009 18

    El proceso es sencillo ... Elegir las palabras adecuadas Ordenarlas correctamente Problemas Gramática/sintaxis Traducción literal Terminología / palabras desconocidas Adiciones / omisiones Ortografía / puntuación / may. / min.
  18. © 2009 Ta with you Conferencia ProZ, Octubre 2009 19

    Traducción directa De origen a destino Mediante diccionarios y gramáticas Proceso Traducción palabra a palabra Reglas de reordenación Conclusión Frases sin sentido Puede ser útil en lenguaje controlado
  19. © 2009 Ta with you Conferencia ProZ, Octubre 2009 20

    Por transferencia (I) Análisis morfológico Categorización léxica Transferencia léxica = traducción Transferencia estructural Generación morfológica Exactitud cercana al 90% o superior ...
  20. © 2009 Ta with you Conferencia ProZ, Octubre 2009 21

    Por transferencia (II) Fuente: Linguatec
  21. © 2009 Ta with you Conferencia ProZ, Octubre 2009 22

    Sistema basado en interlingua (I) Análisis de los idiomas Se crea una entidad común abstracta Idioma pivote A partir de ella, se genera la salida Ventaja: No reglas uno a uno Inconveniente: Creación interlingua (semántica) DLT en Utrecht, Fujitsu .. Antes METAL, Stanford ...
  22. © 2009 Ta with you Conferencia ProZ, Octubre 2009 23

    Sistema basado en interlingua (II) Diccionarios, léxicos, reglas, gramáticas, ... Sólo para lenguaje controlado o muy complicado
  23. © 2009 Ta with you Conferencia ProZ, Octubre 2009 24

    Traducción basada en ejemplos Objetivo: obtener la traducción en base a previas P.ej. memorias de traducción Nació a mediados de los 80 en Japón La clave Combinación de segmentos Técnicas optimizadas Uso de patrones - reglas
  24. © 2009 Ta with you Conferencia ProZ, Octubre 2009 25

    Traducción basada en el contexto Fuente: Meaningful Machines
  25. © 2009 Ta with you Conferencia ProZ, Octubre 2009 26

    Traducción estadística Modelo más realista Fuente: POSTECH, Intelligent Software Lab.
  26. © 2009 Ta with you Conferencia ProZ, Octubre 2009 27

    Más sobre la SMT Ventajas Rapidez de desarrollo de idiomas y dominios Superioridad en aplicaciones acotadas Alto volumen de texto multilingüe disponible No necesita intervención lingüística Inconvenientes Metodología estadística Cómo particularizar
  27. © 2009 Ta with you Conferencia ProZ, Octubre 2009 28

    Comparativa de métodos tesaurus representación universal otros X X datos paralelos X analizador semántico X X X parser X reglas de transferencia X X X diccionarios SMT EBMT Interlingua Transferencia
  28. © 2009 Ta with you Conferencia ProZ, Octubre 2009 29

    ¿Qué hacen bien las máquinas? Ayudar al traductor Corrección en dominios limitados Amplitud de textos traducidos Velocidad de traducción Aprendizaje continuo
  29. © 2009 Ta with you Conferencia ProZ, Octubre 2009 30

    Pregunta Dudas Preguntas Comentarios ¿Es útil combinar tecnología y lenguaje?
  30. © 2009 Ta with you Conferencia ProZ, Octubre 2009 31

    Y el futuro ... Traducción clásica Traducción automática Traducción automática + postedición Crowdsourcing
  31. © 2009 Ta with you Conferencia ProZ, Octubre 2009 32

    Retos de la traducción automática Disponibilidad de corpus – lenguas minoritarias Combinación sistemas estadísticos y por reglas Unir de forma eficiente traductor y máquina Evaluación de la calidad
  32. © 2009 Ta with you Conferencia ProZ, Octubre 2009 33

    Conclusiones La TA es una herramienta útil para los traductores Incremento productividad Disminución costes y tiempos de entrega También tiene inconvenientes No sirve para todo El futuro es híbrido y amplio
  33. © 2009 Ta with you Conferencia ProZ, Octubre 2009 35

    ¡ Gracias ! Diego Bartolomé, PhD Director Ejecutivo, Ta with you C/Ferrer de Blanes 25 08203 Sabadell Tel. +34 937 11 29 96 Móvil +34 670 33 12 25 [email protected]