salen errores muy graves se equivoca en cosas muy sencillas pierdo más tiempo que empezando de cero la calidad final siempre será peor nos va a quitar el trabajo ...
la baja los deadlines son cada vez más ajustados la competencia es cada vez más dura hay diferentes niveles de calidad tolerados cada vez con más contenido para traducir y en más idiomas a veces, es necesario traducir en tiempo real
productividad nos elimina ciertas tareas repetitivas mejora con el tiempo reduce los costes permite acceder a nuevos clientes proporciona nuevos modelos de negocio no sirve para todo
Logos, Metal interés renovado por 3 motivos principales aumento de la capacidad computacional reducción del coste de hardware y software aparición de los modelos estadísticos (IBM) métodos basados en ejemplos principalmente en Japón proyecto de S2S: Verbmobil
de idiomas y dominios superioridad en aplicaciones acotadas alto volumen de texto multilingüe disponible no necesita intervención lingüística inconvenientes metodología estadística cómo particularizar
ilimitadas <glosarios> traducciones y palabras prohibidas <formatos de ficheros> tmx, ttx, xliff, Déjà Vu, doc, docx, ppt, pptx, xls, xlsx, xml, html, rtf, InDesign, ... <y mucho más> aprendizaje dinos lo que necesitas y lo hacemos
traducción corpus open-source documentos previos alineación documentación webs de clientes información pública reglas programación de reglas otros datos extracción de terminología <algunas cuestiones> mínimo número de palabras necesidad de clasificación de datos pares de idiomas
tablas de traducción y modelos de lenguaje datos y parámetros para ajuste fino medidas de test <creación de motores> varios + purga <validación> por traductores profesionales <mejora continua> nuevos ficheros, corpus, reglas, etc...
1 1 1 1 Humana Humana Humana Humana Marketing, traducciones con Marketing, traducciones con Marketing, traducciones con Marketing, traducciones con certificci certificci certificci certificció ó ó ón, documentaci n, documentaci n, documentaci n, documentació ó ó ón n n n t t t té é é écnica muy especializada cnica muy especializada cnica muy especializada cnica muy especializada para uso externo, webs de para uso externo, webs de para uso externo, webs de para uso externo, webs de mucho tr mucho tr mucho tr mucho trá á á áfico fico fico fico Alta Alta Alta Alta 2 2 2 2 MT posteditada MT posteditada MT posteditada MT posteditada Documentaci Documentaci Documentaci Documentació ó ó ón e uso interno, n e uso interno, n e uso interno, n e uso interno, p p p pá á á áginas web de tr ginas web de tr ginas web de tr ginas web de trá á á áfico medio fico medio fico medio fico medio Media Media Media Media 3 3 3 3 MT +terminolog MT +terminolog MT +terminolog MT +terminologí í í ía, a, a, a, TM y/o diccionarios TM y/o diccionarios TM y/o diccionarios TM y/o diccionarios Informaci Informaci Informaci Informació ó ó ón b n b n b n bá á á ásica, conocer el sica, conocer el sica, conocer el sica, conocer el contenido del texto contenido del texto contenido del texto contenido del texto Debajo de la Debajo de la Debajo de la Debajo de la media media media media 4 4 4 4 MT en bruto MT en bruto MT en bruto MT en bruto Medios sociales/digitales, Medios sociales/digitales, Medios sociales/digitales, Medios sociales/digitales, informaci informaci informaci informació ó ó ón para cliente n para cliente n para cliente n para cliente Pobre Pobre Pobre Pobre
traducción correcta desde el punto de vista semántico. Se asegura que no se haya añadido ni omitido ninguna información accidentalmente. Se modifica todo contenido ofensivo, inadecuado o no aceptable culturalmente. Se utiliza tanto como sea posible del resultado “en bruto” de la traducción automática. Se aplican las reglas básicas con respecto a la ortografía. No hay que implementar correcciones de naturaleza estilística. No hay que reestructurar oraciones solo para mejorar el flujo natural del texto.
traducción correcta desde el punto de vista gramatical, sintáctico y semántico. Se asegura que la terminología clave esté correctamente traducida y que los términos no traducidos sean los que aparecen en la lista de “Términos que no se deben traducir“ del cliente. Se asegura que no se haya añadido ni omitido ninguna información. Se modifica todo contenido ofensivo, inadecuado o no aceptable culturalmente. Se utiliza tanto como sea posible del resultado “en bruto” de la traducción automática. Se aplican reglas básicas con respecto a la ortografía, puntuación y guiones. Se asegura que el formato sea el correcto.
corpus completar con segmentos complementarios combinar datos del cliente con texto genérico adaptación a dominio en base a genérico aumentar el número de frases con reglas
detectar texto en otros idiomas corregir ortografía seleccionar frases con gramática correcta alineación con terminología del cliente filtrar otros segmentos indeseados
cliente final definido documentos traducidos sin alinear traducciones genéricas creacion del corpus/memorias óptimas extensión y filtrado basado en reglas
frecuencues clientes de diferentes dominios <flujo> conseguir cuanto más datos mejor recibir un nuevo fichero para traducir crear un dominio ad-hoc para ese fichero entrenar la solución y reglas básicas <salida> adaptación óptima en alrededor 4 horas
texto original coherencia y simplificación ortografía, gramática, semántica <web> traducción de páginas web MT + postedición automática <API> integración en otras aplicaciones posibilidad de tiempo real