Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Enfoque computacional para la resolución de pronombres nulos en Español.

Gamar
June 16, 2015

Enfoque computacional para la resolución de pronombres nulos en Español.

Gamar

June 16, 2015
Tweet

More Decks by Gamar

Other Decks in Research

Transcript

  1. Introducción A Computational Approach to Zero-Pronouns in Spanish Antonio Ferrández

    y Jesús Peral Proceedings of the 38th Annual Meeting of the Association for Computational Linguistics (2000) Enfoque computacional para la resolución de pronombres nulos en Español. 2
  2. Introducción Se enfoca específicamente en uno de los problemas de

    resolución lingüística para el español La resolución es implementado en un sistema computacional llamado Slot Unification Parser for Anaphora Resolution. Resuelve anáforas tanto en inglés como en español. Utilizado para traducción automática y QA. Los pronombres nulos aparecen en una variedad de idiomas, sin embargo en español solo aparece en la posición del sujeto. 3
  3. Fondo Los pronombres nulos han sido estudiados anteriormente en otros

    idiomas. No han sido estudiados anteriormente para el español, sin embargo existen ciertos puntos en común. Deben ser localizados en el texto y luego resueltos. Se emplea distintos tipos de información para su resolución. Se puede distinguir entre restricciones y preferencias.  Las restricciones son absolutas y descartan antecedentes.  Las preferencias son relativas y requieren criterios adicionales. 4
  4. Detectando pronombres nulos  Las oraciones son dividas en clausuras.

     El sujeto puede aparecer entre clausuras.  Se busca un pronombre o frase nominal que coincida en genero y numero con la clausura del verbo. Se aplica un parseo parcial. Los siguientes constituyentes son necesarios para resolución de anáfora. Preposición coordinada, frase nominal , pronombres, conjunciones y verbos. Para distinguir entre clausuras se aplica la siguiente heurística Asumir que el principio de una nueva clausura ha sido encontrado cuando un verbo es parseado y posteriormente una conjunción libre. 5
  5. Detectando pronombres nulos 1)John y Jane llegaron tarde al trabajo

    porque ∅ se durmieron (John and Jane were late for work because [they]∅ over-slept) np(John and Jane), verb(were), freeWord 3(late), pp(for work), conj(because), pron(they), verb(over-slept ) 2)Pedroj vió a Anak en el parque. ∅k Estaba muy guapa (Peterj saw Annk in the park. [She]∅k was very beautiful) 6
  6. Resolución de pronombres nulos Se aplican las siguientes restricciones a

    los candidatos: Acuerdo de persona y número Restricciones comando-c Consistencia semántica Los candidatos son ordenados según la proximidad del anáfora. Si existen algunos candidatos después de aplicar las restricciones, se escoge por las siguientes preferencias. 7
  7. Evaluación Sistema computacional SUPAR fue entrenado con un corpus hecho

    a mano con 106 pronombres nulos. Se usó para obtener un óptimo orden de preferencias. Se uso dos corpus para la evaluación. Parte de The Blue Book Parte de Lexesp Corpus 9
  8. Evaluación de detección de pronombres nulos Se escoge un verbo

    Se clasifican en dos categorías Verbos cuyo sujeto ha sido omitido Verbos cuyo sujeto no ha sido omitido 11
  9. Evaluación de detección de pronombres nulos 12 Figura 3: Resultados

    obtenidos en la detección de pronombres nulos.
  10. Evaluación de la resolución anáfora De los 734 verbos con

    pronombres nulos, sólo 581 están en tercera persona y serán resueltos. Estos verbos se pueden clasificar en 3 categorías catafórica: el sujeto va después del verbo. Presenta cierto nivel de dificultad debido a la flexibilidad de la oración. ∅k Compró un niñok en el supermercado (A boyk bought in the supermarket) ∅ Compró un regalo en el supermercado ([He]∅ bought a present in the supermarket) exofórica: sus antecedentes no aparecen el texto, se refieren a cosas externas en vez de cosas referenciadas en el texto. anafórica: Los antecedentes vienen antes del verbo. 228 casos que serán resueltos por el sistema. 13
  11. Conclusión Se propuso el primer algoritmo para resolución de anáforas

    en español. Se incorporó en el sistema computacional (SUPAR) Como un proyecto futuro se considera evaluar la importancia de información semántica. Dicha información puede ser obtenida de una herramienta léxica (EuroWordNet) Se puede evaluar en aprendizaje de máquina usando la generacipon de pronombres nulos. 15