Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥

Evaluacion de aprendizaje del Español a trave...

Avatar for Gamar Gamar
January 23, 2015

Evaluacion de aprendizaje del Español a traves de corpus

Avatar for Gamar

Gamar

January 23, 2015
Tweet

More Decks by Gamar

Other Decks in Education

Transcript

  1. Seminario de Introducci´ on de Literatura Gamar Azuaje Universidad Tecnol´

    ogica de Nagaoka. Laboratorio Yamamoto. 23/01/2015
  2. Introducci´ on Evaluaci´ on de aprendizaje del Espa˜ nol a

    trav´ es de corpus Evaluation of Corpus-Assisted Spanish Learning Hui-Chan,Lu and Yu-Hsin,Chu Procedings of the 27th Pacific Asia Conference on Language, Information, and Computation (PACLIC 27)
  3. Introducci´ on El uso del corpus se ha expandido dentro

    de las sub-´ areas de la ling¨ u´ ıstica. Entre ellas se encuentra la ense˜ nanza y aprendizaje de un idioma extranjero. Se seleccion´ o el espa˜ nol como el idioma objetivo porque la popularidad de una segunda lengua extranjera se ha incrementado en Taiw´ an. Estudios realizados anteriormente muestran que los corpus utilizados para aprendizaje y ense˜ nanza son principalmente nativos. Busca ventajas y desventajas de tres tipos de corpus (nativo, paralelo y aprendizaje) desde la perspectiva del estudiante.
  4. Revisi´ on literaria El enfoque hacia el corpus se ha

    ido incrementando en las ultimas 4 decadas. Creaci´ on del Brown Corpus (1967) El uso del corpus se ha incrementado significativamente: 588 publicaciones (1970s) a 10886(2000s). Existen muchos tipos de corpus diacr´ onico, contempor´ aneo, nativo, aprendizaje, paralelo, hablado, multiling¨ ue, etc.
  5. Revisi´ on literaria Se decidi´ o usar el corpus de

    espa˜ nol por su gran informaci´ on y poderosas herramientas de b´ usqueda. Existen dos corpus de aprendizaje en espa˜ nol, sin embargo uno de ellos es privado y el otro solo contiene informaci´ on hablada. Por ello se decidi´ o utilizar un corpus propio construido anteriormente. No existe corpus paralelo entre el Espa˜ nol-Chino (Existe Espa˜ nol-Ingl´ es e Ingl´ es-Chino). Se decidi´ o construir un corpus paralelo con estos 3 idiomas.
  6. Preguntas ¿Cu´ ales son las ventajas y desventajas de cada

    corpus desde el punto de vista del usuario? (Comparaci´ on) ¿C´ omo se complementan para obtener el aprendizaje ´ optimo? (Combinaci´ on)
  7. Participantes Para el estudio participaron 28 estudiantes taiwaneses de espa˜

    nol. La prueba de Wisconsin fue usada para medir su nivel de proficiencia. Table 1: Caracter´ ısticas de los participantes Tipo A˜ no Tercer A˜ no Cuarto A˜ no 20(71%) 8(29%) G´ enero Femenino Masculino 23(82%) 5(18%) Nivel Profic, 1 2 3 4 0(0%) 19(68%) 8(29%) 1(3%)
  8. Instrumentos Corpus de Espa˜ nol (Mark Davies, Brigham Young University)

    100 Millones de palabras. Desde el siglo XIII hasta el siglo XX. Poderosas b´ usquedas como colocaciones y lemas. Corpus Escrito de Aprendices Taiwaneses de Espa˜ nol (National Cheng Kung University) Contiene 2.425 textos y 446.694 palabras. Incluye correcciones para cada error en la versi´ on del estudiante. Corpus Paralelo de Espa˜ nol, Ingl´ es y Chino. (National Cheng Kung University) Contiene informaci´ on de la Biblia y varios cuentos de hadas. 755.461 palabras en espa˜ nol, 794,571 palabras en ingl´ es y 923,509 palabras en chino.
  9. Evaluaci´ on Se dio un tiempo de 45 minutos para

    evaluar cada corpus. La prueba consisti´ o en 7 pares de palabras dividas en dos categor´ ıas (Tiempo pret´ erito y copret´ erito,Verbos copulativos).Al finalizar se le pidi´ o a los participantes evaluar los 3 corpus contrastando sus ventajas y desventajas. Selecci´ on: Circule el que se usa con m´ as frecuencia y tache el que no se usa. Evaluaci´ on de ayuda: ¿ayuda o no? (X vs. Y) A. CdE hubo/hab´ ıa No S´ ı B. CEATE hubo/hab´ ıa No S´ ı C. CPEIC hubo/hab´ ıa No S´ ı
  10. Resultados Q CdE CEATE CPEIC indefinido/imperfecto 1 hab´ ıa hab´

    ıa hab´ ıa (100%) (96%) (53%) 2 iba fui iba (77%) (100%) (67%) 3 dijo dijo dijo (100%) (100%) (86%) 4 lleg´ o lleg´ o lleg´ o (100%) (100%) (79%) 5 Ser Ser Ser (100%) (100%) (100%) 6 estar ser estar (96%) (100%) (100%) 7 estar estar estar (100%) (100%) (100%) Table 2: Resultados de b´ usqueda de frecuencia
  11. Resultados Q CdE CEATE CPEIC 1 80% 92% 78% 2

    75% 89% 76% 3 86% 93% 69% 4 87% 88% 83% 5 96% 100% 93% 6 90% 60% 91% 7 91% 100% 100% Table 3: Satisfacci´ on del usuario
  12. Resultados Ventajas Desventajas CdE -Muchos ejemplos -Etiquetado con POS y

    lema -Orden de frecuencia -Vocabularios y estructura gramatical dif´ ıcil CEATE -Muestra error y correcci´ on -Facil comprensi´ on -Contexto -Falta de diversificaci´ on -Insuficientes ejemplos CPEIC -Tres idiomas -Falta de diversificaci´ on -Insuficientes ejemplos -No es aplicable para uso diario (Biblia) Table 4: Ventajas y Desventajas
  13. Conclusion El uso de los corpus no debe ser restringido

    a investigadores y profesores. Estudiantes de una lengua extranjeras tambi´ en deben ser considerados como usuarios beneficiados. Para obtener un resultado m´ as generalizable se deben incluir un mayor n´ umero de participantes con diferentes dominios de lenguaje de distintas universidades.