Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Poesiaren eskantsio automatikoa: Bi hizkuntzen azterketa

Poesiaren eskantsio automatikoa: Bi hizkuntzen azterketa

IkerGazte 2017rako prestatutako aurkezpena

Manex Agirrezabal

May 09, 2017
Tweet

More Decks by Manex Agirrezabal

Other Decks in Research

Transcript

  1. POESIAREN ESKANTSIO AUTOAMATIKOA: BI HIZKUNTZEN AZTERKETA Manex Agirrezabal, Iñaki Alegria

    eta Mans Hulden IXA taldea (UPV/EHU). Manuel Lardizabal pasealekua 1, Donostia Department of Linguistics. University of Colorado Boulder. Boulder, CO (USA)
  2. • Zer egin dugu? Poesiaren eskantsioa automatikoki, inglesez eta gazteleraz

    • Nola egin dugu? Hizkuntzaren prozesamenduko tresnak erabilita • Eta zer moduz atera da esperimentua? Zenbatetan asmatu du konputagailuak? 4
  3. • Zer egin dugu? Poesiaren eskantsioa automatikoki, inglesez eta gazteleraz

    • Nola egin dugu? Hizkuntzaren prozesamenduko tresnak erabilita • Eta zer moduz atera da esperimentua? Zenbatetan asmatu du konputagailuak? 5
  4. Come live with me and be my love, And we

    will all the pleasures prove, That Valleys, groves, hills, and fields, Woods, or steepy mountain yields. The passionate Shepherd to His Love (Christopher Marlowe) 7
  5. Come live with me and be my love, And we

    will all the pleasures prove, That Valleys, groves, hills, and fields, Woods, or steepy mountain yields. The passionate Shepherd to His Love (Christopher Marlowe) Come live with me and be my love, And we will all the pleasures prove, That Valleys, groves, hills, and fields, Woods, or steepy mountain yields. 8
  6. Adiós para siempre la fuente sonora, del parque dormido eterna

    cantora. Adiós para siempre; tu monotonı ́a, fuente, es más amarga que la pena mı ́a. Fué una clara tarde, triste y soñolienta (Antonio Machado)
  7. Adiós para siempre la fuente sonora, del parque dormido eterna

    cantora. Adiós para siempre; tu monotonı ́a, fuente, es más amarga que la pena mı ́a. Fué una clara tarde, triste y soñolienta (Antonio Machado) Adiós para siempre la fuente sonora, del parque dormido eterna cantora. Adiós para siempre; tu monotonía, fuente, es más amarga que la pena mí ́a.
  8. Beti —tiriki-tauki— eztarrian kanta, ardoz ondo bustita, etzedin narranta. ...

    ...gaberdian gaberdi, eztairikan bazan, gure Ola-gizona antxen izango zan. Azkeneko Ola-Gizona: (Nikolas Ormaetxea "Orixe")
  9. Beti —tiriki-tauki— eztarrian kanta, ardoz ondo bustita, etzedin narranta. ...

    ...gaberdian gaberdi, eztairikan bazan, gure Ola-gizona antxen izango zan. Azkeneko Ola-Gizona: (Nikolas Ormaetxea "Orixe") Beti —tiriki-tauki— eztarrian kanta, ardoz ondo bustita, etzedin narranta. ... ...gaberdian gaberdi, eztairikan bazan, gure Ola-gizona antxen izango zan.
  10. • Zer egin dugu? Poesiaren eskantsioa automatikoki, inglesez eta gazteleraz

    • Nola egin dugu? Hizkuntzaren prozesamenduko tresnak erabilita • Eta zer moduz atera da esperimentua? Zenbatetan asmatu du konputagailuak? 13
  11. Baina eskantsioa, nola egiten da? • Batzuek arauetan oinarrituta: (arauak

    idatzi behar dira) Hitza izena, aditza edo adjektiboa bada, azentua mantendu That Valleys, groves, hills, and fields, • Beste batzuk, datuetan oinarrituta: (datu etiketatuak behar dira eta ezaugarriak) Normalean "live", "be" eta "love" azentudunak Preposizioek normalean ez dute azenturik Juntagailuek normalean ez dute azenturik Come live with me and be my love, Come live with me and be my love x / x / x / x /
  12. Arauetan oinarrituta: • ZeuScansion (Agirrezabal et al., 2013, 2016) Datuetan

    oinarrituta: • Ikasketa automatikozko eskantsioa: (Agirrezabal et al., 2016)
  13. Arauetan oinarrituta: • ZeuScansion (Agirrezabal et al., 2013, 2016) Datuetan

    oinarrituta: • Ikasketa automatikozko eskantsioa: (Agirrezabal et al., 2016)
  14. 3 motako metodoak: • Sailkapen arrunteko metodoak: Unean uneko elementuari

    buruzko aurreikuspena egiten dute soilik 1.- [Come] live with me and be my love azentua edo ez? 2.- Come [live] with me and be my love azentua edo ez? 3.- Come live [with] me and be my love azentua edo ez? 4.- Come live with [me] and be my love azentua edo ez? 5.- Come live with me [and] be my love azentua edo ez? 6.- Come live with me and [be] my love azentua edo ez? 7.- Come live with me and be [my] love azentua edo ez? 8.- Come live with me and be my [love] azentua edo ez? 17
  15. 3 motako metodoak: • Sailkapen arrunteko metodoak: Unean uneko elementuari

    buruzko aurreikuspena egiten dute soilik • Sailkapen egituratuko tresnak: Elementu soilak bakarrik ez, irteerako (gure kasuan azentuen) sekuentzia ere kontutan 1.- [Come] live with me and be my love azentua edo ez? 2.- Come [live] with me and be my love azentua edo ez? 3.- Come live [with] me and be my love azentua edo ez? 4.- Come live with [me] and be my love azentua edo ez? 5.- Come live with me [and] be my love azentua edo ez? 6.- Come live with me and [be] my love azentua edo ez? 7.- Come live with me and be [my] love azentua edo ez? 8.- Come live with me and be my [love] azentua edo ez? 18
  16. 3 motako metodoak: • Sailkapen arrunteko metodoak: Unean uneko elementuari

    buruzko aurreikuspena egiten dute soilik • Sailkapen egituratuko tresnak: Elementu soilak bakarrik ez, irteerako (gure kasuan azentuen) sekuentzia ere kontutan • Sare neuronaletan oinarritutako sistemak: Kalkulu matematiko sinple asko egiten dituzte eta sailkapen arrunt edo egituratu moduan erabil daitezke. 1.- [Come] live with me and be my love azentua edo ez? 2.- Come [live] with me and be my love azentua edo ez? 3.- Come live [with] me and be my love azentua edo ez? 4.- Come live with [me] and be my love azentua edo ez? ... 19
  17. Sare neuronaletan hiru esperimentu: and we will all the pleasures

    prove • Silabatik azentura (S2S) and we will all the plea sures prove x / x / x / x / • Silabatik azentura+hitz muga (S2S) and# we# will# all# the# plea sures# prove# x / x / x / x / • Hitzetik azentu patroira (W2SP) and we will all the pleasures prove x / x / x /x / 20
  18. 3 motako metodoak: • Sailkapen arrunteko metodoak: Perceptron • Sailkapen

    egituratuko tresnak: HMM eta CRF • Sare neuronaletan oinarritutako sistemak: S2S, S2S+HM eta W2SP 21
  19. • Zer egin dugu? Poesiaren eskantsioa automatikoki, inglesez eta gazteleraz

    • Nola egin dugu? Hizkuntzaren prozesamenduko tresnak erabilita • Eta zer moduz atera da esperimentua? Zenbatetan asmatu du konputagailuak? 22
  20. • Orokorrean sare neuronalek emaitza oso onak • Hitz mugaren

    informazioa aberasgarria da • Sare neuronalak poemen egitura prosodikoa erauzteko gai dira
  21. • Lanok euskaraz aplikatu • Corpus bat bildu eta etiketatu

    (bidean) • Irizpideok bertsoen sorkuntza automatikoan aplikatu
  22. ?