BERTによる自然言語処理を学ぼう!【 Live!人工知能 #26】 #Live人工知能

ʙ -JWFɛʈٝঐ 㘴㙖㙦㙀㙞೮࿥e㘈㘍㗗㗏㗊ᗴ㗄㗗㗾㗙

ΠϯτϩμΫγϣϯ

ߨࢣ঺հ զ࠺޾௕ :VLJOBHB"[VNB !ZVLZ@B[ 4"*-BCגࣜձࣾ୅දऔక໾ "*ؔ࿈ͷڭҭɺݚڀ։ൃʹैࣄ ཧֶത࢜ʢ෺ཧֶʣ 6EFNZͰ਺ສਓΛࢦಋ༗໊اۀͰ"*ݚमΛ୲౰ ஶॻʹʮ͸͡ΊͯͷσΟʔϓϥʔχϯάʯͳͲ

ίʔεͷಛ௃ • BERTͷجૅΛֶͿ  → TransformerɺBERTͳͲͷࣗવݴޠॲཧٕज़Λֶͼ·͢ • PyTorchʹΑΔ࣮૷  → Google Colaboratory؀ڥͰBERTΛಈ࡞ͤ͞·͢
• ߨ࠲ͷର৅  → ҰาਐΜͩࣗવݴޠॲཧٕज़Λ਎ʹ෇͚͍ͨํ  → σΟʔϓϥʔχϯάʹؔ͢Δجૅతͳ஌ࣝͷ͋Δํ  → ϓϩάϥϛϯάɺӳޠʹ఍߅ײ͕খ͍͞ํ

ߨ࠲ͷ಺༰ Section 1. ߨ࠲ͱBERTͷ֓ཁ Section 2. γϯϓϧͳBERTͷ࣮૷ Section 3. BERTͷ࢓૊Έ
Section 4. ϑΝΠϯνϡʔχϯάͷ׆༻ Section 5. BERTͷԠ༻

ࠓճͷ಺༰ 1. ΠϯτϩμΫγϣϯ 2. ίʔεͷ֓ཁ 3. ࣗવݴޠॲཧͷ֓ཁ 4. Transformerͷ֓ཁ 5.
BERTͷ֓ཁ 6. Google Colaboratoryͷ࢖͍ํ

ڭࡐͷ঺հ • Pythonͷجૅ

ίʔεͷ֓ཁ

Section 1. ߨ࠲ͱBERTͷ֓ཁ ࣗવݴޠॲཧɺTransformerɺBERTʹ͍ͭͯ֓ཁΛֶͼ·͢

Section 2. γϯϓϧͳBERTͷ࣮૷ ࠷খݶͷPythonͷίʔυͰBERTΛ࣮૷͠·͢

Section 3. BERTͷ࢓૊Έ TransformerɺBERTͳͲʹ͍ͭͯ࢓૊ΈΛৄֶ͘͠ͼ·͢

Section 4. ϑΝΠϯνϡʔχϯάͷ׆༻ ϑΝΠϯνϡʔχϯάͷ֓ཁɺͦͯ͠BERTʹ͓͚Δ׆༻ʹ͍ͭͯղઆ͠·͢

Section 5. BERTͷԠ༻ BERTΛ࢖ͬͯɺࣗવݴޠॲཧͷλεΫʹऔΓ૊Έ·͢

ࣗવݴޠॲཧͷ֓ཁ

ࣗવݴޠॲཧͱ͸ • ࣗવݴޠͱ͸ɺ೔ຊޠ΍ӳޠͳͲͷզʑ͕ීஈ࢖͏ݴޠͷ͜ͱ • ࣗવݴޠॲཧʢNatural Language ProcessingɺNLPʣͱ͸ɺ  ࣗવݴޠΛίϯϐϡʔλͰॲཧ͢Δٕज़ͷ͜ͱ

ࣗવݴޠॲཧͷԠ༻ • ݕࡧΤϯδϯ • ػց຋༁ • ༧ଌม׵ • εύϜϑΟϧλ •
Ի੠Ξγελϯτ • খઆͷࣥච • ର࿩γεςϜ • etc…

ࣗવݴޠॲཧٕज़ͷཁૉ • ܗଶૉղੳ  → จॻΛ୯ޠʹ෼ׂ͢Δٕज़ • ୯ޠͷ෼ࢄදݱ  → จॻ಺Ͱͷؔ܎ੑΛ౿·͑ͯɺ୯ޠΛϕΫτϧԽ͢Δٕज़ •
࠶ؼܕχϡʔϥϧωοτϫʔΫʢRNNʣ  → ࣌ܥྻΛѻ͏ͷ͕ಘҙͳχϡʔϥϧωοτϫʔΫͷҰछ • Seq2Seq  → RNNΛϕʔεʹͨ͠ɺจষͳͲΛੜ੒ՄೳͳϞσϧ • etc…

೔ຊޠͷܗଶૉղੳ • ܗଶૉͱ͸ɺݴ༿͕ҙຯΛ࣋ͭ·ͱ·Γͷ୯ޠͷ࠷খ୯Ґͷ͜ͱ • ܗଶૉղੳͱ͸ɺࣗવݴޠΛܗଶૉʹ·Ͱ෼ׂ͢Δ͜ͱ • ೔ຊޠ΍தࠃޠɺλΠޠ͸୯ޠؒʹεϖʔε͕ແ͍ͷͰɺ  ܗଶૉղੳ͕ඞཁ • ҎԼ͸୅දతͳ೔ຊޠͷܗଶૉղੳϥΠϒϥϦ
• MeCab → ஌໊౓͕ߴ͘ɺߴ଎ɺߴਫ਼౓ • Janome → ଎౓͸MeCabʹྼΔ͕ɺಋೖ͕؆୯ • etc…

one-hotදݱ ͢΋΋ ΋ ΋΋ ΋ ΋΋ ͷ ͏ͪ ͢΋΋ ΋
΋΋ ͷ ͏ͪ *% ʮ͢΋΋ʯͷone-hotදݱ: [1 0 0 0 0] ʮ΋ʯͷone-hotදݱ: [0 1 0 0 0]

෼ࢄදݱ • ୯ޠؒͷؔ࿈ੑ΍ྨࣅ౓ʹجͮ͘ϕΫτϧͰɺ୯ޠΛදݱ͢Δ ʜ
ʜ ʜ 200ཁૉఔ౓ உੑ ϩϯυϯ Python • word2vecͳͲΛ࢖͑͹ɺ଍͠ࢉ΍Ҿ͖ࢉ͕ՄೳͳϕΫτϧΛ࡞Δ͜ͱ͕Ͱ͖Δ  ྫ: ʮԦʯ-ʮஉʯ+ʮঁʯ=ʮঁԦʯ

word2vec • word2vec͸ɺ෼ࢄදݱΛ࡞੒͢ΔͨΊͷٕज़ • word2vecͰ͸ɺCBOWʢcontinuous bag-of-wordsʣ΋͘͠͸ɺ  skip-gramͱ͍͏χϡʔϥϧωοτϫʔΫ͕༻͍ΒΕΔ

ॏΈ CBOWʢcontinuous bag-of-wordsʣ • લޙͷ୯ޠ͔Βର৅ͷ୯ޠΛ༧ଌ͢ΔχϡʔϥϧωοτϫʔΫ • ֶशʹཁ͢Δ͕࣌ؒskip-gramΑΓ΋୹͍ ͢ ΋΋ ΋΋
΋ ೖྗ૚ தؒ૚ ग़ྗ૚ one-hotදݱ ॏΈ ॏΈΛද͢ߦྻ Wmid Wout ֶशʹΑΓɺWmid ͸෼ࢄදݱͷϕΫτϧ͕ฒΜͩߦྻʹͳΔ ΋ ෼ࢄදݱͱಉ͡ ཁૉ਺ͷϕΫτϧ

skip-gram ॏΈ • ͋Δ୯ޠ͔Βɺલޙͷ୯ޠΛ༧ଌ͢ΔχϡʔϥϧωοτϫʔΫ • CBOWΑΓ΋ֶशʹ͕͔͔࣌ؒΔ͕ɺਫ਼౓͕Α͍ ͢ ΋΋ ΋΋ ΋
ೖྗ૚ தؒ૚ ग़ྗ૚ one-hotදݱ ॏΈ ॏΈΛද͢ߦྻ Wmid Wout ֶशʹΑΓɺWmid ͸෼ࢄදݱͷ ϕΫτϧ͕ฒΜͩߦྻʹͳΔ ΋ ෼ࢄදݱͱಉ͡ ཁૉ਺ͷϕΫτϧ

࠶ؼܕχϡʔϥϧωοτϫʔΫʢRNNʣͱ͸ʁ • ࠶ؼܕχϡʔϥϧωοτϫʔΫʢReccurent Neural Networkʣ  → ೖྗͱਖ਼ղ͕ʮ࣌ܥྻσʔλʯͱͳΔ  → தؒ૚͕ʮ࠶ؼʯͷߏ଄Λ࣋ͪɺલޙͷ࣌ࠁͷதؒ૚ͱͭͳ͕Δ ೖྗ૚
தؒ૚ ग़ྗ૚ ࠶ؼ

RNNͷॱ఻೻ͱٯ఻೻ ೖྗ ૚ தؒ ૚ ग़ྗ ૚ ೖྗ ૚ தؒ
૚ ग़ྗ ૚ ೖྗ ૚ தؒ ૚ ग़ྗ ૚ t = 0 t = 1 t = 2 ॱ఻೻  ٯ఻೻ • ࣌ؒΛḪͬͯٯ఻೻͕ߦΘΕΔ • શͯͷ࣌ࠁͷதؒ૚Ͱɺ  ύϥϝʔλ͸ڞ༗͞ΕΔ

࣌ܥྻσʔλͷྫ • จॻ • Ի੠σʔλ • ಈը • גՁ •
࢈ۀ༻ػثͷঢ়ଶ • etc…

Seq2Seqͱ͸ • Seq2Seq͸ɺܥྻ(sequence)Λ ड͚औΓɺผͷܥྻ΁ม׵͢ΔϞσϧ • ࣗવݴޠॲཧͰΑ͘ར༻͞ΕΔ • จষͳͲͷೖྗΛѹॖ͢Δencoderͱɺग़ྗΛల։͢Δdecoder͔ΒͳΔ • ҎԼ͸׆༻ྫ
• ػց຋༁ʢྫ: ӳޠͷจষ → ϑϥϯεޠͷจষʣ • จষཁ໿ʢݩͷจষ → ཁ໿จʣ • ର࿩ʢࣗ෼ͷൃݴ → ૬खͷൃݴʣ • etc…

Seq2Seqͷߏ଄ 3// ૚ Seq2SeqʹΑΔ຋༁ͷྫ ޗഐ ͸ ೣ ͩ <EOS> I
am a cat <EOS> encoder decoder

͞Βʹৄֶ͘͠ͼ͍ͨํ΁… 6EFNZίʔε ࣗવݴޠॲཧͱνϟοτϘοτ "*ʹΑΔจষੜ੒ͱձ࿩Τϯδϯ։ൃ 6EFNZίʔε ਓ޻஌ೳʢ"*ʣΛ౥ࡌͨ͠5XJUUFSϘοτΛ࡞Ζ͏ ʲ4FR4FR "UUFOUJPO $PMBCʳ

Transformerͷ֓ཁ

RNNʹΑΔࣗવݴޠॲཧͷ໰୊఺ • ֶश͕࣌ؒ௕͍  → σʔλΛฒྻͰॲཧͰ͖ͳ͍ͨΊɺ  ֶशʹ͸௕͍͕͔͔࣌ؒΔ • จ຺ΛͱΒ͑Δͷ͕೉͍͠  → ௕࣌ؒͷؔ܎ੑΛͱΒ͑Δͷ͕ۤख

Transformerͷ֓ཁ • Transformerͱ͸ʁ  → 2017೥ʹಋೖ͞ΕͨσΟʔϓϥʔχϯάϞσϧͰɺ  ओʹࣗવݴޠॲཧͷ෼໺Ͱ࢖༻͞ΕΔ   → RNNͱಉ༷ʹɺࣗવݴޠͳͲͷ࣌ܥྻσʔλΛॲཧ͢ΔΑ͏ʹઃܭ ͞Ε͍ͯΔ͕ɺRNNͰ༻͍Δ࠶ؼɺCNNͰ༻͍Δ৞ΈࠐΈ͸࢖Θͳ͍ 
→ Attention૚ͷΈͰߏங͞ΕΔ  → ຋༁΍ςΩετͷཁ໿ͳͲɺ༷ʑͳλεΫͰར༻Մೳ  → ฒྻԽ͕༰қͰ͋Γɺ܇࿅࣌ؒΛେ͖͘࡟ݮͰ͖Δ

Transformerͷ࿦จ • Attention Is All You Need  → https://arxiv.org/abs/1706.03762  •
ʮAttentionʯ͸࣌ܥྻσʔλͷಛఆͷ෦෼ʹ  ஫ҙΛ޲͚ΔΑ͏ʹֶश͍ͤͯ͘͞ํ๏

TransformerͷϞσϧ "UUFOUJPO*T"MM:PV/FFE "TIJTI 7FUBM ΑΓҾ༻ &ODPEFS %FDPEFS &ODPEFSͷߏ଄ ̍ɽ&NCFEEJOH૚ʹΑΓೖྗจষΛϕΫτϧʹѹॖ
̎ɽ1PTJUJPOBM&ODPEFS૚ʹΑͬͯҐஔ৘ใΛՃ͑Δ ̏ɽ.VMUJ)FBE"UUFOUJPO૚ ̐ɽOPSNBMJ[BUJPOʢਖ਼نԽʣͳͲ ̑ɽ1PTJUJPOXJTFGVMMZDPOOFDUFEGFFEGPSXBSEOFUXPSL ̒ɽOPSNBMJ[BUJPOʢਖ਼نԽʣͳͲ Λճ܁Γฦ͢

TransformerͷϞσϧ "UUFOUJPO*T"MM:PV/FFE "TIJTI 7FUBM ΑΓҾ༻ &ODPEFS %FDPEFS %FDPEFSͷߏ଄ ̍ɽ&NCFEEJOH૚ʹΑΓೖྗจষΛϕΫτϧʹѹॖ
̎ɽ1PTJUJPOBM&ODPEFS૚ʹΑͬͯҐஔ৘ใΛՃ͑Δ ̏ɽ.VMUJ)FBE"UUFOUJPO૚ ̐ɽOPSNBMJ[BUJPOʢਖ਼نԽʣͳͲ ̑.VMUJ)FBE"UUFOUJPO૚ʢ&ODPEFSͷೖྗΛ࢖༻ʣ ̒ɽOPSNBMJ[BUJPOʢਖ਼نԽʣͳͲ ̓ɽ1PTJUJPOXJTFGVMMZDPOOFDUFEGFFEGPSXBSEOFUXPSL ̔ɽOPSNBMJ[BUJPOʢਖ਼نԽʣͳͲ Λճ܁Γฦ͢

BERTͷ֓ཁ

BERTͷ֓ཁ • BERTʢBirdirectional Encoder Representation from Transformersʣͱ͸ʁ  → 2018೥ͷޙ൒ʹGoogle͔Βൃද͞Εͨɺ  ࣗવݴޠॲཧͷͨΊͷ৽ͨͳσΟʔϓϥʔχϯάͷϞσϧ
  → Transformer͕ϕʔεͱͳ͍ͬͯΔ  → ༷ʑͳࣗવݴޠॲཧλεΫͰϑΝΠϯνϡʔχϯά͕Մೳ  → ैདྷͷࣗવݴޠॲཧλεΫͱൺֱͯ͠ɺߴ͍൚༻ੑ

BERTͷ࿦จ • BERT: Pre-training of Deep Bidirectional Transformers for Language
Understanding  → https://arxiv.org/abs/1810.04805

BERTͷֶश #&351SFUSBJOJOHPG%FFQ#JEJSFDUJPOBM5SBOTGPSNFSTGPS-BOHVBHF6OEFSTUBOEJOH %FWMJO +FUBM ΑΓҾ༻

BERTͷֶश • ࣄલֶश  → Transformer͕ɺจষ͔Βจ຺Λ૒ํ޲ʢBidirectionalʣʹֶश͢Δ  → Masked Language Model͓ΑͼNext Sentence
PredictionʹΑΔ૒ํ޲ֶश • ϑΝΠϯνϡʔχϯά  → ࣄલֶशʹΑΓಘΒΕͨύϥϝʔλΛॳظ஋ͱͯ͠ɺϥϕϧ෇͖ͷσʔλͰɹ ϑΝΠϯνϡʔχϯάΛߦ͏

Masked Language Model • Masked Language Model  → จষ͔Βಛఆͷ୯ޠΛ15ˋϥϯμϜʹબͼɺ[MASK]τʔΫϯʹஔ͖׵͑Δ  →
ྫ: my dog is hairy → my dog is [MASK]  → [MASK]ͷ୯ޠΛɺલޙͷจ຺͔Β༧ଌ͢Δ

Next Sentence Prediction • Next Sentence Prediction  → 2ͭͷจষʹؔ܎͕͋Δ͔Ͳ͏͔Λ൑ఆ͢Δ  →
ޙΖͷจষΛ50%ͷ֬཰Ͱແؔ܎ͳจষʹஔ͖׵͑Δ  → ޙΖͷจষ͕ҙຯతʹద੾Ͱ͋Ε͹IsNextɺͦ͏Ͱͳ͚Ε͹NotNextͷ൑ఆ • [CLS] the man went to [MASK] store [SEP] / he bought a gallon [MASK] milk [SEP]  ൑ఆɿIsNext  [CLS] the man went to [MASK] store [SEP] / penguin [MASK] are ﬂight #less birds [SEP]  ൑ఆɿNotNext

BERTͷੑೳ #&351SFUSBJOJOHPG%FFQ#JEJSFDUJPOBM5SBOTGPSNFSTGPS-BOHVBHF6OEFSTUBOEJOH %FWMJO +FUBM ΑΓҾ༻ • SQuAD  → ʮStanford
Question Answering Datasetʯͷུ  → ελϯϑΥʔυେֶ͕Ұൠެ։͍ͯ͠Δ  ݴޠॲཧͷਫ਼౓ΛଌΔϕϯνϚʔΫ  → σʔλ͸໿10ສݸͷ࣭໰Ԡ౴ͷϖΞΛؚΉ

BERTͷੑೳ #&351SFUSBJOJOHPG%FFQ#JEJSFDUJPOBM5SBOTGPSNFSTGPS-BOHVBHF6OEFSTUBOEJOH %FWMJO +FUBM ΑΓҾ༻ • GLUE  → ࣗવݴޠॲཧͷͨΊͷ9छྨͷֶशσʔλΛؚΉσʔληοτ

೔ຊޠͷ܇࿅ࡁΈϞσϧ • ژ౎େֶ ࠇڮɾ㬗ɾଜ࿬ݚڀࣨ  → http://nlp.ist.i.kyoto-u.ac.jp/index.php?BERT೔ຊޠPretrainedϞσϧ

Google Colaboratoryͷ࢖͍ํ

Google Colaboratoryͱ͸? • Google Colaboratory  → Google͕ఏڙ͢Δɺϒϥ΢βͰPythonΛ࣮ߦͰ͖Δ؀ڥ  → GoogleΞΧ΢ϯτͰར༻Մೳ  →
جຊతʹແྉ  → ؀ڥߏங͕؆୯  → ڞ༗͕؆୯  → etc…  https://colab.research.google.com/

ίʔυηϧͱςΩετηϧ • ίʔυηϧ  → PythonͷίʔυΛهड़͠ɺ࣮ߦ͢Δ • ςΩετηϧ  → จষ΍਺ࣜΛهड़͢Δ

Google Colaboratoryͷ༷ʑͳػೳ • εΫϥονίʔυηϧ • ίʔυεχϖοτ • ϑΥʔϜ • etc…

Section 1. ߨ࠲ͱBERTͷ֓ཁ Section 2. γϯϓϧͳBERTͷ࣮૷ Section 3. BERTͷ࢓૊Έ Section
4. ϑΝΠϯνϡʔχϯάͷ׆༻ Section 5. BERTͷԠ༻ ࣍ճͷ಺༰

ࡶஊλΠϜ -JWFɛʈٝঐ 㘴㙖㙦㙀㙞೮࿥e㘈㘍㗗㗏㗊ᗴ㗄㗗㗾㗙

BERTによる自然言語処理を学ぼう!【 Live!人工知能 #26】 #Live人工知能

BERTによる自然言語処理を学ぼう!【 Live!人工知能 #26】 #Live人工知能

More Decks by yuky_az

Other Decks in Technology

Featured

Transcript