Upgrade to Pro — share decks privately, control downloads, hide ads and more …

nlp2024 地理的エンティティ情報が与えられた文書ジオロケーションモデルの有効性検証

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

nlp2024 地理的エンティティ情報が与えられた文書ジオロケーションモデルの有効性検証

Avatar for Takashi INUI

Takashi INUI

March 19, 2024
Tweet

More Decks by Takashi INUI

Other Decks in Research

Transcript

  1. ݚڀഎܠ  จॻδΦϩέʔγϣϯͱ͸ʜʜ ˠ4/4ͷ౤ߘҐஔΛਪఆ<)BOFUBM > ʲϝϦοτʳ l؍ޫ஍෼ੳɾ஍Ҭ෼ੳ΁ͷར༻ lݸਓ৘ใͷྲྀग़Λճආ 2 [Han

    et al., 2012] Han Bo, Cook Paul, and Baldwin Timothy. Geolocation prediction in social media data by finding location indicative words. In Proceedings of COLING 2012, pp. 1045–1062, 2012. 投稿 投稿
  2. ݚڀഎܠ  l ֎෦஌ࣝ͸จॻδΦϩέʔγϣϯʹ໾ཱͭ l ֎෦஌ࣝɿߏ଄Խ͞Εͨ஌ࣝϕʔε l8JLJQFEJB %#1FEJB :BHPͳͲ l

    ஌ࣝऔΓࠐΈɿϞσϧʹ஌ࣝΛ༩͑Δ l஌ࣝάϥϑຒΊࠐΈ΍ΤϯςΟςΟɾϦϯΩϯά 3
  3. ઌߦݚڀ <.JZB[BLJFUBM > lϢʔβʔδΦϩέʔγϣϯ l஌ࣝϕʔε:BHPΛར༻ <ฏ઒Β > lॅॴϦετ͔Βಘͨ஍ཧత஌ࣝάϥϑΛར༻ l ΤϯςΟςΟɾϦϯΩϯάΛߦ͍ɺಉఆ͞ΕͨΤϯςΟςΟ৘ใ

    Λར༻͢Δ͜ͱʹ͸ண໨͍ͯ͠ͳ͍ 4 [Miyazaki et al., 2018] Taro Miyazaki, Afshin Rahimi, Trevor Cohn, and Timothy Baldwin. Twitter geolocation using knowledge-based methods. In Proceedings of the 2018 EMNLP Workshop W-NUT: The 4th Workshop on Noisy User-generated Text, pp. 7–16, 2018. [平川ら, 2022] 平川冬尉, 乾孝司. 地理的知識グラフを取り込んだニューラル文書ジオロケーションモデル. 情報処理 学会論文誌, Vol. 63, No. 12, pp. 1870–1883, dec 2022.
  4. ΤϯςΟςΟɾϦϯΩϯά &- l8JLJGJDBUJPO<.JIBMDFB FUBM > l஍ཧతΤϯςΟςΟͷΈ͕ର৅ lྫɿʮஜ೾ʯʮεΧΠπϦʔʯʮ౻Ҫ૱ଠʯʮ͜͜Ζʯ 7 [Mihalcea et

    al.,2007] Rada Mihalcea and Andras Csoma. Wikify! linking documents to encyclopedic knowledge. In Proceedings of the sixteenth ACM conference on Conference on Information and Knowledge Management, pp. 233–242, 2007.
  5. ೔ຊޠ8JLJQFEJBΤϯςΟςΟϕΫτϧ 9 <ླ໦Β > l8JLJQFEJBͷϦϯΫ৘ใΛߟྀͨ͠ 8PSE7FD ʹ Αͬͯ ຒΊࠐΈ දݱΛֶश

    [鈴木ら, 2016] 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎. Wikipedia 記事に対する拡張固有表現ラベルの 多重付与. 言語処理学会第22 回年次大会, pp. 797–800, 2016. https://www.cl.ecei.tohoku.ac.jp/~m-suzuki /jawiki_vector/
  6. ΤϯςΟςΟ৘ใͷຒΊࠐΈදݱ  10 [鈴木ら, 2016] 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎.

    Wikipedia 記事に対する拡張固有表現ラベルの 多重付与. 言語処理学会第22 回年次大会, pp. 797–800, 2016. [陰山ら, 2022] 陰山宗一, 乾孝司. 言及に対する地理的特定性指標の提案と文書ジオロケーションへの適用. 情報処理学会自然言語処理研究会 (NL-253-19), 2022
  7. ΤϯςΟςΟ৘ใͷຒΊࠐΈදݱ  12 [鈴木ら, 2016] 鈴木正敏, 松田耕史, 関根聡, 岡崎直観, 乾健太郎.

    Wikipedia 記事に対する拡張固有表現ラベルの 多重付与. 言語処理学会第22 回年次大会, pp. 797–800, 2016. [陰山ら, 2022] 陰山宗一, 乾孝司. 言及に対する地理的特定性指標の提案と文書ジオロケーションへの適用. 情報処理学会自然言語処理研究会 (NL-253-19), 2022
  8. ධՁ࣮ݧͷઃఆ  l؍ޫυϝΠϯ೔ຊޠ5XJUUFS౤ߘจॻσʔλ<ฏ઒Β  > l ਖ਼ղϥϕϧɿ౎ಓ෎ݝ l จॻ෼ྨϞσϧɿ #&35<%FWMJOFUBM

    > l #FSU'PS4FRVFODF$MBTTJGJDBUJPOϞσϧ 15 [平川ら, 2020] 平川冬尉, 乾孝司. 日本語地理的位置推定課題におけるインジケータ付 deepgeo 法の提案と評価. 人工知能学会全国大会論文集, Vol. JSAI2020, pp. 3Rin473–3Rin473, 2020. [Devlin et al., 2019]Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. Bert: Pre-training of deep bidirectional transformers for language understanding. In Proceedings of the North American Chapter of the Association for Computational Linguistics, pp. 4171–4186, 2019. * https://huggingface.co/docs/transformers/model_doc/bert#transformers.BertForSequenceClassification
  9. 18 ධՁ࣮ݧͷઃఆ  ΤϯςΟςΟ৘ใͷऔΓࠐΈҐஔ [中本ら, 2023] 中本裕大, 瀬在恭介, 元川凱喜, 麻生英樹,

    岡崎直観. 日本語大規模言語モデルにおける知識グラフ を活用した意味理解性能の向上. 言語処理学会第 29 回年次大会, pp. 2140–2145, 2023. [Faldu et al., 2021] Keyur Faldu, Amit Sheth, Prashant Kikani, and Hemang Akbari. Ki-bert: Infusing knowledge context for better language and domain understanding, 2021. $PODBU<தຊΒ > จॻͷ຤ඌʹΤϯςΟςΟ৘ใΛ෇༩ *OGVTF<'BMEV FUBM > ϝϯγϣϯ͝ͱʹΤϯςΟςΟ৘ใΛ෇༩