Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ゴミ入り文字列からGPTを使って 住所を取り出した話

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for かーでぃ かーでぃ
November 01, 2024
22

ゴミ入り文字列からGPTを使って 住所を取り出した話

Avatar for かーでぃ

かーでぃ

November 01, 2024
Tweet

Transcript

  1. 自己紹介 • 名前: かーでぃ/鎌田誠 • 今年の抱負: アウトプットの多様性 • 主催、運営: ◦

    RPACommunity LT支部、WAトーク支部、 LTを雑に雑談する30分 ◦ BabylonJS勉強会 ゆるほめLT会 ◦ CDLE RPA&クラウドフローグループ ◦ CommuPro Guild • モットー:IT知識は広ーく、浅ーく、幅広く • 好き:技術書典、コーヒー、チェアリング    ゆるキャン△、ぼざろ、マケイン、ガンダム 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm

  2. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 データがボロいと後処理が大変… あいうえおかきくけこ 〒4400999愛知県豊橋市渋谷町 39-14エメラルドメンション東谷 201ささし***鎌田誠

    得たデータが構造化データではなく、 1つの文字列だったら … ※しかもゴミ入り これは、さすがに人が判断しないと、 郵便番号、県・市、町名・番地、建物名、氏名 にわけられない!
  3. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 ChatGPTに分割させてみた 郵便番号 : 〒440-0999 住所:

     ・県・市 : 愛知県豊橋市  ・町名・番地 : 渋谷町39-14  ・建物名・部屋番号: エメラルドメンション東谷201 名前:  ・苗字 : 鎌田  ・名前 : 誠 ※ゴミ情報は削除してくれる 以下のテキストから、 郵便番号 、住所(県・市、町名・番地、建物名・部屋番号の3つに分ける)、 名前(苗字と名 前の2つに分ける)に分解してください。 あいうえおかきくけこ 〒4400999愛知県豊橋市渋谷町 39-14エメラルドメンション東谷 201ささし***鎌田誠
  4. 2024/11/01 製造業でも生成AI活用したい!名古屋LLM MeetUp#3
 ゴミ入り文字列からGPTを使って住所を取り出した話
 #nagoya_llm
 まとめ • AIは、推論と分類 (生成AIも最後はココ) •

    本来、事前学習が必要 • しかし、生成AI活用で、省略できちゃう 👉 つまり、コスト不要 • 是非、判断を要する箇所にAIの活用を!