Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
自然言語処理の基本 / Basic of Natural Language Processing
Search
SKA’s Web
July 10, 2021
Technology
0
350
自然言語処理の基本 / Basic of Natural Language Processing
2021-07-10のPython機械学習勉強会 in 新潟 での発表資料です。
自然言語処理の基本というか、概要というかです。
SKA’s Web
July 10, 2021
Tweet
Share
More Decks by SKA’s Web
See All by SKA’s Web
.NETでOBS Studio操作してみたけど…… / Operating OBS Studio by .NET
skasweb
0
170
学習しやすいネットワークガチャ? 深層学習の「宝くじ仮説」 【VRアカデミア クリスマスリレー】 / VR Lottery Ticket Hypothesis
skasweb
1
580
宝くじ仮説の話を少し / LT Lottery Ticket Hypothesis
skasweb
0
430
AIとクラスター分析について自作アイテムを用いて解説してみた 【VRアカデミア3周年カウントダウン】 / Explaining AI and Cluster Analysis Using My Item
skasweb
0
340
Other Decks in Technology
See All in Technology
GCASアップデート(202508-202510)
techniczna
0
240
OTEPsで知るOpenTelemetryの未来 / Observability Conference Tokyo 2025
arthur1
0
410
可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ
layerx
PRO
4
2.6k
AIとの協業で実現!レガシーコードをKotlinらしく生まれ変わらせる実践ガイド
zozotech
PRO
2
280
AIでデータ活用を加速させる取り組み / Leveraging AI to accelerate data utilization
okiyuki99
6
1.7k
CLIPでマルチモーダル画像検索 →とても良い
wm3
2
760
制約下の医療LLM Observability 〜セキュアなデータ活用と専門家による改善サイクルの実現〜
kakehashi
PRO
1
100
Amazon Athena で JSON・Parquet・Iceberg のデータを検索し、性能を比較してみた
shigeruoda
1
300
知覚とデザイン
rinchoku
1
720
日本のソブリンAIを支えるエヌビディアの生成AIエコシステム
acceleratedmu3n
0
110
Data Engineering Guide 2025 #data_summit_findy by @Kazaneya_PR / 20251106
kazaneya
PRO
0
290
GPUをつかってベクトル検索を扱う手法のお話し~NVIDIA cuVSとCAGRA~
fshuhe
0
350
Featured
See All Featured
It's Worth the Effort
3n
187
28k
RailsConf 2023
tenderlove
30
1.3k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
A better future with KSS
kneath
239
18k
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
Embracing the Ebb and Flow
colly
88
4.9k
We Have a Design System, Now What?
morganepeng
54
7.9k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
658
61k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
GitHub's CSS Performance
jonrohan
1032
470k
Site-Speed That Sticks
csswizardry
13
940
For a Future-Friendly Web
brad_frost
180
10k
Transcript
ࣗવݴޠॲཧͷجຊ 1ZUIPOػցֶशษڧձ JO৽ׁ 4,"`T8FC 1
ࢿྉͷϦϯΫషΔϖʔδ 2 ʢ͜͜ʹϦϯΫΛషΓ·͢ʣ
࣍ r ࣗવݴޠॲཧͷجຊ 3 ɾࣗવݴޠॲཧͱ ɾࣗવݴޠॲཧͷओͳλεΫ ɾλεΫΛղͨ͘Ίͷख๏ ɾࣗવݴޠॲཧͰΘΕ͍ͯΔਂֶश ɾਂֶशͷར
5XJUUFS࿈ܞ 4 #pyml_niigata ͰͭͿ͘ͱʜʜ ɾ࣭ ɾײ FY ͲΜͲΜͭͿ͍ͯΈͯͶ ը૾ɿ5XJUUFSɼLPOHBSJOJLV
༷ɼΔ͔ ༷
ࣗݾհ 5 ͦͷଞৄࡉɿIUUQTTDSBQCPYJPWSBDBEFNJBXJLJ4,"
ࠂʢ73ΞΧσϛΞɾՆΩϟεϚʔέοτʣ 6 ը૾ɿ73ΞΧσϛΞɼՆΩϟεϚʔέοτ
ࠂ 7 ԬՖՐόʔνϟϧؑձ ։࠵༧ఆ ݄ʢ݄ʣɿόʔνϟϧΩϟετ੮ ಉਓ ˇ ݄ʢՐʣɿ73$IBU੮ ಉnਓ ˇ
ࣗવݴޠॲཧͱ 8 ࣗવݴޠॲཧɿࣗવݴޠΛίϯϐϡʔλʔʹॲཧͤ͞Δ͜ͱશൠ ࣗવݴޠɿࣗવͱൃల͖ͯͨ͠ݴޠ ʢྫʣຊޠɼӳޠɼதࠃޠ نଇ͕ ෳࡶͰ؆୯ʹύʔεͰ͖ͳ͍ ݴޠΛίϯϐϡʔλʔͰѻ͏ ը૾ɿ͍Β͢ͱ
ࣗવݴޠॲཧͷجຊతͳλεΫ 9 ɾܗଶૉղੳɿ୯ޠʹׂͯ͠ࢺΛਪఆ ໋ʢ໊ࢺʣʗ͢ʢ໊ࢺʣʗʢॿࢺʣʗʢ໊ࢺʣʗʢॿࢺʣʗʢ໊ࢺʣʗͷʢॿࢺʣʗ͏ͪʢ໊ࢺʣʗʢॿࢺʣʗ ِʢ໊ࢺʣʗͰʢॿಈࢺʣʗ͋Δʢಈࢺʣ ɾߏจղੳɿ֤୯ޠ PSจઅͷΓड͚ؔΛਪఆ ɾݻ༗දݱநग़ɿ͍ͭɾͲ͜Ͱɾ୭͕ Λநग़ ɾ͔ͳࣈม
ը૾ɿ(J/;"
ࣗવݴޠॲཧͷԠ༻తͳλεΫ 10 ɾจॻྨɿʢྫʣ5XJUUFSͷτϨϯυɺ໎ϝʔϧϑΟϧλʔɺ͍߹ΘͤΛ֤෦ॺʹׂৼΔ ɾจষੜɿʢྫʣΓΜͳͪΌΜɺ(15 ɾ༁ɿʢྫʣ%FFQ- ɾײੳɿʢྫʣϦΞϧλΠϜݕࡧɺલϖʔδͷը૾ ɾߍਖ਼ɿʢྫʣ8PSE ɾཁ ɾจॻݕࡧ ը૾ɿ5XJUUFSɺ:BIPP+"1"/
·ͣ୯ޠʹׂ͠ͳ͍ͱ࢝·Βͳ͍ 11 ɾܗଶૉղੳɿ୳ࡧ ͢ʢ໊ࢺʣʗʢॿࢺʣʗʢ໊ࢺʣʗʢॿࢺʣʗʢ໊ࢺʣʗͷʢॿࢺʣʗ͏ͪʢ໊ࢺʣ ɾʮ֎ࠃਓࢀݖʯʮ֎ࠃʗਓࢀʗݖʯPSʮ֎ࠃʗਓʗࢀʗݖʯʁ ɾࣙॻʹ͋ΔશύλʔϯΛॻ͖ग़͢ ɾΒ͖݅֬͠͞࠶ؼχϡʔϥϧωοτϫʔΫͰֶश ը૾ɿ+6."/
୯ޠΛͲ͏දݱ͢Δʁ 12 ɾ୯ޠʹׂͰ͖ͯจࣈίʔυͷ··Ͱҙຯͷ͋Δԋࢉ͕Ͱ͖ͳ͍ ɾࣗવݴޠϧʔϧ͕ෳࡶ ˠ ౷ܭతͳख๏Λ͏ ɾҰൠతͳຊਓӳޠʹͨ͘͞Μ৮Εͳ͍ͱӳޠ্ୡ͠ͳ͍ ɾ౷ܭͳͷͰ୯ޠΛϕΫτϧԽͰ͖ͨΒউར ʢຒΊࠐΈʣ
౷ܭͱϕΫτϧͬͯؔ͋Δͷʁ 13 ɾσʔλɼσʔλɼʜʜΛͻͱ·ͱΊʹͯ͠ ͻͱͭͷϕΫτϧͱΈͳͤΔ ɾྫ͑ɺ߹ܭֹۚͷܭࢉ ໊ ୯Ձʢԁʣ ݸʢݸʣ ക͓ʹ͗Γ
ࡪ͓ʹ͗Γ πφ͓ʹ͗Γ ߹ܭ ºʴ ºʴ º ݸ ୯Ձ ߹ܭʹ୯Ձɾݸ
୯ޠΛͲ͏දݱ͢Δʁ 14 ɾ#BHPG8PSET ɾ͋Δ୯ޠ͕ग़͖ͯͨΒͦͷ୯ޠͷཁૉΛɺͳ͔ͬͨΒͱͯ͠ϕΫτϧԽ ˞ग़ݱճͱ͢Δ߹͋Δ ɾͪΐX࣍ݩXXXX ɾྫจ"ʮࢲ.POUZ1ZUIPOΛݟͳ͕Β1ZUIPOΛॻ͍ͨʯ ɾྫจ#ʮ·ͭͱ͞Μ3VCZΛॻ͍͍ͯΔʯ ࢲ .POUZ
1ZUIPO ॻ͘ ·ͭͱ 3VCZ ྫจ" ྫจ#
୯ޠΛͲ͏දݱ͢Δʁ 15 ɾ8PSE7FD ɾҰൠతͳจॻ͍ۙҐஔʹग़ͯ͘Δ୯ޠҙຯ͍ۙ ɾগͳ͍࣍ݩͰҙຯΛؚΊͨԋࢉΛߦ͍͍ͨ ɾͦͷ୯ޠͷલޙʹͲͷΑ͏ͳ୯ޠ͕དྷΔ͕֬ߴ͍͔ͰϕΫτϧԽʢࢄදݱʣ ɾӅΕͷχϡʔϥϧωοτͰपลޠͷ༧ଌλεΫͱֶͯ͠श ࢲ .POUZ ॻ͘
·ͭͱ 3VCZ 1ZUIPO
ਂֶशͰ͖Μ͡ΌΜ 16 ɾ୯ޠΛϕΫτϧԽͰ͖ͨʂ ɾจষͬͯ࣌ؒ͝ͱʹมΘΔϕΫτϧ͡ΌΜʂʂ ࢲ .POUZ1ZUIPOΛ ݟ ͳ͕Β 1ZUIPOΛ
ॻ͍ ͨ
ਂֶशͰ͖Μ͡ΌΜ 17 "ͷ֬aɼ#ͷ֬b
ਂֶशʹΑΔࣗવݴޠॲཧ 18 ɾ3//ʢ࠶ؼχϡʔϥϧωοτϫʔΫʣ ɾ(36ʴ"UUFOUJPO ɾ5SBOTGPSNFS ɾ#&35 ɾ5 ɾ͜͜ΒΜৄ࣍͘͠ճҎ߱ʹ
ਂֶशʹΑΔࣗવݴޠॲཧ 19 ɾ3//ʢ࠶ؼχϡʔϥϧωοτϫʔΫʣ ɾ(36ʴ"UUFOUJPO ɾ5SBOTGPSNFS ɾ#&35 ɾ5 ɾ͜͜ΒΜৄ࣍͘͠ճҎ߱ʹ
·ͱΊ 20 ɾࣗવݴޠॲཧίϯϐϡʔλʔʹࣗવݴޠΛॲཧͤ͞Δ͜ͱ ɾ·ͣจࣈྻΛ୯ޠʹׂ͢Δඞཁ͕͋Δ ɾ୯ޠϕΫτϧԽ͢Δͱ͍͍͜ͱ͋ΔͶ ɾਂֶशΛ͏ϝϦοτͱ͔࣮·ΘΓʹ͍ͭͯ࣍ճҎ߱Ͱ