Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
F#でスクレイピングをしてみた!(F# SCRAPING)
Search
callmekohei
July 02, 2016
Programming
1
910
F#でスクレイピングをしてみた!(F# SCRAPING)
2016/07/03開催のF#談話室(23)の発表資料です。
callmekohei
July 02, 2016
Tweet
Share
Other Decks in Programming
See All in Programming
PHPでWebSocketサーバーを実装しよう2025
kubotak
0
320
Hack Claude Code with Claude Code
choplin
7
2.6k
AI コーディングエージェントの時代へ:JetBrains が描く開発の未来
masaruhr
1
200
Model Pollution
hschwentner
1
160
NEWT Backend Evolution
xpromx
1
140
GPUを計算資源として使おう!
primenumber
1
250
AIともっと楽するE2Eテスト
myohei
8
3k
Goで作る、開発・CI環境
sin392
0
260
顧客の画像データをテラバイト単位で配信する 画像サーバを WebP にした際に起こった課題と その対応策 ~継続的な取り組みを添えて~
takutakahashi
4
1.3k
Google Agent Development Kit でLINE Botを作ってみた
ymd65536
2
260
ソフトウェア設計とAI技術の活用
masuda220
PRO
17
3.8k
生成AI時代のコンポーネントライブラリの作り方
touyou
1
290
Featured
See All Featured
Code Reviewing Like a Champion
maltzj
524
40k
Building an army of robots
kneath
306
45k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
50
5.5k
Automating Front-end Workflow
addyosmani
1370
200k
Being A Developer After 40
akosma
90
590k
A Modern Web Designer's Workflow
chriscoyier
695
190k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
The Language of Interfaces
destraynor
158
25k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.8k
Code Review Best Practice
trishagee
69
19k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.4k
Transcript
F# SCRAPING F#ͰεΫϨΠϐϯάΛͯ͠Έͨʂ callmekohei 2016/07/03 Sun
Overview • ࣗݾհ • εΫϨΠϐϯάͷ͖͔͚ͬ • HTMLͷ2ͭͷऔಘํ๏ • HTML͔ΒσʔλʔΛͱΓͩͯ͠ΈΔ
callmkohei VBA 3 years F# 9 months ͷ໊લ ϨΦɻ ΑΖ͘͠Ͷʂ
εΫϨΠϐϯάͷ͖͔͚ͬ
͜Μͳײ͡Ͱ ϩτ̓ͷ༧ଌΛ ͍ͨ͠
ϩτ̓ͷબ൪߸Λ ϗʔϜϖʔδΑΓ ೖख͍ͨ͠
None
ϗʔϜϖʔδ HTMLιʔεͰ Ͱ͖͍ͯΔ
None
ϗʔϜϖʔδͷσʔλʔΛ औಘ͢Δʹ HTMLιʔε͕ඞཁ
Ͳ͏ͬͯ HTMLιʔεΛ औಘ͢Δ͔
HTMLιʔεΛऔಘ͢Δ̎ͭͷํ๏
ͦͷ̍ System.NetΛ͔ͭ͏
ͦͷ̎ PhantomJS Λ͔ͭ͏
جຊతʹ System.NetͷΈͰ େৎʢͩͱࢥ;ɻɻɻʣ ͜͜ ߟ͑Ͳ͜Ζ
Ͳ͏্ͯ͠ख͘ औಘͰ͖ͳ͍߹ PhantomJSΛͬͯΈΔ
ͨͩ PhantomJS ͍ͷͰ͢
αʔόʔͷଓൺֱ System.Net: 2s PhantomJS: 7s ࣮ߦ࣌ؒࢀߟ
͜͜Ͱ ࣮ࡍʹαʔόʔʹ ͭͳ͛ͯΈΔ demo
HTMLιʔε͔Β σʔλʔΛ ͱΓͩͯ͠ΈΔ
͜͜Ͱ ศརͳ ϥΠϒϥϦ FSharp.Data
FSharp Data ͱʁ The F# Data library implements everything you
need to access data in your F# applications and scripts. CSV, HTML, JSON and XML ʹରͯ͠ͷศརϥΠϒϥϦ http://fsharp.github.io/FSharp.Data/
a tag
͜͜Ͱ a tag Λ ͱΓͩͯ͠ΈΔ demo
table tag
͜͜Ͱ table tag Λ ͱΓͩͯ͠ΈΔ demo
εΫϨΠϐϯά͢Δͱ͖ʹ ศརͩͱࢥ͏ؔΛ ·ͱΊͯΈͨ
SCRAPINGfs https://github.com/callmekohei/SCRAPINGfs
͞Βʹɺɺ
FSharp.Data HtmlDocument.Load ͍͚ͯͳ͍ͱࢥͬͯΔͱ͜Ζ
ϒϥβʔ͡Όͳ͍ͱ͔͡ΕΔ จࣈίʔυ͕͏·͘ॲཧ͞Εͳ͍ Http Utilities Λ͏͜ͱͰղܾʂ
Formॲཧ͕Ͱ͖ͳ͍
Formॲཧ͕Ͱ͖ͳ͍ Http Utilities Λ͏͜ͱͰͪΐͬͱղܾʂ
Formॲཧ͕Ͱ͖ͳ͍ System.Net Λ͏͜ͱͰղܾʂ
؆୯ͳൺֱද
͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠