Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ウェブAPIのためのRパッケージ作成の勘所
Search
yutannihilation
March 18, 2017
Programming
1
1.5k
ウェブAPIのためのRパッケージ作成の勘所
第59回R勉強会@東京での発表資料です。
yutannihilation
March 18, 2017
Tweet
Share
More Decks by yutannihilation
See All by yutannihilation
RパッケージでRustを使うには: extendr入門 / extendr-pkg-dev
yutannihilation
1
7.3k
🦀
yutannihilation
2
810
rayshader入門 / rayshader-tokyor88
yutannihilation
0
1.1k
RとApache Arrow / r-and-apache-arrow
yutannihilation
4
7.3k
そろそろ使ってみませんかApache Arrow / why-dont-you-arrow-now
yutannihilation
2
1.1k
A Graphical Introduction to tidyr's pivot_*()
yutannihilation
5
5.3k
tidyr 1.0.0の新機能 pivot_*() / tidyr-pivot
yutannihilation
4
11k
RとApache Arrow
yutannihilation
0
3.4k
Yet Another Introduction to tidyeval
yutannihilation
10
7.9k
Other Decks in Programming
See All in Programming
從冷知識到漏洞,你不懂的 Web,駭客懂 - Huli @ WebConf Taiwan 2025
aszx87410
2
3.2k
脳の「省エネモード」をデバッグする ~System 1(直感)と System 2(論理)の切り替え~
panda728
PRO
0
130
Jetpack XR SDKから紐解くAndroid XR開発と技術選定のヒント / about-androidxr-and-jetpack-xr-sdk
drumath2237
1
200
メルカリのリーダビリティチームが取り組む、AI時代のスケーラブルな品質文化
cloverrose
2
410
JETLS.jl ─ A New Language Server for Julia
abap34
2
460
AI 駆動開発ライフサイクル(AI-DLC):ソフトウェアエンジニアリングの再構築 / AI-DLC Introduction
kanamasa
11
4.5k
GoLab2025 Recap
kuro_kurorrr
0
780
AI前提で考えるiOSアプリのモダナイズ設計
yuukiw00w
0
200
20251212 AI 時代的 Legacy Code 營救術 2025 WebConf
mouson
0
230
開発に寄りそう自動テストの実現
goyoki
2
1.5k
Giselleで作るAI QAアシスタント 〜 Pull Requestレビューに継続的QAを
codenote
0
320
Kotlin Multiplatform Meetup - Compose Multiplatform 외부 의존성 아키텍처 설계부터 운영까지
wisemuji
0
140
Featured
See All Featured
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
0
970
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
3k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
10
770
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
120
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
GitHub's CSS Performance
jonrohan
1032
470k
Balancing Empowerment & Direction
lara
5
830
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
RailsConf 2023
tenderlove
30
1.3k
Transcript
ウェブ のための パッケージ作成の勘所 湯谷 啓明
ドーモ • •某グループウェアの会 社の チームに所属 •好きな言語: 、忍殺語 •将来の夢: モジュラーシンセ廃人
本 によるスクレイピング入門 •ウェブスクレイピング •ウェブ • 初心者にも丁寧に説明! •豊富な実例!
パッケージ • • 国土数値情報 • • •つくりかけ: • • •
今日話すこと • を使うにはどこから始めればいいか •困ったときのデバッグ方法 •認証についてのつらかった話(愚痴) •クレデンシャルの管理
( )
の翻訳 ( )
基本はこれを読んでおけば ? わりと でも
None
None
(参考) とは? ( )
情報収集
すでに開発されているパッケージ •車輪を再発明する必要はないので、既存のものが ニーズに合うならそれを使う •ニーズに合わなかったり古くて動かなくても、実 装は参考になることがある •他言語の実装も参考になることもある
ドキュメント • の仕様 • データ形式 • 認証方式 • 細かい部分は試しながらでいい •
どのような制限事項があるかは注意して読む • の利用規約 • データがどういうライセンスなのか • クレジット表示の必要があるか
例:国土数値情報 ( ) ※ パッケージに日本語を含めるのはつらい。。 (参考: )
を使ってみる
まずは簡単そうなものから •認証不要の •指定するパラメータが少なくていい •返ってくるデータが単純な構造の
結果のデータ構造を見る •どんなデータ形式か( ? ?) •ほしいデータがどこにあるか
結果のデータ構造を見る: •データの構造を表示する •慣れるまで時間がかかるけど、キーボードしか触 りたくないという人には便利 •引数を付けて表示を制限 • 長いベクトルやリストをど こまで表示するかを指定 • ネストしたリストを何階層まで下るか
を指定
結果のデータ構造を見る: ( )
結果のデータ構造を見る: ( 、 ) ※ にはリリースされていないので でインストール
結果のデータ構造を見る とりあえず結果をファイルに保存しておくと、あ とでいろいろ試すときに便利 • レスポンス をまるごとバイナリとして保存 • レスポンスをまる ごと のコードとして保存
• レスポンスボディだけでいいなら でも
とりあえずデータフレーム化を目指す
にも期待! ( )
うまく動かない時
まずはエラーを確認 •ステータスコードとレスポンスボディ ステータスコード。 ならたぶん成功、 ~なら失敗 レスポンスボディ。 エラーメッセージが入っていることがある。
例: 認証に失敗しました。アプリケーション を確認して下さい。 ステータスコードは だけどエラー!!! (このパターンはたまにあります。 ドキュメント読みましょう )
送信しているリクエストを確認 オブジェクトの中身 •実は の中に入っている
送信しているリクエストを確認 オブジェクトの中身 •リクエストボディも入っている。ただし 型に なっているのに注意。
送信しているリクエストを確認 •送ったリクエストのヘッダや中身を返すウェブ サービス
認証
認証はつらい。
よくある認証方式 •認証なし:楽 •個人用アクセストークン:楽 •ユーザ名とパスワード:楽だけど注意 • うっかり漏れるとやばい • アクセストークン:注意 • の
が特殊なことも割とある • の実装がバグっていることも •署名を付ける系:死ぬほど大変
よくある認証方式: 個人用アクセストークン •例: など •どこに保存するかが悩みどころ(後述)
よくある認証方式: •「よくある」けど、実装はいろいろ •実装側に任されている部分が大きいので、 がすべてのケースをカバーできるわけではない • レポジトリの 以下のコードを参照 •特に に関しては、 の実装が適当
な感じがする (後述)
例: を使うと書かれている ( )
例: •トークンの取得は成功する。 •でもトークンを使おうとするとエラーが
例: ヘッダの形式が独自だった (注:これは 違反ではない。 トークンを別の 認証方式に転用することを禁じる理由はない) よくあるヘッダはこう (そして はこれしかサポートしていない )
例: •英語だとエラーにならないが日本語だとエラーに 写輪眼
例: の の実装がバグってる ! ( )
例: •ブラウザが開いて承認を求められるところまでは いくけど、エラーが • で調べるとレスポンスにこんなのが。 が余計らしい。
例: の 実装がサボってる! (バグとまでは言えないのがつらいところ ) ( )
よくある認証方式:署名 •リクエストの要素をあるルールでひとつの文字列 に結合、そのハッシュ値をとる。 •例: 、 •自前で実装するとなるとけっこう大変。バグりが ち( しかり)。 •まあでもそんな機会はほぼないはず ※私は一度あって死にました。
認証方式のまとめ •世の中わりとバグっている •気合と根性で乗り切る •実例から学ぶしかないので、「 によるスクレイ ピング入門」をお手元に一冊是非ッッ!
クレデンシャルの管理
認証はつらい。
クレデンシャルとは •ユーザ認証に使われる情報。具体的には 、パ スワード、アクセストークンなど。 •うっかり に公開してしまうとまずい。 •まあそんなうっかりな人いないですよね?
ヒント:
None
クレデンシャルを守るために •ユーザにはコンソールに打ち込ませない • 環境変数 • •ファイルに保存する場合は、 の管理下に置か ない • •
レポジトリとは別の場所に置く
認証の場合 コンソールで を打 ち込む( の場合) ブラウザが開いて別のユーザ認証が動く トークン発行 というフローなので、 が漏れても致命 的ではない(
は公開 !と言っている)。
認証の場合 •取得したトークンは漏れるとまずい。 •トークンをローカルに保存する場合、 が というファイルをつくる。 •このファイルは、 に追記されるので 安心!
None
認証以外の場合 •漏れると即アウトのものが多い • は面倒を見てくれないので自分でやる必要 がある。
インタラクティブな環境変数の指定 • でプロンプ トを立ち上げる。
による環境変数の指定 • のセッション立ち上げ時に読み 込まれるファイル。環境変数を指定する。 •ワーキングディレクトリではなく、ユーザのホー ムディレクトリに配置。 •つまり、レポジトリ外にあるファイルなので に誤って取り込まれる可能性は低い。安心!
による環境変数の指定 ホームディレクトリの特定 そこに以下の内容の を作成 追記 セッションを再起動、環境変数があるか確認 なら ユーザ なら ユーザになる?
最後は空行 のコードではないので記法が違う
None
クレデンシャルの管理のまとめ •環境変数やポップアップを駆使して、なるべくコ ンソールでクレデンシャルを打ち込ませないよう にしましょう •がんばっても結果に結びつかないこともあるけど 強く生きていきましょう
最後に
•ウェブ の世界はまだまだ •今日話した部分は、今の私の力量では体系的に書 けなかったことで心残り •ぜひ本を買ってマサカリをください •あと、 とウェブ 関連で困ってることがあれ ばお気軽にご相談ください
買って、マサカリをぜひ。 によるスクレイピング入門 •ウェブスクレイピング •ウェブ • 初心者にも丁寧に説明! •豊富な実例!