クローリングとインポートの自動化 『にゃーにゃーマップ』vol.4
2. 共通フォーマットCSVをDynamoDBへインポートする。
新たに情報を取りにいったり、既存データはマージする。
● type, title, address, media1~5, locoguide_id, star
=> csv値の値をそのままマージ
● latlon : Google Places API「title address」で検索して取得する
● tel, homepage : csv値 (無い場合 Google Places API 「title address」で検索して取得してみる)
● fb, insta, twitter : csv値 ( + homepageのindexをクローリングして探してみる)
● h3-9,8,7 : h3.geo_to_h3(lat, lon)で取得する
● has_xframe_options : homepage, media1~5
レスポンスヘッダに「X-Frame-Options」があるかどうか?
(=IFrame表示を許可しているか?)
クローリングだけでは捕りきれない情報はググって補完!
\ ないしょだよ /