Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Google検索をJavaScriptなしで

 Google検索をJavaScriptなしで

発表:: LILO&東海道らぐオフラインミーティング 2025-01-26 https://lilo.connpass.com/event/341776/
source:: https://codeberg.org/matoken/LILO_TOKAIDO-2025.01/src/branch/main/slide/slide.adoc

Kenichiro MATOHARA

January 26, 2025
Tweet

More Decks by Kenichiro MATOHARA

Other Decks in Technology

Transcript

  1. 4

  2. テキストブラウザだと動く JavaScriptが駄目ということはw3mとかで使えなくなったか…… あれ?使える $ w3m -dump http://www.google.com/search?q=%82%CB%82%B1 | head Google

    [ねこ ] [検索] すべて 画像 動画 書籍 ネコ動物 ネコ ネコは、狭義には食肉目ネコ科ネコ属に分類されるリビアヤマネコが家畜化されたイエ ネコに対する通称である。イヌと並ぶ代表的なペットとして、世界中で飼われている。 5
  3. cli Google検索ツールのGoogler cliでGoogle検索時に便利なGooglerも動作しなくなっている $ googler neko No results. If you

    believe this is a bug, please review https://git.io/googler-no-results before submitting a bug report. 8
  4. UAはSafariになっているのでそのせいかとUAを書き換えても動作 しない Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_1) AppleWebKit/537.36

    (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36 debugオプションを使ってquery結果のhtmlを覗くと元のSafari でもw3mなどでも検索結果は取得できている html形式が変わってGooglerがパースに失敗してGooglerで No results.に? 直してもまたすぐ駄目になりそう?とりあえずは w3m www.google.com などで回避 9
  5. Whoole Searchのインストールと起動 README.md には様々な導入方法が紹介されている Dockerやpipxが手軽そう ここではsourceをcloneしてvenvに構築した $ sudo apt install

    libcurl4-openssl-dev libssl-dev git python3-venv $ git clone https://github.com/benbusby/whoogle-search.git $ cd whoogle-search $ python3 -m venv venv $ source venv/bin/activate $ pip install -r requirements.txt $ ./run Running on http://0.0.0.0:5000 11
  6. 13