Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Wikipedia を Offlineで楽しむ

Wikipedia を Offlineで楽しむ

東海道らぐのLTのやり方を綺麗さっぱり忘れました大会@大阪南港(ハイブリッド) 2022-11-12(土) 14:00-14:50
https://tokaidolug.colorfultime.net/?p=788
https://www.k-of.jp/2022/session/tokaidolug_lt_return/
https://tokaidolug.connpass.com/event/264825/

source
https://gitlab.com/matoken/tokaido-2022.11-kof/-/blob/master/slide/slide.adoc

Kenichiro MATOHARA

November 12, 2022
Tweet

More Decks by Kenichiro MATOHARA

Other Decks in Technology

Transcript

  1. Wikipedia を Offline
    で楽しむ
    Kenichiro Matohara(matoken)
    1

    View Slide

  2. 南隅から参加(鹿児島の右下)
    好きなLinuxディストリビューションはDebian
    お仕事募集 mailto:work@matohara.org
    Kenichiro Matohara(matoken)
    https://matoken.org
    2

    View Slide

  3. 台風14号
    🌀
    停電3.5日
    PC やスマホはバッテリーでしばらくは動く
    固定回線ダウン → 数時間後携帯回線もダウン → 完全オフライン

    手持ち無沙汰
    オフラインでWikipediaなどのコンテンツを利用できるKiwix を試
    してみた
    3

    View Slide

  4. Kiwix




    WebPage 等を.zim 形式のアーカイブにして配布,Readerを使って
    offline で読める
    https://www.kiwix.org/
    https://wiki.openzim.org/wiki/OpenZIM
    4

    View Slide

  5. Kiwixのコンテンツ
    以下にたくさんのコンテンツ
    Wikipedia, IFixit, ArchWiki, Gentoo Wiki, OpenStreetMap
    Wiki……
    日本語

    好みのものをダウンロードしておく.
    https://library.kiwix.org/
    https://library.kiwix.org/?lang=jpn
    5

    View Slide

  6. 日本語のWikipediaだけで6つ?
    Wikipedia全て
    wikipediajaallmini2021-03.zim 2.31GB コンテンツの頭の部分
    のみ,画像なし.
    wikipediajaallnopic2021-03.zim 12.26GB 画像なし
    wikipediajaallmaxi2021-03.zim 20.47GB 全て
    top 50000
    wikipediajatopmini2022-10.zim 160.35MB top 50000のコンテン
    ツの頭の部分のみ,画像なし.
    wikipediajatopnopic2022-10.zim 2.27GB top 50000の画像なし
    wikipediajatopmaxi2022-10.zim 3.96GB top 50000の全て
    6

    View Slide

  7. 見た目の比較(Linuxを例に)
    mini
    nopic
    maxi

    7

    View Slide

  8.  Stack Overflow は資金難で2018年以降更新されていなかった
    が,Stack Overflow の支援によりOverflow Offline プロジェ
    クトが開始.
    https://stackoverflow.blog/2022/10/20/introducing-the-
    overflow-offline-project/
    8

    View Slide

  9. Reader(client)
    Kiwix-desktop
    WebBrowser extention(Chrome, Firefox, Edge)
    kiwix-hotspot
    動作環境
    Android, Windows, GNU/Linux, Raspberry Pi, iOS, macOS,
    Browser Extensions
    今回はDebian Bookworm amd64のkiwix pkg(2.3.0-1)を利用.

    ダウンロードした .zim をopen
    https://www.kiwix.org/en/download/
    $ sudo apt install kiwix
    9

    View Slide

  10. インクリメンタル検索
    10

    View Slide

  11. キーワード検索
    11

    View Slide

  12. ページ表示
    12

    View Slide

  13. Server
    LAN内にKiwixコンテンツを共有
    Windows x86_64, Linux x86_64/32, Linux ARM32 のバイナリが提
    供されている
    ARM版でバイナリでRaspberry Piで試す
    https://www.kiwix.org/en/downloads/kiwix-serve/
    $ wget2 -c https://download.kiwix.org/release/kiwix-tools/kiwix-tools_linux-armhf.tar.gz

    tar tvf kiwix-tools_linux-armhf.tar.gz

    -rwxr-xr-x runner/runner 17685736 2022-09-07 00:11 kiwix-tools_linux-armhf-3.3.0-1/kiwix-manage

    -rwxr-xr-x runner/runner 16835964 2022-09-07 00:11 kiwix-tools_linux-armhf-3.3.0-1/kiwix-search

    -rwxr-xr-x runner/runner 19024920 2022-09-07 00:11 kiwix-tools_linux-armhf-3.3.0-1/kiwix-serve

    $ tar xf kiwix-tools_linux-armhf.tar.gz

    $ ./kiwix-tools_linux-armhf-3.3.0-1/kiwix-serve --port 8888 ~/Downloads/wikipedia_ja_top_mini_2022-09.zim

    The Kiwix server is running and can be accessed in the local network at: http://192.168.68.105:8888/
    13

    View Slide

  14. LAN内の別端末のウェブブラウザ
    からアクセス
    14

    View Slide

  15. tool
    ZIM tool

    自分で.zimを編集したりスクレイピングして作ったり
    Zimit

    URL を指定するとスクレイピングして.zimファイルを作成してく
    れるウェブサービス
    対象siteにより巨大になったりするのでoptionでスコープを指定
    したり
    https://github.com/openzim/zim-tools
    https://youzim.it/
    15

    View Slide

  16. まとめ
    オフラインでWikipediaなどのサイトを閲覧できるようになるKiwix
    回線が細い場所やオフラインで便利に使える
    自分でアーカイブすることもできるのでよく使う,保存しておきた
    いsiteのアーカイブにも?
    StackOverflow Offline プロジェクトにも期待
    http://kiwix.org/
    16

    View Slide

  17. 奥付
    発表
    2022-11-12(土)
    発表者
    利用ソフトウェア
    ライセンス
    東海道らぐのLTのやり方を綺麗さっぱり忘れました大会@大阪
    南港(ハイブリッド)
    Kenichiro Matohara(matoken)
    Asciidoctor Reveal.js
    CC BY 4.0
    17

    View Slide