Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2020-02-09 Gfarmワークショップ2020

2020-02-09 Gfarmワークショップ2020

2020-02-09に行われた「Gfarmワークショップ2020」の参加報告のスライドです。研究室での情報共有用に作ったものです。

Gfarmワークショップ2020 | NPO Tsukuba OSS Technical Support Center
http://oss-tsukuba.org/event/gw2020

TAKAHASHI Shuuji

February 09, 2020
Tweet

More Decks by TAKAHASHI Shuuji

Other Decks in Research

Transcript

  1. Gfarm Workshop 2020
    2020-02-09 @宮崎

    View Slide

  2. Gfarm Workshop 2020
    ● Gfarmワークショップ2020 | NPO Tsukuba OSS Technical Support
    Center
    ○ http://oss-tsukuba.org/event/gw2020
    ● スライドとYouTubeの動画が公開されている

    View Slide

  3. Gfarm
    ● 20th anniversary
    ○ 2000/6 電総研と高エネ研のGRIDミーティング
    ■ →LHC実験のために開発開始
    ○ 2002/11 SC日米間ファイル複製実験で世界最高741Mbps
    ■ 当時は640MBのATM(パケットが落ちやすい)しかなかった
    ○ 2003/11 SC03 分散インフラストラクチャ賞 Gfarm1.0公開2005/11
    SC05 Most Innovative Use of Storage In Support of
    Science
    ○ 2006/11 SC05 HPC Storage Challenge 優勝

    View Slide

  4. Gfarm (cont’d)
    ● HPCI共用ストレージ
    ○ Gfarmにより全国で約100PBのストレージを提供
    ○ スパコン間のデータ共有、共有データ格納
    ○ 西拠点:R-CCS + 東拠点:東大
    ● 最近の状況・今後
    ○ GitHubへ移行
    ○ Gfarm/BBバーストバッファの実装
    ○ IPv6・データ暗号化に対応予定

    View Slide

  5. どうするんだHPCI共用ストレージ
    ● HPCI共用ストレージ: 全国からSSOで利用可能な100Gbpsで接続された約
    100PB+の共用ストレージ。Gfarmにより構築されている。
    ● 機能追加や高い稼働率(2018年は99.26%、2019年は100%)での運用を頑
    張っている
    ● 今後: Singularityにマウントして利用、暗号化
    ● 研究でもクラウドとS3互換ストレージの利用が増えているのでGfarmのS3対
    応に期待

    View Slide

  6. mdx: データ活用社会共創プラットフォーム
    ● 文部科学省「データ利活用の推進に向けた情報基盤整備の現状と課題等につ
    いて」データの高度利活用環境 (NIIと東大に先行して整備)
    ● スパコンの単一OS+バッチスケジューラとは全く違う
    ○ Windowsも使える(本当?)
    ○ データ蓄積
    ○ セキュリティ
    ○ ストリーム処理
    ○ JupyterLab
    ● 2021年1月末稼働開始予定(遅れる可能性もある)
    ● 全体的にまだ議論の途中と言っていて非常にふわっとしていた。

    View Slide

  7. DAOS
    ● Aurora
    ○ 230PBのストレージを提供、バンド幅 >25TB
    ● DAOS
    ○ 20201Qにv1公開予定
    ○ それまでは大変かもしれないので、v1が出てから触るのがおすすめ
    ○ わからないときはcommunity mailing listに積極的に投稿してくだ
    さい
    ● 富士通の人たち
    ○ チュートリアル資料はある?ロードマップはどうなってる?
    ○ →ドキュメントが親切じゃないので、メーリングリストに言ったほうが
    良い。私も挫折した。

    View Slide

  8. Weka.IO
    ● 特徴
    ○ HDDをサポートせず、NVMe に最適されているため、低レイテンシで小
    さいファイルに強い
    ○ 自動階層化機能: S3にバックアップ可能
    ○ さまざまなコネクタ: NFS, SMB, HDFS, S3と接続
    ● Eresure Codingに近いがCPU使用率を抑えるMatrixDDP(特許)を使用し
    ている
    ● 使用するにはアプライアンスの購入とライセンスが必要
    ● HPのウェブサイトよりWeka.IOのドキュメントを読んだほうが良い
    ○ WekaIO Documentation - Weka.IO - https://docs.weka.io/

    View Slide

  9. Next-Generation DDN Exascaler by DDN
    ● Exa5(25の新機能): 大きなリブランディングを進めている
    ○ Lustre上でS3ゲートウェイが実装された
    ■ /bucket/object = filename (!= Object ID)
    ○ IME (Burst Buffer) にレプリケーションが実装された
    ● RED: 5年前から進めているプロジェクト
    ○ スケーラブルなブロックデバイスを作る巨大なKey-Value store
    ○ 特徴:
    ■ 100%NVMe
    ■ RDMA経由のブロックデバイス
    ■ 1Uで80GB/s出ることを目標
    ■ REDの上でLustre VMを動かす

    View Slide

  10. Oracle Cloud
    ● Oracle Cloud の話が出なくて悲しいです。ぜひ使ってください
    ● 新機能
    ○ SINETの接続に対応
    ○ InfiniBand・GPUに対応
    ● Oracle Cloud を使っていた北澤さんの研究の紹介
    ● 学術研究向けに250万円クレジットを提供中 (申請が必要)
    ● https://blogs.oracle.com/oracle4engineer/oracle-cloud-pla
    tformpaasiaas

    View Slide