Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2020-02-09 Gfarmワークショップ2020

2020-02-09 Gfarmワークショップ2020

2020-02-09に行われた「Gfarmワークショップ2020」の参加報告のスライドです。研究室での情報共有用に作ったものです。

Gfarmワークショップ2020 | NPO Tsukuba OSS Technical Support Center
http://oss-tsukuba.org/event/gw2020

TAKAHASHI Shuuji

February 09, 2020
Tweet

More Decks by TAKAHASHI Shuuji

Other Decks in Research

Transcript

  1. Gfarm Workshop 2020 • Gfarmワークショップ2020 | NPO Tsukuba OSS Technical

    Support Center ◦ http://oss-tsukuba.org/event/gw2020 • スライドとYouTubeの動画が公開されている
  2. Gfarm • 20th anniversary ◦ 2000/6 電総研と高エネ研のGRIDミーティング ▪ →LHC実験のために開発開始 ◦

    2002/11 SC日米間ファイル複製実験で世界最高741Mbps ▪ 当時は640MBのATM(パケットが落ちやすい)しかなかった ◦ 2003/11 SC03 分散インフラストラクチャ賞 Gfarm1.0公開2005/11 SC05 Most Innovative Use of Storage In Support of Science ◦ 2006/11 SC05 HPC Storage Challenge 優勝
  3. Gfarm (cont’d) • HPCI共用ストレージ ◦ Gfarmにより全国で約100PBのストレージを提供 ◦ スパコン間のデータ共有、共有データ格納 ◦ 西拠点:R-CCS

    + 東拠点:東大 • 最近の状況・今後 ◦ GitHubへ移行 ◦ Gfarm/BBバーストバッファの実装 ◦ IPv6・データ暗号化に対応予定
  4. mdx: データ活用社会共創プラットフォーム • 文部科学省「データ利活用の推進に向けた情報基盤整備の現状と課題等につ いて」データの高度利活用環境 (NIIと東大に先行して整備) • スパコンの単一OS+バッチスケジューラとは全く違う ◦ Windowsも使える(本当?)

    ◦ データ蓄積 ◦ セキュリティ ◦ ストリーム処理 ◦ JupyterLab • 2021年1月末稼働開始予定(遅れる可能性もある) • 全体的にまだ議論の途中と言っていて非常にふわっとしていた。
  5. DAOS • Aurora ◦ 230PBのストレージを提供、バンド幅 >25TB • DAOS ◦ 20201Qにv1公開予定

    ◦ それまでは大変かもしれないので、v1が出てから触るのがおすすめ ◦ わからないときはcommunity mailing listに積極的に投稿してくだ さい • 富士通の人たち ◦ チュートリアル資料はある?ロードマップはどうなってる? ◦ →ドキュメントが親切じゃないので、メーリングリストに言ったほうが 良い。私も挫折した。
  6. Weka.IO • 特徴 ◦ HDDをサポートせず、NVMe に最適されているため、低レイテンシで小 さいファイルに強い ◦ 自動階層化機能: S3にバックアップ可能

    ◦ さまざまなコネクタ: NFS, SMB, HDFS, S3と接続 • Eresure Codingに近いがCPU使用率を抑えるMatrixDDP(特許)を使用し ている • 使用するにはアプライアンスの購入とライセンスが必要 • HPのウェブサイトよりWeka.IOのドキュメントを読んだほうが良い ◦ WekaIO Documentation - Weka.IO - https://docs.weka.io/
  7. Next-Generation DDN Exascaler by DDN • Exa5(25の新機能): 大きなリブランディングを進めている ◦ Lustre上でS3ゲートウェイが実装された

    ▪ /bucket/object = filename (!= Object ID) ◦ IME (Burst Buffer) にレプリケーションが実装された • RED: 5年前から進めているプロジェクト ◦ スケーラブルなブロックデバイスを作る巨大なKey-Value store ◦ 特徴: ▪ 100%NVMe ▪ RDMA経由のブロックデバイス ▪ 1Uで80GB/s出ることを目標 ▪ REDの上でLustre VMを動かす
  8. Oracle Cloud • Oracle Cloud の話が出なくて悲しいです。ぜひ使ってください • 新機能 ◦ SINETの接続に対応

    ◦ InfiniBand・GPUに対応 • Oracle Cloud を使っていた北澤さんの研究の紹介 • 学術研究向けに250万円クレジットを提供中 (申請が必要) • https://blogs.oracle.com/oracle4engineer/oracle-cloud-pla tformpaasiaas