2020-02-09に行われた「Gfarmワークショップ2020」の参加報告のスライドです。研究室での情報共有用に作ったものです。
Gfarmワークショップ2020 | NPO Tsukuba OSS Technical Support Center http://oss-tsukuba.org/event/gw2020
Gfarm Workshop 20202020-02-09 @宮崎
View Slide
Gfarm Workshop 2020● Gfarmワークショップ2020 | NPO Tsukuba OSS Technical SupportCenter○ http://oss-tsukuba.org/event/gw2020● スライドとYouTubeの動画が公開されている
Gfarm● 20th anniversary○ 2000/6 電総研と高エネ研のGRIDミーティング■ →LHC実験のために開発開始○ 2002/11 SC日米間ファイル複製実験で世界最高741Mbps■ 当時は640MBのATM(パケットが落ちやすい)しかなかった○ 2003/11 SC03 分散インフラストラクチャ賞 Gfarm1.0公開2005/11SC05 Most Innovative Use of Storage In Support ofScience○ 2006/11 SC05 HPC Storage Challenge 優勝
Gfarm (cont’d)● HPCI共用ストレージ○ Gfarmにより全国で約100PBのストレージを提供○ スパコン間のデータ共有、共有データ格納○ 西拠点:R-CCS + 東拠点:東大● 最近の状況・今後○ GitHubへ移行○ Gfarm/BBバーストバッファの実装○ IPv6・データ暗号化に対応予定
どうするんだHPCI共用ストレージ● HPCI共用ストレージ: 全国からSSOで利用可能な100Gbpsで接続された約100PB+の共用ストレージ。Gfarmにより構築されている。● 機能追加や高い稼働率(2018年は99.26%、2019年は100%)での運用を頑張っている● 今後: Singularityにマウントして利用、暗号化● 研究でもクラウドとS3互換ストレージの利用が増えているのでGfarmのS3対応に期待
mdx: データ活用社会共創プラットフォーム● 文部科学省「データ利活用の推進に向けた情報基盤整備の現状と課題等について」データの高度利活用環境 (NIIと東大に先行して整備)● スパコンの単一OS+バッチスケジューラとは全く違う○ Windowsも使える(本当?)○ データ蓄積○ セキュリティ○ ストリーム処理○ JupyterLab● 2021年1月末稼働開始予定(遅れる可能性もある)● 全体的にまだ議論の途中と言っていて非常にふわっとしていた。
DAOS● Aurora○ 230PBのストレージを提供、バンド幅 >25TB● DAOS○ 20201Qにv1公開予定○ それまでは大変かもしれないので、v1が出てから触るのがおすすめ○ わからないときはcommunity mailing listに積極的に投稿してください● 富士通の人たち○ チュートリアル資料はある?ロードマップはどうなってる?○ →ドキュメントが親切じゃないので、メーリングリストに言ったほうが良い。私も挫折した。
Weka.IO● 特徴○ HDDをサポートせず、NVMe に最適されているため、低レイテンシで小さいファイルに強い○ 自動階層化機能: S3にバックアップ可能○ さまざまなコネクタ: NFS, SMB, HDFS, S3と接続● Eresure Codingに近いがCPU使用率を抑えるMatrixDDP(特許)を使用している● 使用するにはアプライアンスの購入とライセンスが必要● HPのウェブサイトよりWeka.IOのドキュメントを読んだほうが良い○ WekaIO Documentation - Weka.IO - https://docs.weka.io/
Next-Generation DDN Exascaler by DDN● Exa5(25の新機能): 大きなリブランディングを進めている○ Lustre上でS3ゲートウェイが実装された■ /bucket/object = filename (!= Object ID)○ IME (Burst Buffer) にレプリケーションが実装された● RED: 5年前から進めているプロジェクト○ スケーラブルなブロックデバイスを作る巨大なKey-Value store○ 特徴:■ 100%NVMe■ RDMA経由のブロックデバイス■ 1Uで80GB/s出ることを目標■ REDの上でLustre VMを動かす
Oracle Cloud● Oracle Cloud の話が出なくて悲しいです。ぜひ使ってください● 新機能○ SINETの接続に対応○ InfiniBand・GPUに対応● Oracle Cloud を使っていた北澤さんの研究の紹介● 学術研究向けに250万円クレジットを提供中 (申請が必要)● https://blogs.oracle.com/oracle4engineer/oracle-cloud-platformpaasiaas