Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Rayleigh: 分散処理フレームワークRayの管理プラットフォーム / Rayleigh:...

Rayleigh: 分散処理フレームワークRayの管理プラットフォーム / Rayleigh: A Management Platform for Ray Clusters

Machine Learning Platform 部では、多種多様なサービスに対して、機械学習を活用した課題解決を提供しています。近年では、機械学習モデルの大規模化・高度化に伴い、Ray を用いた分散処理に取り組んできました。その中で、Ray の実運用を支える基盤として Rayleigh を開発し、開発スピードの向上と高いセキュリティレベルの両立を実現しています。
本発表では、私たちがなぜ Ray を選択したのか、Rayleigh がどのような課題を解決しているのかといった観点から、実際の取り組みについてご紹介します。

More Decks by LINEヤフーTech (LY Corporation Tech)

Other Decks in Technology

Transcript

  1. 1SPEVDUTGSPN.BDIJOF-FBSOJOH1MBUGPSN .BDIJOF-FBSOJOH 1MBUGPSN .-"1* -JGGZ 0'4 ʜ 4NBSU $IBOOFM /&84

    45*$,&34 .64*$ "% 0OMJOF'FBUVSF4UPSF 0'4 %BUBTUPSFPSJFOUFEUPIJHI UISPVHIQVUMPXMBUFODZSBOEPN BDDFTT -JGGZ "VOJGJFE"#UFTUJOHQMBUGPSN UIBUJOUFHSBUFTUIPTF QSFWJPVTMZPQFSBUFECZ-*/& BOE:BIPP+BQBO .-"1* "VUP.-MJLF1MBUGPSN
  2. .-4ZTUFN0WFSWJFX /FXT 4UJDLFST 0GGJDJBM "DDPVOU 3FSBOLFS 3FUSJFWFS 'FBUVSF &YUSBDUJPO 6TFS

    'FBUVSFT *UFN 'FBUVSFT ・・・ "// *OEFY 'FBUVSFT 3BUJOH "QQ-PH 6TFS-PH &5- 1SFQSPDFTT 4FSWJDFT $MJFOU"QQ
  3. $IBMMFOHFTJO $PME4UBSU1SPCMFN %BUBBOE.PEFMT 'SBHNFOUFE"DSPTT 4FSWJDFT /FBS3FBMUJNF 3FDPNNFOEBUJPO -JNJUFE*OQVU*OGPSNBUJPO $IBMMFOHFT .VMUJ.PEBM

    .VMUJ%PNBJO 3PCVTU 'PVOEBUJPO.PEFM 4PMVUJPOT .FEJVN-BSHF .PEFMT 4UBUFPGUIFBSU 5FDIOPMPHZ 3FRVJSFNFOUT .-1  #&35 (159  %JTUSJCVUFE5SBJOJOH .FNPSZ0QUJNJ[BUJPO
  4. 3BUJOH "QQ-PH .-4ZTUFN0WFSWJFX 4FSWJDFT $MJFOU"QQ 6TFS-PH /FXT 4UJDLFST 6TFS 'FBUVSFT

    *UFN 'FBUVSFT ・・・ "// *OEFY 0GGJDJBM "DDPVOU 3FSBOLFS 3FUSJFWFS 'FBUVSF &YUSBDUJPO 'FBUVSFT &5- 1SFQSPDFTT
  5. 3BUJOH "QQ-PH .-4ZTUFN0WFSWJFX 4FSWJDFT $MJFOU"QQ 6TFS-PH /FXT 4UJDLFST 6TFS 'FBUVSFT

    *UFN 'FBUVSFT ・・・ "// *OEFY 0GGJDJBM "DDPVOU 3FSBOLFS 3FUSJFWFS 'FBUVSF &YUSBDUJPO 'FBUVSFT &5- 1SFQSPDFTT
  6. 3BUJOH "QQ-PH .-4ZTUFN0WFSWJFX 4FSWJDFT $MJFOU"QQ 6TFS-PH /FXT 4UJDLFST 6TFS 'FBUVSFT

    *UFN 'FBUVSFT ・・・ "// *OEFY 0GGJDJBM "DDPVOU 3FSBOLFS 3FUSJFWFS 'FBUVSF &YUSBDUJPO 'FBUVSFT &5- 1SFQSPDFTT
  7. 7FSEB*6,VCFSOFUFT &BSMZ5SJBMTXJUI3BZ 1SPKFDU/BNFTQBDF $PNQBOZXJEF ,VCFSOFUFT 3BZ$MVTUFS )FBE 8PSLFS 8PSLFS ⓪

    4FUVQLVCFDUM ① 1PSUGPSXBSEUPUIFIFBE OPEF ② 4VCNJUKPCT "DDFTTUP3BZ%BTICPBSE
  8. $-*4%, 3BZMFJHI4ZTUFN"SDIJUFDUVSF 3BZ$MVTUFS $3 4FSWFS Y%44FSWFS 1SPYZ 3BZMFJHI $SFBUF %FMFUF

    /FUXPSL1PMJDZ )FBE 8PSLF S 8PSLF S 3BZ $MVTUFS ,VCF3BZ 5BSHFU/BNFTQBDF
  9. $-*4%, 3BZMFJHI4ZTUFN"SDIJUFDUVSF )FBE 8PSLF S 8PSLF S 3BZ $MVTUFS 3BZ$MVTUFS

    $3 4FSWFS /FUXPSL1PMJDZ Y%44FSWFS 1SPYZ %BTICPBSE 4VCNJUKPCT 3BZMFJHI "VUI[3PVUJOH
  10. %FQMPZ3BZ$MVTUFST"OZXIFSF PO 7FSE B FY-*/& $PSQPSBUJPO FY:BIPP+BQBO $PSQPSBUJPO -:$PSQPSBUJPO PO

    *6 PO "$1 PO 'MBWB $VSSFOUMZ 4VQQPSUFE ,VCFSOFUFT4FSWJDFT PO*O)PVTF1SJWBUF$MPVE
  11. $-*4%, 3BZMFJHI4ZTUFN"SDIJUFDUVSF )FBE 8PSLF S 8PSLF S 3BZ $MVTUFS 3BZ+PC

    $3 4FSWFS 4VCNJUUF S -PHTUPSBHF "QQMJDBUJPO-PH 3BZ4ZTUFN-PH1FSTJTUFODF 4JEFDB S 4JEFDB S 4JEFDB S 4JEFDB S
  12. 7PJDFPGUIF$VTUPNFS Things that are great about using Rayleigh ・MLEs can

    easily set up a distributed training environment in no time. This is a significant advantage. ・MLEs can train models in the same environment, ensuring reproducibility from an infrastructure standpoint.
  13. #FDPNFB1BSUPGUIF#VJMEJOH#MPDLT 7FSEB *6 "$1 'MBWB ,VCF3BZ 3BZMFJHI ,VCF3BZ 3BZ .-"1*

    7FDUPS'PSHF :BNMB .- GPS-*/&/&84 .-GPS-*/&45*$,&34 ・・・ ・・・ "QQTGPS4FSWJDF .-1SPEVDUT %JTUSJCVUFE 1SPDFTTJOH &OHJOF $PNQVUJOH (1SJWBUF$MPVE) 3BZPO -BLFUBIPF (IFF
  14. *EFBTGPS3FGBDUPSJOH 3BZ$MVTUFS 4FSWFS 3&45 Y%44FSWFS H31$ QSPYZ $-* 3%# W

    3BZ$MVTUFS 3BZ$MVTUFS 4FSWFS H31$ QSPYZ $-* 3%# W 3BZ$MVTUFS $POGJHT