Optimizing Ruby with TruffleRuby

Ruby User Group Linz

Benoit Daloze

March 15, 2017

       |   Op?mizing  Ruby  with   TruffleRuby   The  Ruby  Logo  is  Copyright  (c)  2006,  Yukihiro  Matsumoto.  It  is  licensed  under  the  terms  of  the  Crea?ve  Commons  APribu?on-­‐ShareAlike  2.5  agreement.   Slides  from  Chris  Seaton   Oracle  Labs  @ChrisGSeaton     Benoit  Daloze   @eregontp     15  March  2017   Linz  Ruby  User  Group  
       |   Who  am  I  ?   •  Benoit  Daloze   •  PhD  student  at  Johannes  Kepler  University   •  Research  with  TruffleRuby  on  concurrency   •  MRI  and  JRuby  commiPer   •  Maintainer  of  the  Ruby  Spec  Suite  (ruby/spec)   3   TwiPer:  @eregontp   GitHub:  @eregon  
       |   Agenda   •  Introduc?on   •  Truffle  and  Ruby  implementa?ons   •  Why  is  Ruby  apparently  so  hard  to  run  fast?   •  Par?al  Evalua?on   •  Performance  &  Compa?bility   4  
       |   Goal: Computer  Language  Benchmarks  Game  
       |   x  +  y  *  z   +   x   *   y   z  
       |   x  +  y  *  z   +   x   *   y   z   load_local  x   load_local  y   load_local  z   call  :*   call  :+  
       |   x  +  y  *  z   +   x   *   y   z   load_local  x   load_local  y   load_local  z   call  :*   call  :+  
       |   x  +  y  *  z   +   x   *   y   z   load_local  x   load_local  y   load_local  z   call  :*   call  :+   pushq  %rbp   movq    %rsp,  %rbp   movq    %rdi,  -­‐8(%rbp)   movq    %rsi,  -­‐16(%rbp)   movq    %rdx,  -­‐24(%rbp)   movq    -­‐16(%rbp),  %rax   movl    %eax,  %edx   movq    -­‐24(%rbp),  %rax   imull  %edx,  %eax   movq    -­‐8(%rbp),  %rdx   addl    %edx,  %eax   popq    %rbp   ret  
       |   The  JRuby  logo  is  copyright  (c)  Tony  Price  2011,  licensed  under  the  terms  of  Crea?ve  Commons  APribu?on-­‐NoDerivs  3.0  Unported  (CC  BY-­‐ND  3.0)   JRuby   JITs  by  emihng  JVM  bytecode   VM  in  Java   Core  library  mostly  in  Java  
       |   The  Rubinius  logo  is  copyright  2011  Shane  Becker,  licensed  under  the  terms  of  Crea?ve  Commons  APribu?on-­‐NoDeriva?ves  4.0  Interna?onal  —  CC  BY-­‐ND  4.0   Rubinius   JITs  by  emihng  LLVM  bitcode   VM  in  C++   Core  library  mostly  in  Ruby  
       |   The  Rubinius  logo  is  copyright  2011  Shane  Becker,  licensed  under  the  terms  of  Crea?ve  Commons  APribu?on-­‐NoDeriva?ves  4.0  Interna?onal  —  CC  BY-­‐ND  4.0   Rubinius   JITs  by  emihng  LLVM  bitcode   VM  in  C++   Core  library  mostly  in  Ruby  
       |   U U U U U I I I G G I I I G G Node Rewriting for Profiling Feedback AST Interpreter Rewritten Nodes AST Interpreter Uninitialized Nodes Compilation using Partial Evaluation Compiled Code Node Transitions S U I D G Uninitialized Integer Generic Double String T.  Würthinger,  C.  Wimmer,  A.  Wöß,  L.  Stadler,  G.  Duboscq,  C.  Humer,  G.  Richards,  D.  Simon,   and  M.  Wolczko.  One  VM  to  rule  them  all.  In  Proceedings  of  Onward!,  2013.   Compiling  the  AST  to  machine  code  
       |   T.  Würthinger,  C.  Wimmer,  A.  Wöß,  L.  Stadler,  G.  Duboscq,  C.  Humer,  G.  Richards,  D.  Simon,   and  M.  Wolczko.  One  VM  to  rule  them  all.  In  Proceedings  of  Onward!,  2013.   I I I G G I I I G G Deoptimization to AST Interpreter D I D G G D I D G G Node Rewriting to Update Profiling Feedback Recompilation using Partial Evaluation Deop?miza?on  and  recompila?on  
       |   Why  is  Ruby  apparently  so  hard   to  run  fast?  
       |   require  'benchmark/ips'       Benchmark.ips  do  |x|      x.report(  "direct",            "14  +  2"                    )      x.report(  "send-­‐symbol",  "14.send(:+,  2)"    )      x.report(  "send-­‐string",  "14.send('+',  2)"  )      x.report(  "eval",                "eval('14  +  2')"    )      x.compare!   end      
       |                              direct:  37299872.6  i/s                    send-­‐symbol:  13060179.1  i/s  -­‐  2.86x  slower                    send-­‐string:    4974575.3  i/s  -­‐  7.50x  slower                                  eval:      171835.9  i/s  -­‐  217.07x  slower  
       |   Throwing  away  metaprogramming   •  Crystal  –  throws  away  metaprogramming  en?rely  to  make  a  faster  Ruby   •  Rubinius  –  doesn’t  support  set_trace_func   •  JRuby  –  doesn’t  support  set_trace_func  or  ObjectSpace   •  RubyMo?on  –  doesn’t  support  eval,  Binding  
       |   How  does  Truffle  +  Graal  solve  this?  
       |   42   def min(a, b) [a, b].sort[0] end puts min(2, 8)
       |   43   def min(a, b) [a, b].sort[0] end puts [2, 8].sort[0]
       |   44   t0 = 2 <=> 8 t1 = t0 < 0 ? 2 : 8 t2 = t0 > 0 ? 8 : 2 t3 = [t1, t2] puts t3[0]
       |   45   t0 = 2 <=> 8 t1 = t0 < 0 ? 2 : 8 t2 = t0 > 0 ? 8 : 2 t3 = [t1, t2] puts t1
       |   require  'benchmark/ips'       Benchmark.ips  do  |x|      x.report(  "direct",            "14  +  2"                    )      x.report(  "send-­‐symbol",  "14.send(:+,  2)"    )      x.report(  "send-­‐string",  "14.send('+',  2)"  )      x.report(  "eval",                "eval('14  +  2')"    )      x.compare!   end      
       |                              direct:  37299872.6  i/s                    send-­‐symbol:  13060179.1  i/s  -­‐  2.86x  slower                    send-­‐string:    4974575.3  i/s  -­‐  7.50x  slower                                  eval:      171835.9  i/s  -­‐  217.07x  slower  
       |                              direct:  73099792.5  i/s                      send-­‐symbol:  73458837.7  i/s  –  difference  within  err                    send-­‐string:  66882023.8  i/s  -­‐  difference  within  err                                  eval:  67024838.3  i/s  -­‐  difference  within  err  
       |   • • • • MRI 2.3 JRuby 9.0.4 Node.js JRuby+Truffle Java 1.8.0u66 1 5 10 25 50 75 12  Benchmarks  using  Objects,  Closures  and  Arrays        from  hPps://github.com/smarr/are-­‐we-­‐fast-­‐yet                TruffleRuby  
       |   71   Optcarrot:  NES  emulator  benchmark  
       |   Optcarrot:  NES  emulator  benchmark  –  9x  faster  than  MRI   72  
       |   Language  specs   96%   Core  library  specs   100%   92%   C-­‐extension  API  specs   Ruby  specs   75  
       |   But  does  it  run   “Rails”,  “Ruby  on  Rails”,  and  the  Rails  logo  are  registered  trademarks  of  David  Heinemeier  Hansson   ?  
       |   Rails  tests   Ac?ve  Model   Ac?ve  Support   Ac?ve  Record   Ac?on  View   Ac?on  Pack   Ac?on  Mailer   Rail?es   Sprockets-­‐Rails   Ac?ve  Job   Spring   100%   100%   98%   Basic  func0onality  works   37%   78  
       |   So  then  why  can’t  we  run  real  applica?ons  yet?   •  C  extensions  are  s?ll  a  work  in  progress   – Almost  no  database  drivers   – No  openssl   – No  nokogiri   – Prevents  us  running  almost  everything  unfortunately   •  The  specs  don’t  have  perfect  coverage   79  
       |   Ongoing  Research   •  Running  C  extension  with  Sulong  (Truffle+LLVM)   •  ObjectSpace:  stop  the  world  and  walk  the  frames   •  Represen?ng  String  as  Ropes   •  Efficient  parallelism:   •  Thread-­‐Safe  Objects  for  Dynamic  Languages   •  Thread-­‐Safe  and  Scalable  Ruby  collec?ons  
       |   Conclusions   Simple  VM  ideas  can  solve  the  major  problems  of   making  Ruby  fast  
       |   Conclusions   Simple  VM  ideas  can  solve  the  major  problems  of   making  Ruby  fast     We  don’t  need  to  tell  Ruby  programmers  to  avoid   language  features  to  get  performance  
       |       hPps://github.com/graalvm/truffleruby     (or  just  search  for  “truffleruby”)  
       |   85   Search  for  ’graal  otn’   www.oracle.com/technetwork/oracle-­‐labs/program-­‐languages  
