Speed Meets Scale: Interactively Analyzing & Visualizing Billions of Rows of Spatiotemporal Data

Speed Meets Scale: Interactively Analyzing & Visualizing Billions of Rows
of Spatiotemporal Data Minneanalytics | Minneapolis | December 9, 2019

@_arw_ [email protected] /in/aaronwilliams/ /williamsaaron slides: https://speakerdeck.com/omnisci Aaron Williams VP, Global
Community

OmniSci’s mission is to make analytics instant, powerful, and effortless
for everyone.

The Spring of Revolutions

The Origin: TweetMap 400M Tweets public demo: https://omnisci.com/demos/tweetmap

Technological Advantages Exploit modern compilation techniques in analytic workflows Efficiently
use the modern memory hierarchy Rethink analytic operations for modern hardware 7

Times in Seconds

OmniSci on CPU 1.2B Drug Prescription Claims public data: https://community.omnisci.com/browse/dataset-library

OmniSci Scale 11.6B Ship Positions public demo: https://omnisci.com/demos/ships/

Points and Polygons 1B Taxi Rides + 1M Buildings public
demo: https://omnisci.com/demos/taxis/

14 Efficient use of the modern memory hierarchy Minimize unnecessary
data movement and exploit spatial/temporal locality SSD or NVRAM STORAGE (L3) 250GB to 20TB 1-4 GB/sec CPU RAM (L2) 32GB to 3TB 140-560 GB/sec GPU RAM (L1) 32GB to 256GB 1-7 TB/sec Hot Data Speedup = 250x to 1750x Over Cold Data Warm Data Speedup = 35x to 140x Over Cold Data Cold Data COMPUTE LAYER STORAGE LAYER Data Lake/Data Warehouse/System Of Record

15 10111010101001010110101101010101 00110101101101010101010101011101 Exploit modern compiler infrastructure for analytics LLVM-based
JIT compilation of both SQL queries and User-Defined kernels Traditional Analytics Engines use a ‘Chain of Iterators’ model (VOLCANO) • Each operator in SQL treated as a separate function • Incurs significant overhead and prevents vectorization OmniSci compiles both queries and UDF kernels using LLVM • LLVM enables generic targeting of different architectures (GPUs, X86, ARM, etc). • Code can be generated to run query on CPU and GPU simultaneously • Queries and UDFs can run at speeds approaching hand-written functions • Also allows support of modern analytic frontends - Python, Julia, Swift for greater productivity

© OmniSci 2018 • omnisci.com/demos Play with our live demos
for yourself! • omnisci.cloud Get an OmniSci instance in 60 seconds • omnisci.com/platform/downloads/ Download a 30-day trial of OmniSci • community.omnisci.com Ask questions and share your experiences Self Discovery

USED BY 100+ GLOBAL ORGS $92 MILLION IN FUNDING OPEN-SOURCE
COMMUNITY About OmniSci TOP-TIER VENTURE BACKING

© OmniSci 2018 @_arw_ [email protected] /in/aaronwilliams/ /williamsaaron slides: https://speakerdeck.com/omnisci Aaron
Williams VP, Global Community Thank you!

Speed Meets Scale: Interactively Analyzing & Vi...

Speed Meets Scale: Interactively Analyzing & Visualizing Billions of Rows of Spatiotemporal Data

OmniSci

More Decks by OmniSci

Other Decks in Technology

Featured

Transcript