Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Si sta come sulle nuvole in un tubo i dati @ DevFest Urbino

Si sta come sulle nuvole in un tubo i dati @ DevFest Urbino

Cloud Dataflow è un servizio disponibile sulla Google Cloud Platform che permette di trasformare e arricchire dati sia in modalità stream (real time) che in modalità batch. Il suo approccio serverless per la gestione e il provisioning delle risorse permette di avere a disposizione una potenza elaborativa virtualmente illimitata, pagando soltanto per quello che si utilizza. Ma quali sono le criticità da un punto di vista di uno sviluppatore? Vedremo insieme gioie e dolori di questo strumento potentissimo tramite esempi pratici di elaborazione dati in modalità stream.

Gregorio Palamà

November 23, 2019
Tweet

More Decks by Gregorio Palamà

Other Decks in Technology

Transcript

  1. Si sta come sulle nuvole in un tubo i dati

    Gregorio Palamà @ DevFest Urbino
  2. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion
  3. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion …and work
  4. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion …and work Project manager @
  5. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion Project manager Community Manager @
  6. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion Project manager Community Manager @
  7. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Developer for passion Project manager Community Manager @gregoriopalama
  8. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino ETL Batch processing
  9. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino ETL Batch processing Stream processing
  10. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino ETL Batch processing Stream processing Analytics
  11. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino ETL Batch processing Stream processing Analytics Composition
  12. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Google Cloud Dataflow
  13. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Stream and batch processing
  14. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Stream and batch processing Fully managed service
  15. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Stream and batch processing Fully managed service Serverless
  16. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Stream and batch processing Fully managed service Serverless “Pay what you use”
  17. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Unified Programming Model
  18. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Unified Programming Model: Stream and Batch
  19. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Unified Programming Model: Stream and Batch Open Sourced
  20. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Unified Programming Model: Stream and Batch Open Sourced Java and Python
  21. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A set of data processing elements
  22. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A set of data processing elements connected in series
  23. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A set of data processing elements connected in series, where the output of one element is the input of the next one
  24. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino I/O Transforms
  25. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino I/O Transforms Windows
  26. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino I/O Transforms Windows Triggers
  27. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino I/O Transforms Windows Triggers PCollections
  28. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino I/O Transforms Windows Triggers PCollections Coders
  29. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Provide the processing logic
  30. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Provide the processing logic “User code”
  31. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Provide the processing logic “User code” Grouping, Flattening, Combining, Partitioning
  32. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Provide the processing logic “User code” Grouping, Flattening, Combining, Partitioning ParDo
  33. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Fixed time
  34. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Fixed time Sliding time
  35. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Fixed time Sliding time Per-session
  36. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Fixed time Sliding time Per-session Calendar-based
  37. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Event time
  38. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Event time Processing time
  39. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Event time Processing time Data-driven
  40. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Event time Processing time Data-driven Composite
  41. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A potentially distributed, multi-element data set
  42. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A potentially distributed, multi-element data set A “pipeline” of data
  43. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A potentially distributed, multi-element data set A “pipeline” of data Immutable
  44. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino A potentially distributed, multi-element data set A “pipeline” of data Immutable Bounded/Unbounded
  45. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Encoding/decoding
  46. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Encoding/decoding Default coders
  47. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Encoding/decoding Default coders AvroCoder
  48. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Encoding/decoding Default coders AvroCoder
  49. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Google Cloud Dataflow Data processing Serverless - fully managed
  50. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Google Cloud Dataflow Runs on Compute Engine Test out your pipeline for costs!
  51. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Apache Beam Unified Programming Model for multiple uses
  52. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Transforms Transforms are idempotent
  53. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Transforms Transforms are idempotent Data is the core
  54. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Transforms Transforms are idempotent Data is the core Reusage
  55. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Pipelines Assign display names
  56. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino Pipelines Assign display names Dead letter pattern
  57. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino https://cloud.google.com/dataflow/docs/ https://cloud.google.com/dataflow/pricing https://beam.apache.org/documentation/
  58. gregoriopalama - si sta come sulle nuvole in un tubo

    i dati #devFestUrbino http://bit.ly/2Owp152