Random Data Generation with ScalaCheck - Scalar 2017

RANDOM DATA GENERATION WITH SCALACHECK @DANIELASFREGOLA SCALAR 2017

TESTS TESTS TESTS

COMMON APPROACHES STATIC FIXTURES

HM, WORKED IN TESTS WHEN I POURED WATER DIRECTLY INTO
DRAIN BY EMILBRONIKOWSKI

COMMON APPROACHES SCALACHECK 1 1 github.com/rickynils/scalacheck

SCALACHECK - PROPERTY BASED TESTING property("startsWith") = forAll { (a:
String, b: String) => (a+b).startsWith(a) } // + String.startsWith: OK, passed 100 tests. property("concatenate") = forAll { (a: String, b: String) => (a+b).length > a.length && (a+b).length > b.length } // ! String.concat: Falsified after 0 passed tests. // > ARG_0: "" // > ARG_1: ""

PROPERTY BASED TESTING - PROS > Test data is less
biased > On failing, counter-example provided > Higher confidence that our code probably works

PROPERTY BASED TESTING - CONS > Not always immediate >
Configurations do affect the test result > Not always applicable with side effects

COMMON APPROACHES

CAN WE COMPROMISE?

LET'S DO IT! def random[T]: T = ???

CAN WE REUSE SOME SCALACHECK MAGIC?

Gen[T] package org.scalacheck sealed abstract class Gen[T] { def sample:
Option[T] = apply(Gen.Parameters.default, Seed.random()) }

RANDOM DATA GENERATOR - WIP import org.scalacheck.Gen def random[T]: T
= { val gen: Gen[T] = ??? val optT: Option[T] = gen.sample optT.get }

Arbitrary[T] package org.scalacheck sealed abstract class Arbitrary[T] { val arbitrary:
Gen[T] }

RANDOM DATA GENERATOR - WIP import org.scalacheck.{Arbitrary, Gen} def random[T](implicit
arb: Arbitrary[T]): T = { val gen: Gen[T] = arb.arbitrary val optT: Option[T] = gen.sample optT.get }

SCALACHECK-SHAPELESS 2 AUTOMATICALLY INFERS ARBITRARY[T] IF: > T is a
case class > T is an sealed trait 2 github.com/alexarchambault/scalacheck-shapeless

RANDOM DATA GENERATOR - DONE? import org.scalacheck.{Arbitrary, Gen} import org.scalacheck.Shapeless._
def random[T](implicit arb: Arbitrary[T]): T = { val gen: Gen[T] = arb.arbitrary val optT: Option[T] = gen.sample optT.get }

RANDOM DATA GENERATOR scala> random[String] res0: String = ح㻞ꔛᵏ⌧㈽フᲆ哃᩠ ꕸẃḷ╏䉁
scala> random[Int] res1: Int = 2147483647 scala> random[Int] res2: Int = -407671469 scala> case class Bro(a: String, b: Double) defined class Bro scala> random[Bro] res3: Bro = Bro(ꌏ ࠞ ໐㞸㣣ߖ啾࿏奤ಧ 㞧㽡Ṥᘭ!㭾梖䅱ϩ⅖๳☥梠,-2.4322029262034435E58

RANDOM DATA GENERATOR case class User(name: String, surname: String) "create
a user" { val user = random[User] Post("/users", user) ~> check { status === StatusCodes.Created assertCreation(user) } }

CAN WE MAKE TESTS DETERMINISTIC ON DEMAND?

FIX YOUR SEED Each session has a seed number associated
Generating random data with seed -2481216758852790303 Use it to debug problematic tests export RANDOM_DATA_GENERATOR_SEED=-2481216758852790303 unset RANDOM_DATA_GENERATOR_SEED

Gen[T] package org.scalacheck sealed abstract class Gen[T] { def sample:
Option[T] = apply(Gen.Parameters.default, Seed.random()) }

RANDOM DATA GENERATOR - DONE! import org.scalacheck.Shapeless._ val seedNum: Long
= ??? def random[T](implicit arb: Arbitrary[T]): T = { val gen: Gen[T] = arb.arbitrary val optT: Option[T] = gen.apply(Gen.Parameters.default, Seed(seedNum)) optT.get }

RANDOM DATA GENERATOR GITHUB.COM/DANIELASFREGOLA/RANDOM-DATA-GENERATOR

RANDOM DATA GENERATOR PROS

EASIER TO MAINTAIN case class User(name: String, surname: String, age:
Int) "create a user" { val user = random[User] Post("/users", user) ~> check { status === Created assertCreated(user) } }

IMPROVED READABILITY case class User(name: String, surname: String, age: Int)
"reject user creation of an underage user" { val user = random[User].copy(age = 17) Post("/users", user) ~> check { status === BadRequest assertNotCreated(user) } }

LESS BIASED TEST DATA For every session different test data
will be randomly* selected * We can still fix the seed when needed!

BUGS BUGS EVERYWHERE

RANDOM DATA GENERATOR LESSONS LEARNED

SCALACHECK-SHAPELESS IS NOT ALWAYS ENOUGH

ARBITRARY OF CUSTOM TYPE import java.util.Currency import scala.collection.JavaConversions._ implicit val
arbitraryCurrency: Arbitrary[Currency] = Arbitrary { Gen.oneOf(Currency.getAvailableCurrencies.toSeq) } random[Currency] > java.util.Currency = OMR

MAKE SURE THAT THE GENERATED TEST DATA MAKES SENSE

CUSTOMISE YOUR ARBITRARY random[String] > ᭞❱᭟ⳘԺ〈ᦙ᠓ꍊꎼꙐႀ⤌惲 /** Generates a string
of alpha characters */ implicit val arb: Arbitrary[String] = Arbitrary(Gen.alphaStr) random[String] > hqtbonxacrmvmuMpofwtasrojjnycwuoTfkrhOpli

CUSTOMISE YOUR ARBITRARY case class Person(name: String, age: Int) implicit
val arbitraryPerson: Arbitrary[Person] = Arbitrary { for { name <- Gen.oneOf("Daniela", "John", "Martin") age <- Gen.choose(0, 100) } yield Person(name, age) } random[Person] > Person(John,16)

SHAPELESS impacts on COMPILATION TIME

MILES SABIN, TYPELEVEL SCALA REBOOTED, SCALAEXCHANGE 2016

INDUCTIVE HEURISTICS TO THE RESCUE! Faster compilation of inductive implicits
> Typelevel Scala [ #129 - Merged ] > Lightbend Scala [ #5649 - Open ]

CACHING Arbitrary[T] HELPS

shapeless.cachedImplicit import shapeless._ object CachedArbitraryImplicits { implicit val arbA: Arbitrary[A]
= cachedImplicit implicit val arbB: Arbitrary[B] = cachedImplicit }

RANDOM DATA GENERATOR IS FOR TESTING

WRAP UP > A compromise between test strategies > Customise
your data generation > Meant for testing > Do not ignore random test failures

Testing shows the presence, not the absence of bugs —
Edsger W. Dijkstra, 1969

THANK YOU! > Random Data Generator: github.com/DanielaSfregola/random-data-generator > Twitter: @DanielaSfregola
> Blog: danielasfregola.com

Random Data Generation with ScalaCheck - Scalar...

Random Data Generation with ScalaCheck - Scalar 2017

More Decks by Daniela Sfregola

Other Decks in Programming

Featured

Transcript