Scala Italy 2018 - Random Data Generation with ScalaCheck

RANDOM DATA GENERATION WITH SCALACHECK @DANIELASFREGOLA SCALA ITALY 2018

HOW TO STEAL OTHER'S PEOPLE CODE AND LOOK COOL

HOW TO DO OPEN SOURCE AND LOOK COOL

TESTS TESTS TESTS

BUT I WROTE UNIT TESTS FOR IT

100% UNIT TEST COVERAGE

ALL DONE, IT WORKS!

2 UNIT TESTS - 0 INTEGRATION TESTS

COMMON APPROACHES STATIC FIXTURES

COMMON APPROACHES SCALACHECK

SCALACHECK - PROPERTY BASED TESTING property("startsWith") = forAll { (a:
String, b: String) => (a+b).startsWith(a) } // + String.startsWith: OK, passed 100 tests. property("concatenate") = forAll { (a: String, b: String) => (a+b).length > a.length && (a+b).length > b.length } // ! String.concat: Falsified after 0 passed tests. // > ARG_0: "" // > ARG_1: ""

PROPERTY BASED TESTING - PROS > Test data is less
biased > On failing, counter-example provided > Higher confidence that our code probably works

PROPERTY BASED TESTING - CONS > Restructuring your tests as
properties is not always immediate > Not always applicable with side effects > Configurations do affect the test result

COMMON APPROACHES

CAN WE COMPROMISE?

CAN WE REUSE SOME OF THE SCALACHECK MAGIC?

RANDOM DATA GENERATOR GITHUB.COM/DANIELASFREGOLA/RANDOM-DATA-GENERATOR

RANDOM DATA GENERATOR case class Example(text: String, n: Int) val
example: Example = random[Example] // Example(ਈ⼝ꏣᰣ∯෢ꪔ䃂ᅟ䑪⡨⿽ᵅ䎎ߐ, 73967257)

RANDOM DATA GENERATOR case class User(name: String, surname: String) "create
a user" { val user = random[User] Post("/users", user) ~> check { status === StatusCodes.Created assertCreation(user) } }

FIX YOUR SEED Each session has a seed number associated
Generating random data with seed -2481216758852790303 Use it to debug problematic tests export RANDOM_DATA_GENERATOR_SEED=-2481216758852790303 unset RANDOM_DATA_GENERATOR_SEED

LESS BIASED TEST DATA For every session different test data
will be randomly* selected * We can still fix the seed when needed!

BUGS BUGS EVERYWHERE

EASIER TO MAINTAIN case class User(name: String, surname: String, age:
Int) "create a user" { val user = random[User] Post("/users", user) ~> check { status === Created assertCreated(user) } }

IMPROVED READABILITY case class User(name: String, surname: String, age: Int)
"reject user creation of an underage user" { val user = random[User].copy(age = 17) Post("/users", user) ~> check { status === BadRequest assertNotCreated(user) } }

HOW DOES IT WORK?

SCALACHECK1 1 github.com/rickynils/scalacheck

SCALACHECK-SHAPELESS2 AUTOMATICALLY INFERS ARBITRARY[T] IF: > T is a case
class > T is an sealed trait 2 github.com/alexarchambault/scalacheck-shapeless

LET'S LOOK AT THE CODE!

import org.scalacheck._ trait RandomDataGenerator extends ShapelessLike { private val seed
= RandomDataGenerator.seed def random[T](implicit arb: Arbitrary[T]): T = { val gen: Gen[T] = arb.arbitrary val optT: Option[T] = gen.apply(Gen.Parameters.default, seed) optT.get // !!! } }

WHY AN OPTION? Arbitrary { Gen.chooseNum(1, 100).suchThat(_ > 200) }

ARBITRARY OF CUSTOM TYPE import java.util.Currency import scala.collection.JavaConversions._ implicit val
arbitraryCurrency: Arbitrary[Currency] = Arbitrary { Gen.oneOf(Currency.getAvailableCurrencies.toSeq) } random[Currency] // java.util.Currency = OMR

MAKE SURE THAT THE GENERATED TEST DATA MAKES SENSE

CUSTOMISE YOUR ARBITRARY Before: random[String] // ᭞❱᭟ⳘԺ〈ᦙ᠓ꍊꎼꙐႀ⤌惲 After: /** Generates
a string of alpha characters */ implicit val arbitraryString: Arbitrary[String] = Arbitrary(Gen.alphaStr) random[String] // hqtbonxacrmvmuMpofwtasrojjnycwuoTfkrhOpli

CUSTOMISE YOUR ARBITRARY case class Person(name: String, age: Int) implicit
val arbitraryPerson: Arbitrary[Person] = Arbitrary { for { name <- Gen.oneOf("Daniela", "John", "Martin") age <- Gen.choose(0, 100) } yield Person(name, age) } random[Person] // Person(John,16)

WHAT RANDOM DATA GENERATOR IS NOT FOR

TYPE CLASS DERIVATION WITH SHAPELESS IMPACTS ON COMPILATION TIME

MILES SABIN, TYPELEVEL SCALA REBOOTED, SCALAEXCHANGE 2016

CAN WE DO BETTER?

TYPE CLASS DERIVATION WITH MAGNOLIA3 BY @PROPENSIVE 3 github.com/propensive/magnolia

SCALACHECK-MAGNOLIA4 BY @ETATY 4 github.com/etaty/scalacheck-magnolia

248% SPEED UP WITH MAGNOLIA !!!!!

RANDOM DATA GENERATOR MAGNOLIA GITHUB.COM/DANIELASFREGOLA/RANDOM-DATA-GENERATOR-MAGNOLIA

SHAPELESS VS MAGNOLIA

WRAP UP (1) > A compromise between using ScalaCheck and
predefined fixtures > Customise the data generation to your context > Do not ignore random test failures > Use it only for test purposes

WRAP UP (2) > Magnolia is for faster type class
derivation > Shapeless has more features > Open Source is awesome!

Testing shows the presence, not the absence of bugs —
Edsger W. Dijkstra, 1969

THANK YOU! > Random Data Generator: github.com/DanielaSfregola/random-data-generator > Random Data
Generator Magnolia: github.com/DanielaSfregola/random-data-generator-magnolia > Twitter: @DanielaSfregola > Blog: danielasfregola.com

Scala Italy 2018 - Random Data Generation with ...

Scala Italy 2018 - Random Data Generation with ScalaCheck

More Decks by Daniela Sfregola

Other Decks in Programming

Featured

Transcript