CodeFest 2019. Максим Бакиров (2ГИС) — Тестирование мусорными данными с libFuzzer

Фаззинг или тестирование мусорными данными Максим Бакиров C++ разработчик 2ГИС

О чём поговорим? — Что такое фаззинг — Фаззинг с
libFuzzer — Наш опыт и результаты

Что такое фаззинг Фаззинг — тестирование случайными входными данными.

S A TEST?

Это вообще работает? Баг случается с вероятностью 0,000001 = вероятность
стабильной работы 0,999999 Вызовов 1 млн. 0,999999 ^ 1000000 ~ 0,37 вероятность, что функция отработает стабильно

libFuzzer ✓ Удобное и расширяемое C-API для интеграции

libFuzzer ✓ Удобное и расширяемое C-API для интеграции ✓ Входит
в поставку с компилятором Clang >= 6

libFuzzer ✓ Удобное и расширяемое C-API для интеграции ✓ Входит
в поставку с компилятором Clang >= 6 ✓ Хорошая документация

1.bool FuzzMe(Char data[ ], Int8 size /*[0,128)*/) { 2. return
size >= 3 && 3. data[0] == 'F' && 4. data[1] == 'U' && 5. data[2] == 'Z' && 6. data[3] == 'Z'; 7.}

1.bool FuzzMe(Char data[ ], Int8 size /*[0,128)*/) { 2. return
size >= 3 && // data[ ] = “FUZ”, size = 3 3. data[0] == 'F' && // OK 4. data[1] == 'U' && // OK 5. data[2] == 'Z' && // OK 6. data[3] == 'Z'; // ← Out of bounds access 7.}

Как это устроено? тестовый корпус → вызов функции → оценка
сценариев → следующее поколение → мутации данных → ∞ → артефакты

SanitizerCoverage - программа = набор инструкций

Мутаторы - EraseBytes - InsertByte - InsertRepeatedBytes - ChangeByte -
ChangeBit - ShuffleBytes

— Парсеров — Компрессии — Криптографии — Регулярных выражений Подходит
для тестирования:

Sanitizers - AddressSanitizer - LeakSanitizer - MemorySanitizer - UndefinedBehaviourSanitizer -
ThreadSanitizer - libFuzzer itself (!)

Подытожим тестовый корпус → вызов функции → оценка сценариев →
следующее поколение → мутации данных → ∞ → артефакты

Что получилось — Нашли 10 потенциальных крашей — Внедрили в
пайплайн разработки — Оцениваем регрессию

Планы на будущее — Интегрировать с AFL — Отслеживать медленные
запросы — Совершенствовать мутаторы

Полезные ссылки Библиотеки libFuzzer — https://llvm.org/docs/LibFuzzer.html American fuzzy lop —
http://lcamtuf.coredump.cx/afl/ PyJFuzz — https://github.com/mseclab/PyJFuzz HeartBleed — http://heartbleed.com Баг, найденный PyJFuzz — https://github.com/cesanta/frozen/issues/15 Доклад про Monkey Testing — https://2017.codefest.ru/lecture/1141 Доклад про Fuzzing компилятора — https://www.youtube.com/watch?v=S2vBz_ZPAbc

@moximko Максим Бакиров C++ разработчик 2ГИС Вопросы? [email protected]

СПАСИБО! Максим Бакиров Telegram @moximko

Не подходит если: — Функция выполняется за 10 мс

Не подходит если: — Функция выполняется за 10 мс —
Входные данные сильно ограничены и структурированы

Не подходит если: — Функция выполняется за 10 мс —
Входные данные сильно ограничены и структурированы — Функция меняет своё поведение от вызова к вызову

Как внедряли собрали проект-приложение → из коробки мало → свои
мутаторы → реальные данные → оценка результатов → CI

$ echo "aaa" | radamsa aaaa $ echo "aaa" |
radamsa :aaa $ echo "Fuzztron 2000" | radamsa Fuzztron 4294967296 Radamsa

$ echo "100 * (1 + (2 / 3))" |
radamsa | bc […] (standard_in) 1418: illegal character: ^_ (standard_in) 1422: syntax error (standard_in) 1424: syntax error (standard_in) 1424: memory exhausted [hang] Radamsa

PyJFuzz {"qTR8SayNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNM": {"0BuX8TiFu": 9.04030355791, "GTD4sJG": null}, "BfD2D7a0": {}, "UuWvWx":
{"le3es2": "xx"t5Uh78", "4PR3qRB": 74.9013428365, "xsu9NjDkx": 57.7924494423}}

CodeFest 2019. Максим Бакиров (2ГИС) — Тестиров...

CodeFest 2019. Максим Бакиров (2ГИС) — Тестирование мусорными данными с libFuzzer

More Decks by CodeFest

Other Decks in Technology

Featured

Transcript