Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Николай Молчанов и Дмитрий Елисеев «Битва SQL vs DocumentDB»

DotNetRu
September 19, 2019

Николай Молчанов и Дмитрий Елисеев «Битва SQL vs DocumentDB»

Для чего вам не стоит использовать DocumentDB? Для чего вам не стоит использовать Relation SQL DB?

Разберём в докладе сравнение подходов в хранении и эффективном доступе до информации при разных вариантах хранения на примере MongoDB и SQL Server. Сравним данные по цифрам и по использованию стандартных инструментов из.NET. Разберём слабые и сильные стороны, разберём моделирование хранения и то, что вы делаете неверно при проектировании.

DotNetRu

September 19, 2019
Tweet

More Decks by DotNetRu

Other Decks in Programming

Transcript

  1. 1

  2. 4

  3. 5 план 1. Чем отличается DocumentDB от RelationDB. 2. Что

    такое MongoDB и что такое SQL Server\PostgreSQL 3. Рассмотрим философию проектирования хранения в 2 подхода 4. Сравним производительности в разных БД 5. Сравнение инструментов 6. Выводы
  4. 12 В чем сила? 1. DocumentDB хранит набор документов, а

    RelationDB набор строк в таблицах 2. DocumentDB и noSQL не предполагает связи между разными документами
  5. 13 В чем сила? 1. DocumentDB хранит набор документов, а

    RelationDB набор строк в таблицах 2. DocumentDB и noSQL не предполагает связи между разными документами
  6. 15 Структура n баз данных n любых документов n коллекций

    D: n баз данных n фикс строк n таблиц R:
  7. 22

  8. 27 MongoDB RelationDB Формат данных Бинарный без схемы < 16mb

    Фиксированные строки + бинарный без схемы без ограничений Отношения Масштабирование
  9. 28 MongoDB RelationDB Формат данных Отношения Отсутствуют между разными документами

    Есть связи в виде foreign key Масштабирование Бинарный без схемы < 16mb Фиксированные строки + бинарный без схемы без ограничений
  10. 29 MongoDB RelationDB Формат данных Простое горизонтальное масштабирование Есть, но

    с причудами Бинарный без схемы < 16mb Фиксированные строки + бинарный без схемы без ограничений Отношения Отсутствуют между разными документами Есть связи в виде foreign key Масштабирование
  11. 30 MongoDB RelationDB Формат данных Простое горизонтальное масштабирование Есть, но

    с причудами Бинарный без схемы < 16mb Фиксированные строки + бинарный без схемы без ограничений Отношения Отсутствуют между разными документами Есть связи в виде foreign key Масштабирование
  12. 37 Путь развития было NO transaction, NO sharding, SIMPLE replica

    nodes, FIRST memory storage MMAP Cross-Platforms стало YES transaction, YES sharding, YES replica sets NEW protocol ROW storage WiredTiger, ZIP data, ADD linearizable, ADD schema validation https://jepsen.io/analyses/mongodb-3-6-4
  13. 38

  14. 39

  15. 44 Путь развития было в 1989 YES transaction, YES indexes,

    NO sharding, NO cluster BISM DQS SSIS .NET Java Python
  16. 45 Путь развития было в 1989 YES transaction, YES indexes,

    NO sharding, NO cluster BISM DQS SSIS .NET Java Python стало в 2019 NO sharding, AlwaysOn, JSON, ZIP data, ADD JSON schema validation, Always Encrypted, GraphDB, AutoTuning, Cross-Platforms
  17. 48 Путь развития было в 1970… YES transaction, YES indexes,

    NO sharding, NO cluster, nix Cluster Custom types and indexes Array in table BSD\MIT Licenses Script plugins SP in C\C++
  18. 49 Путь развития было в 1970… YES transaction, YES indexes,

    NO sharding, NO cluster, nix Cluster Custom types and indexes Array in table BSD\MIT Licenses Script plugins SP in C\C++ стало в 2019 YES sharding, Clusters, JSONb, ZIP data, Inheritance, Encrypted, Cross-Platforms
  19. 52 MongoDB RelationDB Constraints Есть Есть Транзакции Есть, распределенные по

    нодам Есть, есть уровни изоляции Отказоустойчивость Есть Есть
  20. 53 MongoDB RelationDB Constraints Есть Есть Транзакции Отказоустойчивость Есть Есть

    Есть, распределенные по нодам Есть, есть уровни изоляции
  21. 58 Model => ORM => DB ФТ => queries =

    1 JOIN ФТ => 2 queries = 3 JOIN …
  22. 62 Вариант 1 Встроенные документы Плюсы: - сохранение за 1

    операцию - поиск возвращает корневой документ Плюсы для SQL\PG: - большой объем хранения json\jsonb
  23. 63 Вариант 1 Встроенные документы Минусы в Mongodb: - ограничение

    хранения в 16мб - глубина вложенности важна для индекса - сложно писать обновления Минусы в SQL\PG: - низкая скорость поиска
  24. 65 Плюсы: - простое добавление зависимости - поиск возвращает _id

    всех зависимостей - просто сделать связь многие-ко-многим Вариант 2 Встроенные ссылки
  25. 66 Минусы для Mongodb: - оптимально для небольшого кол-ва зависимостей

    - необходимо следить за связями (обновление) Минусы для SQL\PG - это нереляционный подход - не рекомендуется использовать Вариант 2 Встроенные ссылки
  26. 68 Плюсы: - простое добавление зависимости - это проще для

    понимания Вариант 3 классическая связь
  27. 69 Минусы: - усложнение кол-ва связей - удаление связанных документов

    усложнено - увеличение IOPs Вариант 3 классическая связь
  28. 71 Сценарий: 2 типа документа: статья и пользователь - комментарии

    встроены в статью - ссылка на пользователя есть в статье и комментарии - 1к пользователей - всего 100к статей - всего примерно 500к комментариев
  29. 72 Сценарий: 2 типа документа: статья и пользователь - комментарии

    встроены в статью - ссылка на пользователя есть в статье и комментарии - 1к пользователей - всего 100к статей - всего примерно 500к комментариев Задача: найти все комментарии пользователя по его имени с данными статьи
  30. 76 Запросы Mongodb 1. получить по имени id пользователя 2

    операции 2. отфильтровать статьи по комментариям и убрать лишние комментарии 1 + N операций сценарий 1 Встроенные ссылки
  31. 77 Запросы Postgresql, 2 сценария отфильтровать статьи по комментариям и

    убрать лишние комментарии + join на пользователей 1 index seek + 1 index seek + N операций 1. получить по имени id пользователя 2 операции 2. отфильтровать статьи по комментариям и убрать лишние комментарии 1 + N операций сценарий 1 Встроенные ссылки
  32. 79

  33. 80 Сценарий: 3 типа документа: статья и пользователь и комментарий

    - комментарии расположены отдельно от статьи - ссылка на пользователя есть в статье и комментарии - 1к пользователей - всего 10к статей - всего примерно 50к комментариев
  34. 81 Сценарий: 3 типа документа: статья и пользователь и комментарий

    - комментарии расположены отдельно от статьи - ссылка на пользователя есть в статье и комментарии - 1к пользователей - всего 10к статей - всего примерно 50к комментариев Задача: найти все комментарии пользователя по его имени с данными статьи
  35. 86 Запросы Mongodb 1. получить по имени id пользователя 2

    операции 2. получить по id пользователя все комментарии 2 + N операций 3. получить по каждому комментарию статью N операций сценарий 2 отдельные документы
  36. 87 Запросы SQL select a.name, a.url, c.text, c.created from comments

    as c join users u on c.userid = u.id join articles a on c.articleid = a.id where u.name ='Лука Костин 976’; 1 index user seek + 1 index comments seek + 1 index article seek + 1 HASH JOIN + N операций сценарий 2 отдельные документы
  37. 89

  38. 96

  39. 98 Как хранить в БД - денормализованные таблицы с n

    колонками - таблица на каждый тип записи
  40. 99 Как хранить в БД - денормализованные таблицы с n

    колонками - таблица на каждый тип записи - таблица с общими данными и добавкой в json
  41. 100 Как хранить в БД - денормализованные таблицы с n

    колонками - таблица на каждый тип записи - таблица с общими данными и добавкой в json - key-value pairs
  42. 102 Сценарий: 1 тип документа: пакет - данные пакета встроены

    в пакет - для sql данные лежат в денормализованной таблице - 100к пакетов - всего примерно 500к данных
  43. 103 Сценарий: 1 тип документа: пакет - данные пакета встроены

    в пакет - для sql данные лежат в денормализованной таблице - 100к пакетов - всего примерно 500к данных Задача: найти все пакеты где есть нужные данные
  44. 108 MongoDB RelationDB Иерархическая связанная структура Отлично на чтение под

    запросы Отлично на запись вместе Плохо на обновление Нормально на чтение Хорошо на запись Отлично на обновление
  45. 109 MongoDB RelationDB Иерархическая связанная структура Отлично на чтение под

    запросы Отлично на запись вместе Плохо на обновление Нормально на чтение Хорошо на запись Отлично на обновление Сырые данные Отлично на чтение Отлично на запись Отлично на чтение Неудобно на запись
  46. 110 MongoDB RelationDB Иерархическая связанная структура Отлично на чтение под

    запросы Отлично на запись вместе Плохо на обновление Нормально на чтение Хорошо на запись Отлично на обновление Сырые данные Отлично на чтение Отлично на запись Отлично на чтение Неудобно на запись
  47. 114 .NET инструменты Mongodb • ODM • Model mapping •

    Raw Query Language • Driver API • LINQ Query Language
  48. 117 .NET Вставка данных ADO.NET using var conn = new

    NpgsqlConnection(connectionString); conn.Open(); conn.TypeMapper.UseJsonNet(); using var transaction = conn.BeginTransaction();
  49. 118 .NET Вставка данных ADO.NET using var cmd = new

    NpgsqlCommand() { Connection = conn, CommandText = $"INSERT INTO articles (name, text, user, comments) VALUES (@n,@t,@u,@co)” };
  50. 119 .NET Вставка данных ADO.NET cmd.Parameters.AddWithValue("c", document.Name); cmd.Parameters.AddWithValue("n", document.Text); cmd.Parameters.AddWithValue("t",

    document.User); cmd.Parameters.Add(new NpgsqlParameter("i", NpgsqlDbType.Jsonb) { Value = document.Comments }); . . . cmd.ExecuteNonQuery(); transaction.Save("transaction");
  51. 120 .NET Вставка данных EF using var context = new

    BlogContext(); using var transaction = context.Database.BeginTransaction(); try { var record = new RecordFactory().GetRecord(); context.Blog.Add(record); context.SaveChanges(); transaction.Commit(); } catch () { transaction.Rollback(); }
  52. 121 .NET Вставка данных EF using var context = new

    BlogContext(); using var transaction = context.Database.BeginTransaction(); try { var record = new RecordFactory().GetRecord(); context.Blog.Add(record); context.SaveChanges(); transaction.Commit(); } catch () { transaction.Rollback(); }
  53. 122 .NET Вставка данных EF using var context = new

    BlogContext(); using var transaction = context.Database.BeginTransaction(); try { var record = new RecordFactory().GetRecord(); context.Blog.Add(record); context.SaveChanges(); transaction.Commit(); } catch () { transaction.Rollback(); }
  54. 124 .NET Вставка данных mongo var client = new MongoClient(connectionString);

    var collection = client .GetDatabase(”test") .GetCollection<Article>(”articles"); using var session = client.StartSession(); session.StartTransaction(); try { collection.InsertMany(documents); session.CommitTransaction(); } catch () { session.RollbackTransaction(); }
  55. 125 .NET Вставка данных mongo var client = new MongoClient(connectionString);

    var collection = client .GetDatabase(”test") .GetCollection<Article>(”articles"); using var session = client.StartSession(); session.StartTransaction(); try { collection.InsertMany(documents); session.CommitTransaction(); } catch () { session.RollbackTransaction(); }
  56. 126 .NET Вставка данных mongo var client = new MongoClient(connectionString);

    var collection = client .GetDatabase(”test") .GetCollection<Article>(”articles"); using var session = client.StartSession(); session.StartTransaction(); try { collection.InsertMany(documents); session.CommitTransaction(); } catch () { session.RollbackTransaction(); }
  57. 128 .NET получение данных ADO.NET using var conn = new

    NpgsqlConnection(connectionString); conn.Open(); using var cmd = new NpgsqlCommand( "select t.id, t.name, t.url, t.v from ( select id, name, url, userid, jsonb_array_elements(comments)::jsonb as v from articles_comments) as t join users as u on u.id = jsonb_extract_path_text(v,'UserId')::int where u.name = @name” , conn));
  58. 129 .NET получение данных ADO.NET cmd.Parameters.AddWithValue("@name", _faker.PickRandom(_userNames)); using var reader

    = cmd.ExecuteReader(); var articles = reader.Select(r => new ArticleSql { Id = r.GetInt64(0), Name = r.GetString(1), Url = r.GetString(2), Comments = JsonConvert.DeserializeObject<List<Comment>>( "[" + r.GetString(3) + "]") });
  59. 132 .NET получение данных EF Npgsql.EntityFrameworkCore.PostgreSQL/issues/981 This does not include:

    • Calling JSON functions and operators • Mapping to non-POCO, JSON DOM types • PostgreSQL 12 JSONPATH support
  60. 133 .NET получение данных Mongodb var userFilter = Builders<User>.Filter.Eq( u

    => u.Name, _faker.PickRandom(_userNames)); var user = _users.Find(userFilter).FirstOrDefault(); var articlesFilter = Builders<Article>.Filter .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); var projection = Builders<Article>.Projection .Include(a => a.Name) .Include(a => a.Url) .Include(a => a.Comments) .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); articles.Find(articlesFilter).Project(projection).ToList();
  61. 134 .NET получение данных Mongodb var userFilter = Builders<User>.Filter.Eq( u

    => u.Name, _faker.PickRandom(_userNames)); var user = _users.Find(userFilter).FirstOrDefault(); var articlesFilter = Builders<Article>.Filter .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); var projection = Builders<Article>.Projection .Include(a => a.Name) .Include(a => a.Url) .Include(a => a.Comments) .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); articles.Find(articlesFilter).Project(projection).ToList();
  62. 135 .NET получение данных Mongodb var userFilter = Builders<User>.Filter.Eq( u

    => u.Name, _faker.PickRandom(_userNames)); var user = _users.Find(userFilter).FirstOrDefault(); var articlesFilter = Builders<Article>.Filter .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); var projection = Builders<Article>.Projection .Include(a => a.Name) .Include(a => a.Url) .Include(a => a.Comments) .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); articles.Find(articlesFilter).Project(projection).ToList();
  63. 136 .NET получение данных Mongodb var userFilter = Builders<User>.Filter.Eq( u

    => u.Name, _faker.PickRandom(_userNames)); var user = _users.Find(userFilter).FirstOrDefault(); var articlesFilter = Builders<Article>.Filter .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); var projection = Builders<Article>.Projection .Include(a => a.Name) .Include(a => a.Url) .Include(a => a.Comments) .ElemMatch(a => a.Comments, comment => comment.UserId == user.Id); articles.Find(articlesFilter).Project(projection).ToList();
  64. 138 MongoDB RelationDB Добавление данных Просто и удобно Надо привыкнуть

    к синтаксису Нет хинтов Просто через EF на запись только реляционных данных ADO.NET Есть хинты
  65. 139 MongoDB RelationDB Добавление данных Чтение данных Просто и удобно

    Есть LINQ Просто через EF без JSON Есть LINQ Просто и удобно Надо привыкнуть к синтаксису Нет хинтов Просто через EF на запись только реляционных данных ADO.NET Есть хинты
  66. 140 MongoDB RelationDB Добавление данных Чтение данных Просто и удобно

    Есть LINQ Просто через EF без JSON Есть LINQ Просто и удобно Надо привыкнуть к синтаксису Нет хинтов Просто через EF на запись только реляционных данных ADO.NET Есть хинты