Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
node.js for millions of images
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Ivan Babrou
October 25, 2012
Programming
1.5k
7
Share
node.js for millions of images
Ivan Babrou
October 25, 2012
More Decks by Ivan Babrou
See All by Ivan Babrou
LXJS 2013: backpack — scalable photo storage
bobrik
2
150
Other Decks in Programming
See All in Programming
開発体験を左右するライブラリの API 設計 - GraphQL スキーマ構築ライブラリから考える #tskaigi
izumin5210
1
210
Migrations : C'est une question d'hygiène !
vinceamstoutz
0
670
Spec-Driven Development with AI Agents (Workshop, May 2026)
antonarhipov
3
400
リセットCSSを1行消したらアクセシビリティが向上した話
pvcresin
4
520
AWSはOSSをどのように 考えているのか?
akihisaikeda
0
120
SkillsをS3 Filesに置く時のあれこれ
watany
3
1.6k
[BalkanRuby 2026] Drop your app/services!
palkan
3
560
ソースコード→AST→オペコード、の旅を覗いてみる
o0h
PRO
1
140
実践ハーネスエンジニアリング:ステアリングループを実例から読み解く / Practical Harness Engineering: Understanding Steering Loops Through Real-World Examples
nrslib
5
5.6k
TypeSpec で繋ぐ複数プロダクトの型安全
maroon8021
1
110
Hive Metastoreを通して学ぶIceberg REST Catalog ― 仕様から実装まで
okumin
0
160
TSKaigi2026-静的解析への投資がAI時代のコード品質を支える ── カスタムESLintルールの設計と運用
hayatokudou
3
250
Featured
See All Featured
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.2k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
820
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
280
A Tale of Four Properties
chriscoyier
163
24k
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Thoughts on Productivity
jonyablonski
76
5.2k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Ethics towards AI in product and experience design
skipperchong
2
280
Build your cross-platform service in a week with App Engine
jlugia
234
18k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.6k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Transcript
Хранилище для миллинов картинок на node.js (а почему бы и
да) Wednesday, October 24, 12
Что есть 40+ миллионов пользователей 1.5 миллиона уников в сутки
15 пользовательских фоток на главной 60 пользовательских фоток в ленте 60 килобайт на фото в среднем 10 терабайт данных Wednesday, October 24, 12
Роли Frontend Cache Resizer Backend Wednesday, October 24, 12
Frontend nginx SSL termination Upstream hash Смотрят в интернет Wednesday,
October 24, 12
Cache nginx tmpfs proxy_next_upstream Больше ничего Wednesday, October 24, 12
Resizer nginx image_filter proxy_next_upstream lua Wednesday, October 24, 12
А дальше всё становится плохо. Wednesday, October 24, 12
Особенности 99% времени серверов с данными - IO “Long tail”
problem Невозможно выровнять чтения Попасть в кеш в 3Тб данных непросто Wednesday, October 24, 12
Диски тормозят Память в 100 000 раз быстрее диска, но
диски надёжнее и вместительнее. Wednesday, October 24, 12
Решения nginx хватит (btrfs, reiserfs, *fs) Haystack (facebook) Elliptics (yandex)
Wednesday, October 24, 12
Yeah, well, I'm gonna go build my own theme park,
with blackjack and hookers. In fact, forget the park! Wednesday, October 24, 12
backpack Задумка из Haystack Proof of concept + Wednesday, October
24, 12
Backend node.js redis Файлы по 4Gb Wednesday, October 24, 12
Как это изнутри node.js redis disk: - data_XXX (4Gb) -
metadata_XXX Метаданные всегда в памяти. Для чтения всегда только 1 вызов pread Wednesday, October 24, 12
Redis Очень быстрый (даже слишком) Информация в бинарном виде Было:
/u124/z1dg23.jpg Будет:{file:1}{offset:4}{length:4} Минимальная нагрузка на диск (AOF) Wednesday, October 24, 12
node.js javascript Асинхронная работа Постоянно открытые файлы Постоянное соединение к
redis 1 поток (на самом деле нет) Wednesday, October 24, 12
Потоки (streams) Http запросы и ответы: req, res Data Writer:
req.pipe(writer) Data Reader: reader.pipe(res) Wednesday, October 24, 12
Только ультахардкор Выравнивание чтений (O_DIRECT) Посчитать дешевле +50% к пропускной
способности Более ровный график использования IO Модуль для node.js (aligned-buffer) Wednesday, October 24, 12
Грабли O_DIRECT Записи должны быть выровнены Линус не одобряет (fadvice/madvice)
Повторное чтение не идёт в кеш Wednesday, October 24, 12
Тестирование 40Gb данных (малая часть) 500K файлов Случайное чтение в
50 потоков Без записи Wednesday, October 24, 12
Графики: backpack 0 225 450 675 900 backpack-a backpack-a-dc3 backpack
-a: выровненные чтения -dc3: каждые 5 секунд echo 3 > /proc/sys/vm/drop-cache Wednesday, October 24, 12
Графики: nginx 0 225 450 675 900 nginx nginx-dс nginx-dc3
-a: выровненные чтения -dc: каждые 5 секунд echo 1 > /proc/sys/vm/drop-cache -dc3: каждые 5 секунд echo 3 > /proc/sys/vm/drop-cache Wednesday, October 24, 12
Графики: вместе 0 225 450 675 900 backpack-a-dc3 nginx-dс nginx-dc3
-a: выровненные чтения -dc: каждые 5 секунд echo 1 > /proc/sys/vm/drop-cache -dc3: каждые 5 секунд echo 3 > /proc/sys/vm/drop-cache Wednesday, October 24, 12
Где скачать? Доведём до ума и сделаем Open Source! Wednesday,
October 24, 12
Шардинг Фронтенды: dns round-robin Кеши: upstream hash + хаки Ресайзеры:
выбирай любой Данные: (D)HT - почти как в торрентах Wednesday, October 24, 12
Hash map Хеш: (md5(соль + user_id))[0:2] Начальный хеш: [read], [write]
00: [1,2,3], [1,2,3] (от 00 до 39) 40: [5,6,7], [5,6,7] (от 40 до 80) 80: [8,9,10], [8,9,10] (от 80 до ff) Wednesday, October 24, 12
Почему не уникальный hash на картинку Так вышло К тому
же, мы не хостинг скриншотов Сложнее вычислить все урлы картинок Неравномерное использование ресурсов Wednesday, October 24, 12
Как всем рулить Конфигурация Обработка задач Мониторинг Wednesday, October 24,
12
Конфигурация: Zookeeper Отказоустойчивость до конца Hash table для данных Хранение
данных серверов Задачи Wednesday, October 24, 12
Обработка задач: crons Кроны разбиения стораджа Разбиение Очистка Репликация картинок
Кроны скачивания картинок data data data Wednesday, October 24, 12
Мониторинг: zabbix Мониторининг io (сервера данных) Мониторинг cpu (ресайзеры) Сокеты,
сеть, всё что захотите Wednesday, October 24, 12
Миграция Перелопатить весь код Скачать все картинки Нагреть кеш Докачивать
новые Wednesday, October 24, 12
Как переживать падения Падения будут всегда Убрать точки отказа Спокойно
падать Иметь возможность восстановиться Wednesday, October 24, 12
Вопросы? Иван Бобров http://github.com/bobrik @ibobrik Wednesday, October 24, 12
Wednesday, October 24, 12