Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Тематические карты в Tableau

Тематические карты в Tableau

1 часть тренинга по визуализации данных на географических картах в Tableau

Способы визуализации геоданных
Картодиаграммы и картограммы
Геокодирование
Дополнительные источники фоновых карт

Ссылки на ресурсы работают, если скачать файл презентации к себе на компьютер

Gleb Zakhodyakin

November 08, 2018
Tweet

More Decks by Gleb Zakhodyakin

Other Decks in Education

Transcript

  1. План занятия • Способы визуализации данных на картах • Виды

    геоданных • Геокодирование • Построение тематических карт в Tableau – Картограммы – Карты со значками – Картодиаграммы • Расширение возможностей Tableau – Геокодирование объектов на территории РФ – Подключение дополнительных источников карт 2
  2. Тематическая карта • Визуализация данных на географической карте повышает их

    наглядность • Тематическая карта - карта, отражающая какой-нибудь один сюжет (тему, объект, явление, отрасль) или сочетание сюжетов 3
  3. Визуализация с помощью значков • Изображение точек интересов (POI, points

    of interest) значками – наиболее простой способ визуализации. Применим для данных, которые привязаны к некоторой точке, либо для которых не важна точность отображения области 4
  4. Картодиаграммы • Картодиаграммы – это сочетание диаграмм с географической картой.

    Применимы, если можно пренебречь размером области, для которой отображаются показатели • Популярные способы изображения: – с помощью символов, размер которых пропорционален показываемой величине (proportional symbol map) – с помощью круговых диаграмм (pie chart map) 5
  5. Картограммы • Картограмма (choropleth) – карта, на которой цветом, насыщенностью

    или штриховкой показывается интенсивность какого-либо показателя для различных областей • Областями обычно являются объекты административно-территориального деления (страны, районы, города) 6
  6. Тайлы • Карты, используемые как подложка для визуализаций, хранятся в

    растровом формате • Для ускорения загрузки изображение карты разбивается на отдельные элементы – тайлы (tiles), которые загружаются по необходимости • Для каждого масштаба карты (zoom level) используется свой набор тайлов • Картографические сервисы могут предлагать разные наборы тайлов, отражающие тематику карты 12
  7. Геокодирование • Геокодирование (geocoding) – определение географических координат для объектов

    (POI, адреса, почтовые индексы) • Для геокодирования используются базы данных географических объектов (локальные или веб-службы) 13
  8. Геокодирование в Tableau • Полям набора данных можно назначить географическую

    роль (Geographic Role) – например: широта, долгота, страна, город, почтовый индекс • Значения полей, имеющих географическую роль, автоматически геокодируются с использованием встроенной базы данных • При добавлении на визуализацию полей с географическими ролями автоматически выбирается тип визуализации - карта 14
  9. Уточнение названий • Для уточнения принадлежности географических названий необходимо добавить

    дополнительные географические поля (например, страну, регион…). Для корректного отображения данных эти поля должны быть включены в визуализацию. 16
  10. Иерархия географических ролей • В Tableau встроены несколько иерархий географических

    ролей: – Country (Name) – Country (Name), State/Province – Country (Name), State/Province, City – Country (Name), State/Province, County – Country (Name), ZIP Code/Postcode – Country (Name), Area Code • Можно дополнять и расширять существующие иерархии, либо добавлять собственные • Для объектов, имеющих площадь (страна, штат/регион), в базе данных Tableau помимо точечных координат хранятся также и полигоны 17 https://onlinehelp.tableau.com/current/pro/desktop/en-us/help.html#custom_geocoding.html
  11. Файлы данных • Файлы данных для выполнения тренинга можно загрузить

    по ссылке: http://bit.ly/tableau-training • Названия файлов для загрузки будут указаны по ходу работы 19
  12. Файл данных (newlab) • Создайте новую рабочую книгу Tableau •

    Создайте новое подключение к файлу данных Access newlab.mdb (см. yandex) и добавьте подключение к таблице ВсеЗаказы (эта таблица формируется на основе заранее созданного в Access запроса) • Для ускорения обработки, а также обеспечения возможности использования расширенных возможностей Tableau для агрегирования данных, выберите режим подключения с извлечением данных (Extract) • Перейдите к рабочему листу Sheet1. Программа предложит сохранить извлеченный набор данных – выберите тот же каталог, в котором находятся файл данных и рабочая книга 20
  13. Назначение географических ролей • Tableau может автоматически определять географическую роль

    поля на основе его названия. Однако это работает только если название поля приводится на английском языке (City, Country, …) • В остальных случаях роль нужно назначить вручную с помощью контекстного меню поля • Выберите географическую роль Country/Region для измерения СтранаКлиента • Выберите роль City для измерения ГородКлиента 21
  14. Картограмма оборота по странам • Двойным щелчком по измерению СтранаКлиента

    добавьте его на визуализацию • Поле СтранаКлиента автоматически добавилось в область деталей, а полученные в результате геокодирования координаты – в область строк и столбцов • Переключите тип графических элементов (Marks) с Automatic на Map • Добавьте факт Выручка в область цвета (Color) • Переименуйте рабочий лист: “Картограмма оборота по странам” 22
  15. Картодиаграмма оборота по городам • Создайте новый лист: “Картодиаграмма оборота

    по городам” • Двойным щелчком добавьте на визуализацию сначала поле СтранаКлиента, а затем – поле ГородКлиента • Несмотря на уточнение, 18 городов не удалось геокодировать. Щелкните по надписи “18 unknown” в нижнем правом углу и выберите: “Edit Locations” • В столбце Matching Location для не геокодированных городов выводится: Ambiguous (дублирование названий: есть несколько городов с таким названием) или Unrecognized (значение не найдено в базе) • Для дублирующихся названий можно было бы уточнить местоположение, указав дополнительные поля из географической иерархии (например, область или штат). Но поле с названиями областей в нашем наборе данных отсутствуют. Поэтому остается только ввести координаты непосредственно (их можно найти в Википедии или Google картах) • Для нераспознанных названий можно выбрать подходящее название из списка в поле Matching Location. Для ускорения поиска, можно начать набирать название в поле Matching Location 23
  16. Картодиаграмма оборота по городам • Добавьте факт Выручка в область

    размера (Size) • Для факта КодЗаказа выберите в контекстном меню агрегирующую функцию по умолчанию – Count Distinct (число уникальных значений). Мы хотим посчитать, сколько заказов сделал каждый клиент, а в наборе данных содержатся строки заказов. Поэтому коды заказов дублируются и нужно учитывать только уникальные значения • Добавьте факт КодЗаказа в область цвета (Color) • Карту можно двигать с нажатой клавишей Shift, и масштабировать по Ctrl+колесо мыши, либо кнопками управления. Вернуться к исходному положению можно нажав на кнопку с булавкой в окне карты 24
  17. Картодиаграмма оборота по городам • Создайте копию рабочего листа с

    оборотом по городам (команда Duplicate Sheet в контекстном меню ярлыка рабочего листа) и назовите ее: Оборот по категориям и городам • Измените тип графических элементов (Marks) на Pie • В области цвета (Color) замените поле на Категория • Поместите поле Выручка (из панели данных) в область доли сектора (Angle) • Увеличьте размер графических элементов • Выберите на карте масштаб, удобный для просмотра продаж в Европе 25
  18. Совмещение картограммы и картодиаграммы • Сделайте копию листа, который мы

    только что закончили, и назовите ее Совмещенная картограмма • Продублируйте (Ctrl-перетаскивание) поле Latitude (generated) в области строк (Rows) Примечание: нужно использовать именно активное поле Latitude (generated) в области Rows, а не перетаскивать его из окна данных еще раз • В окне визуализации должно появиться две карты, расположенных друг под другом • Обратите внимание, что на панели графических элементов (Marks) теперь стало три раздела – All (все панели) и еще два раздела – для верхней и нижней панели • Щелкните по заголовку раздела для первой панели чтобы развернуть его 26
  19. Совмещение картограммы и картодиаграммы • Уберите поле ГородКлиента из области

    деталей (Detail) • Измените тип графического элемента на Map • Поместите поле КодЗаказа в область цвета (Color) • После этого выберите в контекстном меню второго поля с широтой в области строк (Rows) пункт: Dual Axis • Результат показан на следующем слайде 27
  20. Встроенная база данных для геокодирования • Встроенная база для геокодирования

    в Tableau содержит данные о российских названиях, однако все они указаны в транслитерации • Это означает, что при визуализации геоданных на территории РФ, требуется, чтобы в наборе данных были указаны именно эти варианты названий. Если в ваших данных содержатся имена на русском языке, то потребуется дополнить их транслитерированными названиями • Есть и другие способы решения проблемы геокодирования, которые будут рассмотрены позднее 30 Фрагмент списка Российских регионов и городов - russian_names.xlsx
  21. Файл данных • Создайте еще одно подключение к источнику данных

    – файлу Excel: russian_names.xlsx (лист Cities) • Задайте для поля Name географическую роль: City, а для поля Region – роль State/Province • Создайте новый рабочий лист 31
  22. Расположение городов • Переименуйте лист в «Расположение городов» и постройте

    карту расположения известных Tableau российских городов. Для этого: – добавьте поле Region в детали (Detail), а поле Name – в область метки (Label) – измените цвет маркера на красный и установите прозрачность (Transparency) 50% – уменьшите размер маркера 32
  23. Совмещенная картограмма • Постройте на новом листе совмещенную картограмму: маркерами

    покажите расположение городов, а заливка региона должна отражать число уникальных кодов городов в этом регионе • Чтобы посчитать число уникальных кодов, сделайте поле ID фактом и измените агрегирующую функцию на Count Distinct • Масштабируйте карту для удобного отображения Московской области, воспользовавшись строкой поиска 33
  24. Файл данных • Откройте в Excel файл данных hse_campus.xlsx •

    Этот файл содержит список адресов общежитий, учебных и административных зданий, принадлежащих ВШЭ (с сайта http://www.hse.ru/buildinghse) • Tableau не содержит базы данных для геокодирования отдельных адресов, поэтому нам придется воспользоваться услугами стороннего ресурса 35
  25. Сервис пакетного геокодирования • Откройте в браузере страницу: geocode.localfocus.nl •

    Выберите для поля Indicate Country… значение: Russian Federation. • Скопируйте содержимое столбца Address (без заголовка) из Excel и вставьте этот список адресов в поле Copy and Paste Addreess Locations • Нажмите кнопку Add to Geocode и подождите, пока завершится процесс 38
  26. Добавление координат • Скопируйте и вставьте результаты геокодирования справа от

    столбца с адресом в файле hse_campus.xlsx • Сохраните файл Excel как hse_campus_geocoded.xlsx. Конечный вид таблицы показан на рисунке. 39
  27. Другие сервисы для геокодирования • Сервис, которым вы воспользовались, основан

    на открытых данных, поэтому качество геокодирования у него не всегда хорошее. Например, несколько адресов не были распознаны и заменены на координаты центра Москвы: • Существуют и другие сервисы геокодирования, при необходимости вы можете воспользоваться ими: – https://www.doogal.co.uk/BatchGeocoding.php - использует более качественную базу данных адресов, но требует получения Google Maps API Key (см. инструкцию) – http://www.opengeotools.com/bGeocoderBing.php - использует базу данных Bing Maps, может требовать получения Bing Maps API Key – https://csv2geo.com/ - позволяет бесплатно геокодировать до 100 адресов – http://www.gpsvisualizer.com/geocoder/ – https://www.geocod.io/ - до 2,500 адресов в день бесплатно (при превышении $0.50 за 1,000 адресов) – https://geocoding.geo.census.gov - 1,000 адресов в день бесплатно – https://geocode.xyz/batch - сервис для геокодирования с бесплатной версией – https://locationiq.com/ - до 10 000 адресов в сутки бесплатно – https://ru.batchgeo.com/ - русскоязычный сервис для получения координат по адресу с целью создания веб-карт 40
  28. Добавление источников карт • Распакуйте содержимое архива mapsources.zip в папку

    Мои документы\My Tableau Repository\Mapsources • В этом архиве содержатся описания дополнительных источников карт для подложки 41
  29. Визуализация размещения зданий университета • Создайте новую книгу Tableau –

    hse_campus.twbx • Перетащите файл hse_campus_geocoded.xlsx в окно Tableau • Переименуйте лист в Здания ВШЭ • Постройте визуализацию размещения зданий Вышки (цвет обозначает тип здания) • В меню Map>Background Maps выберите Google Satellite 42