(в браузере интернет есть) • Поиск пакета: pandas • Качаем • Устанавливаем: pip install pandas-0.24.1-xxx.tar.gz (whl — «python wheels» — для нативных модулей) • pip лезет в репозиторий за зависимостями и обламывается из-за инета • При этом показывает недостающий пакет • Повторяем рекурсивно предварительно стоит сделать в текущей консольке: set PATH=%PATH%;«c:\Student\Python2.7»;«c:\Student\Python2.7\scripts»
и супругов (spouses) на борту судна • Parch — количество детей и родителей на борту судна • Ticket — номер билета • Fare — стоимость проезда • Cabin — номер каюты • Embarked — порт посадки: C = Cherbourg (Шербур, Франция), Q = Queenstown (Квинстаун, Ирландия), S = Southampton (Саутгемптон, гр. Гэмпшир, Англия)
в файле (в комментарии или строке) • Python 2.7: SyntaxError: Non-ASCII character '\xd0' in file titanic.py on line 18, but no encoding declared; see http://python.org/dev/peps/pep-0263/ for details • Python 3: ok
Возвращает выбранные строки как объект DataFrame • Пустое значение пропустить_в_начале: начать с первого элемента • Пустое значение индекс_конца: вывести все элементы, начиная с пропустить_в_начале+1, до последнего • Если пропустить_в_начале >= индекс_конца: пустая таблица DataFrame
корабле (два числа) • Какой части пассажиров удалось выжить (процент — число в интервале от 0 до 100) • Какую долю пассажиры 1го класса составляли среди всех пассажиров (процент — число в интервале от 0 до 100) • Возраст пассажиров: среднее и медиана
количество всех элементов • Медиана: такое значение (такой элемент выборки), для которого половина всех элементов выборки меньше этого значения, другая половина — больше этого значения • Медиана позволяет обрезать всплески на границах выборки • Пример: средняя зарплата vs медианная зарплата
• Колонка Name • Посмотрите значения (там всё не так однозначно) • Определите правило извлечения имени • Составьте регулярное выражение для извлечения имени