Академия Онлайн

Визуализация данных

Практический курс для аналитиков, которым нужно быстро превращать сырые таблицы в понятные визуальные выводы. Акцент сделан не на “красивые картинки”, а на честную коммуникацию данных.

Для кого курс

  • Начинающие аналитики.
  • Руководители учебных программ и координаторы.
  • Специалисты, которые регулярно делают отчеты в таблицах.
  • Студенты, изучающие Python и анализ данных.

Инструменты

  • Python, pandas и matplotlib.
  • Jupyter Notebook или обычные .py-скрипты.
  • CSV-файлы с учебными данными.
  • Экспорт графиков в PNG и PDF.

Неделя 1. Подготовка данных

Темы

  • Структура датасета и первичный осмотр.
  • Типы столбцов и пропущенные значения.
  • Дубликаты, выбросы и странные категории.
  • Переименование колонок.
  • Фильтрация строк и группировка.
  • Сводные таблицы.
  • Проверка результата после очистки.

Практика

  • Очистить выгрузку посещаемости.
  • Найти строки с пустыми группами.
  • Посчитать количество студентов по потокам.
  • Сохранить очищенную таблицу в новый CSV.

Домашнее задание

Подготовить набор данных для визуализации: описать найденные проблемы, исправить их и приложить краткий журнал изменений.

Неделя 2. Выбор графика

Темы

  • Столбчатые диаграммы для сравнения категорий.
  • Линейные графики для динамики.
  • Scatter plot для связи двух показателей.
  • Гистограммы и распределения.
  • Heatmap для матриц и расписаний.
  • Цвет, масштаб и подписи.
  • Ошибки визуализации, которые вводят в заблуждение.

Практика

  • Построить график посещаемости по неделям.
  • Сравнить успеваемость по группам.
  • Найти предметы с высокой долей пересдач.
  • Сделать один плохой график и объяснить, почему он плохой.

Домашнее задание

Собрать три графика по одному датасету: сравнение, динамика и распределение. Для каждого графика написать один вывод, который можно показать руководителю.

Неделя 3. Дашборд и история

Темы

  • Порядок чтения отчета.
  • Ключевые метрики и контекст.
  • Фильтры и сегментация.
  • Подписи, заголовки и единицы измерения.
  • Экспорт и проверка читаемости.
  • Как не перегружать дашборд.
  • Презентация выводов без лишней технической детали.

Практика

  • Собрать мини-дашборд по учебному потоку.
  • Сформулировать три вывода и одно ограничение данных.
  • Проверить графики на маленьком экране.
  • Подготовить краткую записку для деканата.

Домашнее задание

Подготовить финальный отчет: один экран с метриками, три графика, краткий вывод и список вопросов, которые требуют дополнительной проверки.

Финальный проект

Варианты проекта:

  • Анализ посещаемости за семестр.
  • Визуализация результатов контрольных работ.
  • Дашборд нагрузки преподавателей.
  • Отчет по популярности элективных курсов.

Контрольные вопросы

  • Когда столбчатая диаграмма лучше круговой?
  • Почему нужно показывать единицы измерения?
  • Чем опасна обрезанная ось Y?
  • Как понять, что график перегружен?
  • Почему перед визуализацией нужна очистка данных?

Лабораторные работы

Лабораторная 1. Очистка ведомости

Студент получает CSV-файл с оценками, пропусками и дубликатами. Нужно подготовить данные к анализу и описать все изменения.

Проверяется:

  • поиск пропущенных значений;
  • корректная обработка дубликатов;
  • сохранение исходного файла без изменений;
  • документирование преобразований;
  • проверка итоговой таблицы.

Лабораторная 2. Три графика для одной истории

По одному набору данных нужно построить три разных графика: сравнение, динамику и распределение. Каждый график должен отвечать на конкретный вопрос.

Проверяется:

  • выбор подходящего типа графика;
  • читаемые подписи;
  • отсутствие визуальных искажений;
  • аккуратная цветовая схема;
  • краткий текстовый вывод.

Лабораторная 3. Мини-дашборд

Студент собирает один экран с ключевыми метриками и графиками для руководителя программы. Дашборд должен быть понятен без комментариев автора.

Проверяется:

  • порядок чтения;
  • связность графиков;
  • наличие контекста;
  • отсутствие перегруза;
  • экспорт в читаемом формате.

Критерии оценки

  • График отвечает на явно сформулированный вопрос.
  • Подписи и единицы измерения понятны.
  • Цвет используется для смысла, а не для украшения.
  • Вывод не сильнее, чем позволяют данные.
  • Исходные ограничения данных явно указаны.

Типичные ошибки

  • Строить график до очистки данных.
  • Использовать слишком много цветов.
  • Скрывать нулевую базу там, где она важна.
  • Смешивать проценты и абсолютные значения без пояснения.
  • Делать вывод о причинности по простой корреляции.

Дополнительные темы

  • Аннотации на графиках.
  • Малые multiples для сравнения групп.
  • Экспорт отчетов в HTML.
  • Автоматическая генерация еженедельного отчета.
  • Проверка доступности цветов для дальтонизма.

Результат

Студент сможет подготовить аккуратный график, объяснить выбор визуализации, собрать небольшой отчет из связанных диаграмм и защитить свои выводы.