
О проекте
В данном проекте проведён анализ датасета о метрополитенах мира. Основная цель заключалась в выявлении закономерностей и взаимосвязей между такими показателями, как год открытия метро, протяжённость сети, количество станций, пассажиропоток, а также город, страна и регион расположения метрополитена. Для наглядного представления информации были использованы различные типы визуализаций: круговая и столбчатая диаграммы, линейный график, диаграмма рассеяния и тепловая карта. Выбор графиков определялся характером данных и стремлением наиболее чётко отразить выявленные закономерности.
В исследовании использовались открытые данные с сайта kaggle.ru.
Стилизация графиков выполнена с использованием наиболее характерных цветов линий метро, а также шрифта, применяемого в Московском метрополитене.

Визуализация
Сначала я импортировала необходимые библиотеки: pandas, seaborn, matplotlib.pyplot, matplotlib.colors. После чего считала csv-файл датасета.

В качестве первой визуализации была выбрана круговая диаграмма. Она отражает процентное распределение количества метрополитенов по различным регионам мира. Из диаграммы видно, что наибольшая доля метрополитенов (почти 60%) приходится на Азию.

Столбчатая диаграмма демонстрирует топ-10 стран с самой протяжённой сетью метрополитенов. С заметным отрывом Китай занимает первое место, на втором месте находится Индия. Остальные страны из десятки лидеров имеют схожие показатели по длине метро.
Линейная диаграмма иллюстрирует ежегодный рост общего числа станций по всему миру. Особенно заметное увеличение произошло после 1960-х годов
Диаграмма рассеяния иллюстрирует взаимосвязь между годовым пассажиропотоком метрополитенов и их протяжённостью. Из графика видно, что между этими показателями прослеживается слабая линейная зависимость.
Тепловая карта отображает пассажиропоток крупнейших систем метро, указывая соответствующие города и страны. Из визуализации видно, что наибольший пассажиропоток зафиксирован в Шанхае.
Заключение
Анализ данных о метрополитенах позволил получить сведения о развитии подземного транспорта в разных регионах. Были выявлены лидеры по протяжённости сети, количеству станций и пассажиропотоку — такими оказались страны Азии, особенно Китай, где расположены самые масштабные системы метро. Также были рассмотрены взаимосвязи между несколькими показателями, представленными в датасете.
Использованные ресурсы и описание применения генеративной модели
Kaggle — поиск датасета Qwen — уточнение/исправление ошибок кода Perplexity — уточнение/исправление ошибок кода и редактирование текста исследования