Original size 1140x1600

Транспорт в цифрах: анализ данных автобусов в Нью-йорке

PROTECT STATUS: not protected

Рубрикатор

1. Концепция 2. Введение 3. Цветовая палитра 4. Анализ скоростей автобусов 5. Анализ средней скорости автобуса по часам суток 6. Анализ распределения автобусов по топ-10 маршрутам 7. Анализ скорости и пути 8. Анализ соотношения скорости и типа дня 9. Вывод 10. Описание применения генеративной модели 11. Ссылки

Концепция

В рамках проекта проводится анализ данных, характеризующих работу автобусного транспорта в городе Нью-Йорк. В качестве эмпирической базы используются данные о маршрутах, расписаниях, фактическом времени движения, задержках и пассажиропотоке.

Датасет был получен из открытых источников (NYC Open Data / Kaggle) и представляет собой структурированный массив информации о работе автобусной сети мегаполиса, включающий пространственные, временные и операционные параметры.

Выбор данной темы обусловлен значимостью общественного транспорта в формировании городской мобильности и качества жизни населения. Автобусная система Нью-Йорка является одной из крупнейших в мире, что делает её репрезентативным примером для анализа транспортных процессов в условиях высокой плотности застройки и интенсивных пассажирских потоков.

Анализ данных позволяет выявить закономерности в работе автобусных маршрутов, определить наиболее проблемные зоны и временные интервалы, а также оценить эффективность функционирования транспортной системы с точки зрения регулярности и доступности перевозок.

Введение

Для визуализации и анализа данных в рамках проекта были использованы следующие типы графиков: 1. Столбчатая диаграмма — была использована для визуализации анализа скоростей автобусов и их скоростей 2. Линейный график 3. Круговая диаграмма 4. Точечная диаграмма 5. Тепловая карта нормализованных показателей

Цветовая палитра

big
Original size 2715x1247

Анализ скоростей автобусов

Я использовала код, чтобы проанализировать среднюю скорость автобусов на маршруте и их количество.

Анализ средней скорости

Так же с помощью кода был построен линейный график для выявления средней скорости автобуса по часам суток.

Анализ распределения маршрутов

В данном анализе мне стало интересно, насколько много в процентом соотношении распределяется автобусов по маршрутам

Анализ скорости против времени пути

В этом анализе я решила проверить, как количество времени в пути меняется от средней скорости потока

Анализ типов автобусов

Я написала код для того чтобы выяснить, как тепловая карта позволяет выявить временные паттерны изменения скорости в зависимости от типа дня и времени суток.

Вывод

В рамках данного проекта был проведён анализ данных о скорости движения автобусного транспорта в центральных районах Нью-Йорка на основе открытого датасета MTA. Исходные данные были предварительно очищены и подготовлены к анализу: выполнено приведение типов, обработка текстовых значений числовых показателей и структурирование временных признаков.

С помощью библиотеки Pandas были исследованы распределения средней скорости движения, её изменения в зависимости от времени суток, типа маршрута и продолжительности поездки. Для визуального анализа были использованы различные типы графиков — гистограммы, линейные графики, boxplot-диаграммы, тепловые карты и точечные диаграммы, что позволило рассмотреть данные с разных сторон и выявить устойчивые закономерности.

Результаты анализа показали, что скорость движения автобусного транспорта существенно варьируется в зависимости от времени суток и характеристик маршрута. В частности, наблюдается снижение средней скорости в периоды повышенной транспортной нагрузки, а также обратная зависимость между временем в пути и средней скоростью движения. Это указывает на влияние городского трафика и инфраструктурных ограничений центральных районов на эффективность общественного транспорта.

Визуализация данных была выполнена в едином минималистичном стиле с тёмной цветовой палитрой, что позволило повысить читаемость графиков и акцентировать внимание на ключевых аналитических выводах. Используемый объясняющий формат визуализации делает результаты анализа понятными даже для аудитории без технической подготовки.

В целом, проект демонстрирует, как методы анализа данных и визуализации могут использоваться не только для описания текущего состояния городской транспортной системы, но и для выявления потенциальных направлений её оптимизации, таких как корректировка маршрутов, изменение приоритетов движения и более точное планирование транспортных потоков.

Описание применения генеративной модели

В процессе выполнения проекта использовалась генеративная модель искусственного интеллекта ChatGPT (модель GPT-5.2). Генеративная модель применялась в качестве вспомогательного инструмента для поддержки аналитической работы и обучения.

С её помощью были получены рекомендации по структуре анализа данных, формированию логики визуализаций, а также примеры кода на языке Python с использованием библиотеки Pandas и средств визуализации. Кроме того, генеративная модель использовалась для помощи в формулировании аналитических выводов и текстовых описаний результатов исследования.

При этом все ключевые решения — выбор датасета, этапы очистки данных, интерпретация полученных результатов и финальные выводы — принимались автором проекта самостоятельно. Генеративная модель не использовалась для автоматической обработки данных или генерации итоговых графиков без участия автора, а выступала исключительно как инструмент консультационной и методической поддержки.

Использование генеративной модели позволило ускорить процесс работы, повысить качество структуры проекта и сосредоточиться на аналитической интерпретации данных и визуальном оформлении результатов.

Ссылки

Ссылка на используемую модель: https://openai.com/chatgpt