
Рубрикатор
1. Концепция 2. Введение 3. Цветовая палитра 4. Анализ скоростей автобусов 5. Анализ средней скорости автобуса по часам суток 6. Анализ распределения автобусов по топ-10 маршрутам 7. Анализ скорости и пути 8. Анализ соотношения скорости и типа дня 9. Вывод 10. Описание применения генеративной модели 11. Ссылки
Концепция
В рамках проекта проводится анализ данных, характеризующих работу автобусного транспорта в городе Нью-Йорк. В качестве эмпирической базы используются данные о маршрутах, расписаниях, фактическом времени движения, задержках и пассажиропотоке.
Датасет был получен из открытых источников (NYC Open Data / Kaggle) и представляет собой структурированный массив информации о работе автобусной сети мегаполиса, включающий пространственные, временные и операционные параметры.
Выбор данной темы обусловлен значимостью общественного транспорта в формировании городской мобильности и качества жизни населения. Автобусная система Нью-Йорка является одной из крупнейших в мире, что делает её репрезентативным примером для анализа транспортных процессов в условиях высокой плотности застройки и интенсивных пассажирских потоков.
Анализ данных позволяет выявить закономерности в работе автобусных маршрутов, определить наиболее проблемные зоны и временные интервалы, а также оценить эффективность функционирования транспортной системы с точки зрения регулярности и доступности перевозок.
Введение
Для визуализации и анализа данных в рамках проекта были использованы следующие типы графиков: 1. Столбчатая диаграмма — была использована для визуализации анализа скоростей автобусов и их скоростей 2. Линейный график 3. Круговая диаграмма 4. Точечная диаграмма 5. Тепловая карта нормализованных показателей
Цветовая палитра

Анализ скоростей автобусов
Я использовала код, чтобы проанализировать среднюю скорость автобусов на маршруте и их количество.


Анализ средней скорости
Так же с помощью кода был построен линейный график для выявления средней скорости автобуса по часам суток.


Анализ распределения маршрутов
В данном анализе мне стало интересно, насколько много в процентом соотношении распределяется автобусов по маршрутам


Анализ скорости против времени пути
В этом анализе я решила проверить, как количество времени в пути меняется от средней скорости потока


Анализ типов автобусов
Я написала код для того чтобы выяснить, как тепловая карта позволяет выявить временные паттерны изменения скорости в зависимости от типа дня и времени суток.


Вывод
В рамках данного проекта был проведён анализ данных о скорости движения автобусного транспорта в центральных районах Нью-Йорка на основе открытого датасета MTA. Исходные данные были предварительно очищены и подготовлены к анализу: выполнено приведение типов, обработка текстовых значений числовых показателей и структурирование временных признаков.
С помощью библиотеки Pandas были исследованы распределения средней скорости движения, её изменения в зависимости от времени суток, типа маршрута и продолжительности поездки. Для визуального анализа были использованы различные типы графиков — гистограммы, линейные графики, boxplot-диаграммы, тепловые карты и точечные диаграммы, что позволило рассмотреть данные с разных сторон и выявить устойчивые закономерности.
Результаты анализа показали, что скорость движения автобусного транспорта существенно варьируется в зависимости от времени суток и характеристик маршрута. В частности, наблюдается снижение средней скорости в периоды повышенной транспортной нагрузки, а также обратная зависимость между временем в пути и средней скоростью движения. Это указывает на влияние городского трафика и инфраструктурных ограничений центральных районов на эффективность общественного транспорта.
Визуализация данных была выполнена в едином минималистичном стиле с тёмной цветовой палитрой, что позволило повысить читаемость графиков и акцентировать внимание на ключевых аналитических выводах. Используемый объясняющий формат визуализации делает результаты анализа понятными даже для аудитории без технической подготовки.
В целом, проект демонстрирует, как методы анализа данных и визуализации могут использоваться не только для описания текущего состояния городской транспортной системы, но и для выявления потенциальных направлений её оптимизации, таких как корректировка маршрутов, изменение приоритетов движения и более точное планирование транспортных потоков.
Описание применения генеративной модели
В процессе выполнения проекта использовалась генеративная модель искусственного интеллекта ChatGPT (модель GPT-5.2). Генеративная модель применялась в качестве вспомогательного инструмента для поддержки аналитической работы и обучения.
С её помощью были получены рекомендации по структуре анализа данных, формированию логики визуализаций, а также примеры кода на языке Python с использованием библиотеки Pandas и средств визуализации. Кроме того, генеративная модель использовалась для помощи в формулировании аналитических выводов и текстовых описаний результатов исследования.
При этом все ключевые решения — выбор датасета, этапы очистки данных, интерпретация полученных результатов и финальные выводы — принимались автором проекта самостоятельно. Генеративная модель не использовалась для автоматической обработки данных или генерации итоговых графиков без участия автора, а выступала исключительно как инструмент консультационной и методической поддержки.
Использование генеративной модели позволило ускорить процесс работы, повысить качество структуры проекта и сосредоточиться на аналитической интерпретации данных и визуальном оформлении результатов.
Ссылки
Ссылка на используемую модель: https://openai.com/chatgpt