
«Секс в большом городе» — не просто сериал о дружбе и отношениях. На протяжении шести сезонов он фиксирует изменения в том, как женщины говорят о себе, любви, работе и жизни в целом. Язык героинь становится инструментом, через который можно проследить культурные и социальные сдвиги конца 1990-х и начала 2000-х годов. Именно поэтому проект посвящён анализу диалогов сериала «Секс в большом городе».
Через разговоры формируются характеры персонажей, задаётся тон повествования и отражаются актуальные для эпохи темы. Меняется не только сюжет, но и лексика, эмоциональная окраска, частота упоминания определённых тем — от романтических отношений до вопросов самореализации и независимости.
Тем самым, через количественный и текстовый анализ реплик ключевых персонажей исследуется, как язык отражает характеры героинь, доминирующие темы сериала и эмоциональную динамику повествования.
Визуальная стилистика проекта

Визуальная система проекта выстроена в сдержанном редакционном ключе и отсылает к эстетике Нью-Йорка конца 1990-х годов, тому периоду, когда формировался сериал. Данная стилистика не конкурирует с содержанием, а подчёркивает аналитический характер исследования и позволяет сосредоточиться на данных.

Типографической основой проекта стал шрифт Helvetica Neue. Его нейтральный характер, высокая читаемость и редакционное звучание позволяют сохранить аналитическую дистанцию и объединить все визуализации в единую, целостную систему.
методы исследования
Исследование основано на анализе текстового датасета, содержащего диалоги всех сезонов сериала «Секс в большом городе». В качестве исходных данных используются реплики персонажей с указанием сезона и эпизода, что позволяет рассматривать сериал как последовательный корпус текстов и анализировать его во временной динамике.
Датасет был взят с сайта Kaggle https://www.kaggle.com/datasets/snapcrack/every-sex-and-the-city-script?resource=download
Анализ сочетает в себе методы описательной статистики и базового текстового анализа. Рассматриваются изменения объёма и плотности диалогов по сезонам, распределение речевой активности между персонажами, а также динамика тематических акцентов, выявленных через частотный анализ ключевых слов.
Результаты исследования представлены в виде серии визуализаций разных типов (линейный график с трендом, горизонтальная столбчатая диаграмма, площадная диаграмма, ткруговая диаграмма), каждая из которых отвечает на отдельный аналитический вопрос.
подготовка данных
Сначала я импортировала библиотеки и загрузила датасет.
Далее через .columns и .info () вывела список столбцов и их типы данных. После повторного вызова df.columns на экране остались только четыре нужных столбца.
Я посчитала количество пропусков. Чтобы исправить ошибку преобразования типов, я удалила строки с пустыми значениями.
Следующее мое действие — приведение текста к нижнему регистру. После был создан новый столбец, объединяющий второстепенных персонажей в одну категорию.
Такой подход обеспечивает точность последующих вычислений и позволяет исследовать развитие языка и тематики сериала на надёжной аналитической основе.
Визуализация данных
График 1
Динамика словарного объёма по сезонам.
Линейный график показывает, как меняется среднее число слов в репликах по сезонам — от начала сериала к финалу.
Сериал демонстрирует выразительный языковой ритм: короткие реплики создают скорость и юмор, а длинные — смысл и напряжение. Пик длины реплик в 4–5 сезонах совпадает с кульминацией личных историй героинь. Это подтверждает, что лингвистика сериала напрямую связана со структурой повествования.
График 2
Структура реплик: распределение длины.
Данная диаграмма визуализирует, как распределено общее количество слов, произнесённых персонажами сериала. Здесь мы видим явного лидера и структурную асимметрию диалогов.
Диалоговая структура построена вокруг одного мощного голосового центра — Карри. Остальные героини формируют живой ансамбль, но ни одна не приближается к её количеству реплик.
Это подтверждает, что сериал рассказывает историю через одну женщину и её язык, который становится инструментом осмысления любви, секса, отношений и города.
График 3
Тематическая динамика сериала.
Площадная диаграмма отражает, как меняется частота ключевых тем (любовь, секс, дружба, карьера, семья) по сезонам.
График фиксирует смещение акцентов: в ранних сезонах доминируют романтические и сексуальные сюжеты, затем усиливается тема личного выбора, свободы и профессиональной самореализации. Темы дружбы и поддержки остаются неизменным ядром. Это подтверждает эволюцию повествования: сериал вырос от истории свиданий к истории зрелости.
График 4
Эмоциональная насыщенность сезонов: доли эмоционального индекса.
Этот круговой график показывает вклад каждого сезона в общий эмоциональный индекс сериала. Он помогает оценить, насколько выраженными были эмоциональные высказывания в разные периоды истории и были ли сильные колебания в эмоциональном накале.
Заключение
Анализ реплик в «Сексе в большом городе» показывает: язык сериала — не статичен, он меняется вместе с героинями. Средняя длина реплик, распределение объёма речи, уровень эмоциональности и его сезонные доли демонстрируют чёткую динамику.
Карри закономерно остаётся главным голосом истории, формируя её смысловую ось, но вклад других героинь усиливается по мере развития сюжета. В середине сериала наблюдается рост эмоциональной насыщенности — язык становится глубже, драматичнее и более личным.
Таким образом, сериал оказывается не просто развлекательным продуктом, а текстовым отражением зрелости, переживаний и культурных изменений эпохи.
Архив проекта
Описание применения генеративной модели
Я использовала генеративную модель ChatGPT 5.1 https://chatgpt.com/g/g-ZPlw6rlsN-gpt-5-1?locale=ru-RU чтобы корректировать, а также писать код, в случае затруднений, для анализа данных. Это позволило обеспечить успешную работу в Google Colab.