Original size 3628x5120

Анализ архитектурных предпочтений сообщества Minecraft

PROTECT STATUS: not protected
The project is taking part in the competition

Для исследования была использована база данных processed_build_dataframe.csv, содержащая информацию о пользовательских постройках Minecraft с платформы PlanetMinecraft.com. Данный набор данных включает 808 записей с информацией о ссылках на страницы построек, тегах и категориях, размерах файлов скачивания, форматах файлов и путях к обработанным файлам схем. Выбор этой темы обусловлен уникальным положением Minecraft как культурного феномена с более чем 238 миллионами проданных копий и богатой экосистемой пользовательского контента. Анализ архитектурных предпочтений игроков представляет интерес как с точки зрения изучения цифрового творчества, так и для понимания эстетических трендов в игровых сообществах.

Почему эти данные интересны?

Minecraft — одна из самых популярных видеоигр XXI века, поэтому этот анализ актуален и может использоваться да улучшения игрового опыта потребителей. Пользовательские постройки в Minecraft представляют собой цифровые арт-объекты, отражающие творческие тенденции и архитектурные предпочтения игроков. Также технические параметры построек (размеры файлов, форматы, сложность) позволяют анализировать инфраструктуру пользовательского контента. Помимо этого, анализ демонстрирует возможность применения серьезных аналитических методов к развлекательному контенту.

Какие графики были сделаны

Для всестороннего анализа были реализованы пять типов визуализаций, каждый из которых представляет различные аспекты данных. Были созданы: столбчатая диаграмма с эффектом блоков травы для анализа популярности тегов, круговая диаграмма для распределения архитектурных стилей, гистограмма с логарифмической шкалой для анализа распределения размеров файлов, горизонтальная столбчатая диаграмма для сравнения форматов файлов и линейный график с острыми углами для изучения динамики популярности тегов. Выбор именно этих типов визуализаций обусловлен необходимостью охватить различные аспекты данных — от категориального анализа до временных трендов, а также продемонстрировать разнообразие подходов к представлению статистической информации.

Этапы работы

Первым делом я отправила запрос в нейросеть Deepseek.ai для того, чтобы сформировать основную палитру цветов, в которой будут сделаны все графики.

Создай единый стиль для визуализации данных в тематике Minecraft. Сначала предложи палитру из 6 цветов, вдохновленных блоками игры (например, коричневый, серый, зеленый, синий). Все графики должны быть в квадратных, «блочных» областях.

Original size 3486x997

Далее с помощью кода я загрузила файл CSV с данными о постройках Minecraft из указанного пути на компьютере и сохранила их в структурированную таблицу pandas под именем df. Это помогло внести библиотеку pandas и использовать ее данные для корректного анализа в будущем.

Original size 1405x336
Original size 2422x708

В исследовании в будущем применялись стандартные статистические методы, включая частотный анализ для определения популярности тегов, логарифмическое преобразование для работы с распределениями размеров файлов, кластеризацию по ключевым словам для категоризации архитектурных стилей и дескриптивную статистику для расчёта средних значений и квартилей. Для пятого графика, изучающего взаимосвязь между размером файлов и сложностью построек, применялся корреляционный анализ.

Работа с нейросетью

В исследовании активно использовалась нейросеть Deepseek.ai, как инструмент для аналитических целей и поддержки на некоторых этапах работы. Нейросеть не заменяла анализ данных, но помогала ускорять процесс и структурировать логику исследования, а также выделять предмет анализа.

«Помоги улучшить этот код, чтобы столбцы в столбчатой диаграмме состояли из двух цветов.»

Искусственный интеллект помогал исправлять ошибки в коде, так как часто надписи накладывались друг на друга или не вмещались в изображение.

«В горизонтальной столбчатой диаграмме подписи крупнейших файлов накладываются в правом нижнем углу (например, значения „48 MB“). Оптимизируй позиционирование подписей, чтобы они не пересекались, используя разные координаты Y для каждой подписи и смещая их по оси X для лучшей читаемости, сохранив красный цвет.»

Помимо этого, он совершенствовал код для визуализации и помогал делать столбцы более разнообразными и совершенствовать дизайн, внешний вид диаграмм. С помощью генерации были получены корректные и понятные краткие определения, а аналитические методы были переведены в понятный язык для лонгрида.

Создание графиков

В каждом графике данные анализировались отдельно, и код для анализа данных был записан вместе с кодом для создания графика. Так, не анализируя абсолютно все данные заранее написанным кодом, а исследуя только нужную мне информацию, была проведена работа над визуализацией.

Первый график

Original size 1387x786

График анализирует частотность использования тегов для поиска и категоризации построек в сообществе Minecraft. На основе 808 записей выявлено, что тег «Land Structure» является наиболее популярным поисковым критерием, существенно опережая остальные. Статистика показывает иерархию тегов по востребованности: после лидера следуют «House», «Medieval», «Modern» и другие категории, каждая с конкретным числом упоминаний.

Анализ демонстрирует, какие ключевые слова пользователи чаще всего используют для описания и поиска построек, что отражает не только архитектурные предпочтения, но и семантику поисковых запросов в сообществе. Разница в значениях между тегами указывает на значительное преобладание определённых категорий в пользовательском контенте и поисковом поведении.

Original size 1078x877

На первом этапе происходит импорт необходимых библиотек: matplotlib для создания графиков, numpy для математических операций с массивами, и Counter из стандартной библиотеки для подсчёта частоты элементов. Эти инструменты составляют основу для всего последующего анализа и визуализации данных, а далее внесение переменной палитры цветов.

Original size 1310x1087

Сначала извлекаются и анализируются теги из данных, затем строится график, где каждый столбец состоит из коричневой «земляной» основы и зелёной «травяной» верхушки, имитируя блоки травы из игры. Далее настраиваются оси, заголовки и подписи без жирных шрифтов и обводок, добавляется сетка и легенда.

Original size 1481x832

Далее используется похожая схема для создания всех графиков, меняется только сам принцип анализа и анализируемые данные.

Второй график

Original size 1384x1239

Этот код анализирует архитектурные стили построек Minecraft по тегам и создаёт круговую диаграмму распределения. Код определяет ключевые слова для 10 стилей (Medieval, Modern, Fantasy и др.), сопоставляет их с тегами построек и рассчитывает частоту каждого стиля.

График показывает, что Medieval-стиль (35.8%) является самым популярным, за ним следует Traditional (30.2%), а вместе они составляют более 60% всех проанализированных построек. Диаграмма визуализирует топ-7 стилей, исключая категорию «Other», и использует цвета из палитры Minecraft (коричневый для Medieval, серый для Modern и т. д.), чтобы показать пропорциональное соотношение архитектурных предпочтений игрового сообщества.

Original size 1308x1261
Original size 1305x1195

Написан код с использованием программы for и if для сбора самых популярных тегов и потом определяется стилистика каждой постройки. Далее высчитывается процент самых популярных тегов, и эти данные выносятся на диаграмму, где отмечаются разными цветами.

Original size 1305x1022
Original size 1230x626

Третий график

Original size 1166x729

Этот график анализирует распределение размеров файлов скачивания построек Minecraft и создаёт гистограмму в игровом стиле. Код преобразует размеры из байтов в мегабайты, вычисляет статистику (минимум, максимум, медиану, среднее) и строит гистограмму с логарифмической шкалой по оси X для наглядного отображения сильно различающихся значений.

График показывает, что большинство файлов (68.5%) имеют размер менее 10 MB, но существуют и крупные проекты до 49 MB. Гистограмма стилизована под блоки травы Minecraft с квадратной текстурой внутри столбцов, а красными стрелками отмечены три самых больших файла. Визуализация демонстрирует сильное смещение распределения вправо со средней 8.2 MB и медианой 3.5 MB, что указывает на преобладание небольших построек при наличии редких мега-проектов в сообществе.

0

Четвертый график

Original size 1587x786

Этот код анализирует временную динамику популярности тегов в последовательности построек Minecraft и создаёт линейный график с острыми углами в пиксельном стиле. Код извлекает первый тег из каждой постройки, определяет топ самых частых категорий и генерирует синтетические данные для демонстрации циклических колебаний популярности.

График показывает гипотетическую динамику изменения популярности пяти основных тегов во времени. Линии выполнены ступенчатыми с квадратными маркерами вместо плавных кривых, что имитирует пиксельную графику Minecraft, а вдоль каждой линии добавлены квадратные элементы текстуры для усиления игрового стиля. Визуализация демонстрирует, как интерес к разным категориям построек может циклически меняться с течением времени, сохраняя при этом общую устойчивость основных трендов в сообществе.

Original size 1340x1080
Original size 1376x1173
Original size 1380x860

Пятый график

Original size 1386x786

Этот график анализирует распределение форматов файлов построек Minecraft и создаёт горизонтальную столбчатую диаграмму в стилистике игры, похожую на блоки камня с водой. Код подсчитывает частоту каждого расширения файла (.zip, .rar, .schematic и др.) и строит график, где каждый столбец состоит из синей основной части (90% длины) и серой правой части (10%), что создаёт эффект, характерный для блоков Minecraft.

График показывает, что формат .zip является самым популярным (42.3%), за ним следуют .rar (28.1%) и .schematic (18.7%), что отражает предпочтения сообщества в упаковке и распространении построек. Красные числовые значения справа от столбцов указывают точное количество файлов каждого формата. Визуализация демонстрирует технические аспекты хранения пользовательского контента и преобладание стандартных архивных форматов над специализированными игровыми.

Original size 1388x1232
Original size 1517x920

Выводы исследования

Анализ данных о пользовательских постройках Minecraft выявил ключевые закономерности в творческом поведении сообщества, имеющие практическое значение для улучшения игрового опыта. Исследование показало предпочтение средневековых и современных архитектурных стилей, что отражает как эстетические тенденции, так и доступность соответствующих игровых ресурсов. Технический анализ выявил разделение на массовые небольшие проекты и специализированные сложные постройки, указывающее на разнообразие уровней мастерства в сообществе.

Практическая значимость результатов анализа заключается в возможности оптимизации систем поиска и рекомендаций контента: понимание популярных тегов, форматов файлов и технических характеристик позволяет создавать эффективные инструменты навигации по пользовательским творениям. Игрокам это даст более точный поиск нужных построек, создателям контента — лучшее понимание аудитории, а разработчиком дает шанс для совершенствования внутриигровых систем и разработке новых дизайнов блоков для построек.

Исследование демонстрирует, что анализ игрового контента предоставляет ценные данные не только о творческих предпочтениях сообщества, но и о практических аспектах взаимодействия с цифровыми средами, что может быть использовано для улучшения пользовательского опыта через адаптированные под реальные потребности инструменты и интерфейсы.