Original size 1552x2173

Рамен: визуализация данных

PROTECT STATUS: not protected
4

Введение

В процессе поиска dataframe для моего проекта на сайте kaggle.com я нашла интересные данные об отзывах на рамен и решиля взять их, так как это блюдо японсокой кухни очень популярно не только на родине, но и во всём мире.

Этот датасет полезен для тех, кто хочет отфильтровать отывы и узнать, где и в каком формате рамен пользуется наибольшей популярностью.

Типы диаграмм: 1. Круговая диаграмма 2. Столбчатая диаграмма 3. График рассеяния 4. График «ящик с усами» (Box plot)

Данные типы диаграмм я выбрала, так как они наиболее наглядно позволяют сопоставить отзывы и типы раменов в разных странах.

Original size 600x300

Промпт: Super close-up zoom on ramen noodles

Этапы работы

Палитру я решила сделать на основе цветов рамена и цветов со сгенерированных изображений. Я выделила цвета на сайте Adobe Color. Выбранный шрифт: Courier New.

Original size 3858x660

Итоговые графики

Original size 1432x1273
Original size 1382x970

Круговая диаграмма показывает, какие страны чаще всего фигурируют в датасете. Судя по графику, Япония и Южная Корея занимают лидирующие позиции по количеству отзывов, что в целом неудивительно, так как это блюдо азиатской кухни.

Original size 2048x1024

Промпт: Girl is eating delicious ramen

Original size 1600x867
Original size 1457x829

Столбчатая диаграмма показала, что рамен в пакетах (Pack) в среднем получает более высокие оценки, чем в чашках (Cup) или контейнерах (Bowl). Это может указывать на то, что потребители считают пакетированный рамен более вкусным или аутентичным. Низкие оценки у контейнеров могут свидетельствовать о том, что этот формат менее популярен или же менее качественный.

Original size 2048x1024

Промпт: A big pack of ramen

Original size 1870x1304
Original size 1357x675

График рассеяния демонстрирует, что оказывается высокие оценки не всегда гарантируют попадание в топ. Хотя есть определённая концентрация высоких оценок среди продуктов, попавших в топ, всё же многие рамены с рейтингами выше 4 звёзд не входят в топ. Скорее всего попадание в топ зависит не только от рейтинга, но и от других факторов, например, популярности бренда или предпочтений того или иного региона.

Original size 2048x1024

Промпт: Girl is eating delicious ramen

Original size 1812x1147
Original size 1410x597

График «ящик с усами» показал, что разброс оценок варьируется от страны к стране. Например, в Японии медианный рейтинг выше, и оценки более стабильны.

В Сингапуре и Таиланде наблюдаются значительные разбросы, что может свидетельствовать о наличии как очень высоко оценённых, так и крайне низко оценённых продуктов.

В странах с узким ящиком (маленький размах) оценки более стабильны, что может говорить о постоянном качестве продукции.

Original size 1263x359

Также интересным оказалось то, что страной с самым высоким средним рейтингом на рамен оказалась Бразилия.

Original size 2048x1024

Промпт: A real pack of ramen

Выводы

Подведу итоги. Первый график показал очевидный факт того, что большинство отзывов из Японии и Южной Кореи, посколько там это блюдо пользуется наибольшей популярностью. Однако Бразилия является лидером с самым высоким средним рейтингом на рамен (4.35).

Удивительно, но упаковка тоже влияет на восприятие качества: пакетированный рамен получает более высокие оценки.

Также попадание в топ не всегда зависит от высокой оценки, что указывает на дополнительные факторы.

Распределение рейтингов по странам отличается: в одних странах оценки стабильны, в других — разброс значителен.

Источники

Датасет с сайта kaggle.com URL: https://www.kaggle.com/

Цветовая палитра с Adobe Color. URL: https://color.adobe.com/ru/

Для подбора наиболее подходящих графиков и улучшения визуализации изпользовался ChatGPT (модель GPT-4o). URL: https://chatgpt.com/

Также для создания изображений на обложке и в проекте использовался RecraftAi. URL: https://www.recraft.ai/

Промпт на обложке: a pattern of plates with ramen

Блокнот и датасет

Ссылка на блокнот и датасет: https://disk.yandex.ru/d/QrIVFl3M9zcvBg

Рамен: визуализация данных
4