
Введение
В процессе поиска dataframe для моего проекта на сайте kaggle.com я нашла интересные данные об отзывах на рамен и решиля взять их, так как это блюдо японсокой кухни очень популярно не только на родине, но и во всём мире.
Этот датасет полезен для тех, кто хочет отфильтровать отывы и узнать, где и в каком формате рамен пользуется наибольшей популярностью.
Типы диаграмм: 1. Круговая диаграмма 2. Столбчатая диаграмма 3. График рассеяния 4. График «ящик с усами» (Box plot)
Данные типы диаграмм я выбрала, так как они наиболее наглядно позволяют сопоставить отзывы и типы раменов в разных странах.
Промпт: Super close-up zoom on ramen noodles
Этапы работы
Палитру я решила сделать на основе цветов рамена и цветов со сгенерированных изображений. Я выделила цвета на сайте Adobe Color. Выбранный шрифт: Courier New.
Итоговые графики
Круговая диаграмма показывает, какие страны чаще всего фигурируют в датасете. Судя по графику, Япония и Южная Корея занимают лидирующие позиции по количеству отзывов, что в целом неудивительно, так как это блюдо азиатской кухни.
Промпт: Girl is eating delicious ramen
Столбчатая диаграмма показала, что рамен в пакетах (Pack) в среднем получает более высокие оценки, чем в чашках (Cup) или контейнерах (Bowl). Это может указывать на то, что потребители считают пакетированный рамен более вкусным или аутентичным. Низкие оценки у контейнеров могут свидетельствовать о том, что этот формат менее популярен или же менее качественный.
Промпт: A big pack of ramen
График рассеяния демонстрирует, что оказывается высокие оценки не всегда гарантируют попадание в топ. Хотя есть определённая концентрация высоких оценок среди продуктов, попавших в топ, всё же многие рамены с рейтингами выше 4 звёзд не входят в топ. Скорее всего попадание в топ зависит не только от рейтинга, но и от других факторов, например, популярности бренда или предпочтений того или иного региона.
Промпт: Girl is eating delicious ramen
График «ящик с усами» показал, что разброс оценок варьируется от страны к стране. Например, в Японии медианный рейтинг выше, и оценки более стабильны.
В Сингапуре и Таиланде наблюдаются значительные разбросы, что может свидетельствовать о наличии как очень высоко оценённых, так и крайне низко оценённых продуктов.
В странах с узким ящиком (маленький размах) оценки более стабильны, что может говорить о постоянном качестве продукции.
Также интересным оказалось то, что страной с самым высоким средним рейтингом на рамен оказалась Бразилия.
Промпт: A real pack of ramen
Выводы
Подведу итоги. Первый график показал очевидный факт того, что большинство отзывов из Японии и Южной Кореи, посколько там это блюдо пользуется наибольшей популярностью. Однако Бразилия является лидером с самым высоким средним рейтингом на рамен (4.35).
Удивительно, но упаковка тоже влияет на восприятие качества: пакетированный рамен получает более высокие оценки.
Также попадание в топ не всегда зависит от высокой оценки, что указывает на дополнительные факторы.
Распределение рейтингов по странам отличается: в одних странах оценки стабильны, в других — разброс значителен.
Источники
Датасет с сайта kaggle.com URL: https://www.kaggle.com/
Цветовая палитра с Adobe Color. URL: https://color.adobe.com/ru/
Для подбора наиболее подходящих графиков и улучшения визуализации изпользовался ChatGPT (модель GPT-4o). URL: https://chatgpt.com/
Также для создания изображений на обложке и в проекте использовался RecraftAi. URL: https://www.recraft.ai/
Промпт на обложке: a pattern of plates with ramen
Блокнот и датасет
Ссылка на блокнот и датасет: https://disk.yandex.ru/d/QrIVFl3M9zcvBg