
IKEA — основанная в Швеции нидерландская производственно-рознично торговая группа, одна из крупнейших в мире торговых сетей по продаже мебели и товаров для дома.
Введение
Мое знакомство с IKEA началось не с покупки мебели, а с того особого чувства домашнего уюта, которое дарит их знаменитый каталог. Я хорошо помню, как в детстве мы с родителями впервые зашли в огромный сине-желтый лабиринт магазина. Для меня это было похоже на путешествие в другой мир, где за каждым поворотом скрывалась новая идеальная комната: от крошечной кухни, пахнущей выпечкой, до сказочной детской с мягкими игрушками. IKEA научила меня тому, что дизайн это не роскошь для избранных, а своего рода конструктор, из которого каждый может собрать свою уникальную реальность.
С годами детский восторг сменился любопытством исследователя. Мне стало интересно: как компании удается десятилетиями сохранять баланс между доступной ценой, функциональностью и узнаваемым стилем? Теперь я смотрю на IKEA не просто как на магазин, а как на огромную экосистему, которую можно изучить с помощью цифр. Для меня этот проект как способ заглянуть за кулисы шведского гиганта и с помощью кода понять логику создания их огромного ассортимента.
Именно поэтому для анализа данных я выбрала датасет о товарах Икея «IKEA Furniture Dataset» с сайта kaggle.com. Он включает в себя категории мебели, цены, информацию о возможности онлайн-заказа и габариты изделий. Данные я решила представить с помощью четырех видов графиков: столбчатых диаграмм для сравнения категорий, гистограмм для анализа ценовой политики, графиков рассеяния для поиска корреляции между размером и ценой, а также круговых диаграмм для наглядного распределения товаров.
Загрузка данных
Для работы я импортировала необходимые библиотеки: pandas для манипуляций с данными, numpy для проведения математических вычислений, а также matplotlib.pyplot и seaborn для создания эстетичных графиков в стиле бренда.
Основным источником данных послужил датасет «IKEA SA Furniture Web Scraping», который содержит подробную информацию об ассортименте шведского гиганта: от названий и категорий товаров до их точных габаритов (высота, ширина, глубина) и актуальных цен. Это позволит нам провести глубокий анализ не только структуры каталога, но и принципов ценообразования компании.

Обработка данных
Данные часто содержат технические ошибки и пропуски, которые могут исказить результаты. В исходном датасете IKEA было обнаружено, что почти у половины товаров отсутствуют габариты (глубина, высота или ширина).
Для корректного анализа я провела очистку: с помощью функции dropna () удалила строки с пропущенными значениями. Также я избавилась от лишних технических данных, удалив столбцы со ссылками и индексами. Главным этапом подготовки стало создание расчетного показателя — Volume (Объем). Перемножив очищенные данные о габаритах, я получила новую переменную, которая позволит мне в дальнейшем проверить связь между физическим размером мебели и её стоимостью.
Анализ данных
После подготовки чистого датасета я перешла к расчету ключевых статистических показателей, которые лягут в основу будущих графиков. В этой части кода решаются следующие задачи:
1. top_categories определяет топ-10 самых обширных категорий мебели: мы подсчитываем, сколько уникальных товаров представлено в каждой группе, и выбираем лидеров ассортимента;
2. online_distribution анализирует доступность товаров для дистанционной покупки: мы вычисляем процентное соотношение позиций, которые можно заказать онлайн;
3. price_size_correlation находит математическую связь между объемом мебели и её ценой: мы вычисляем корреляцию, чтобы понять, насколько сильно габариты влияют на конечную стоимость (результат — 0.83);
4. avg_price_by_category вычисляет средний чек для каждой категории: мы группируем данные по типам мебели и находим среднюю цену, чтобы выявить самые бюджетные и дорогие сегменты магазина;
5. top_designers выявляет 10 самых продуктивных дизайнеров IKEA: мы анализируем вклад авторов в создание ассортимента, подсчитывая количество разработанных ими товаров для бренда.
Оформление данных
Для создания атмосферы современного скандинавского дизайна я разработала кастомную тему оформления, вдохновленную фирменным стилем IKEA. В основе палитры лежат два главных цвета бренда: 0051BA (IKEA Blue) для основных данных и FFDA1A (IKEA Yellow) для акцентов.
Для визуализации результатов исследования я разработала кастомную тему оформления, имитирующую графический язык инструкций по сборке мебели IKEA. С помощью инструмента plt.rcParams я переопределила базовые настройки библиотеки, чтобы добиться эффекта технического чертежа.
Ключевым элементом стала акцентная черная обводка всех геометрических фигур и внешних границ графиков, что придает изображениям структурность и четкость. Также я переключила шрифты на семейство sans-serif (без засечек) и установила жирное, прописное начертание для заголовков. Такой минималистичный подход на идеально белом фоне позволяет сфокусировать внимание на данных, сохраняя узнаваемую лаконичность фирменного стиля бренда
Итоговые графики
[01] Топ-10 категорий по количеству товаров
[02] Доступность товаров для онлайн-заказа
[03] Связь между объемом и ценой товара
[04] Средняя цена в топ-10 категориях
[05] Топ-10 дизайнеров по количеству товаров
Заключение
Таким образом, в рамках проекта я провела детальный анализ данных о товарах IKEA. Работа включала несколько ключевых этапов: выбор и загрузку данных, предобработку, статистический анализ и создание инфографики в фирменном стиле бренда.
По итогам анализа я выявила несколько закономерностей:
1. Лидерство систем хранения: самые популярные категории это стеллажи и шкафы, что подчеркивает фокус бренда на функциональности дома. 2. Цифровизация: более 99% товаров доступны онлайн, что подтверждает эффективность e-commerce стратегии IKEA. 3. Зависимость цены от размера: выявлена сильная корреляция (0.83) между объемом мебели и её стоимостью. 4. Ценовые флагманы: кровати и диваны являются самыми дорогими категориями из-за сложности конструкций и объема материалов. 5. Роль дизайнеров: ассортимент формируется узким кругом ведущих дизайнеров, обеспечивающих единство стиля бренда.
Работа позволила применить навыки визуализации и глубже понять структуру бизнеса мирового ритейлера. На графиках отчетливо видно, как IKEA успешно балансирует между масштабом ассортимента и доступностью для покупателя.
Использованные инструменты и генеративные модели
1. Gemini — корректировка программного кода и аналитическая интерпретация графиков. 2. Google Colab — обработка первичного датасета и программная визуализация данных.