Original size 2480x3500

Обучение генеративной нейросети Stable Diffusion под стиль Кандинского

PROTECT STATUS: not protected

цель данного проекта — исследовать возможности генеративных нейросетей для создания изображений в стиле одного из величайших художников авангарда XX века, Василия Кандинского

картины Кандинского

стиль Кандинского был новаторским и многослойным, отличавшимся абстракцией, динамикой формы и яркостью цвета. Основное внимание было уделено передаче эмоций и впечатлений через цвета и геометрические формы

картины Кандинского

проект использует алгоритм Stable Diffusion, чтобы воссоздать уникальные визуальные элементы, характерные для картин Кандинского, в цифровом формате

картины Кандинского

процесс обучения нейросети

первым делом я собрала датасет из картин художника, изменив формат под подходящее для нейросети разрешение

big
Original size 2549x493

далее — я подготовила среду: установила зависимости, загрузила необходимые библиотеки и проверила доступность GPU

big
Original size 1142x210

следующий шаг — подготовка данных: создается директория для хранения данных и загружаются изображения, стилизованные под Кандинского

Original size 1086x172

затем — настройка параметров обучения

для дообучения модели используется DreamBooth с LoRA-адаптацией. Основные параметры:

Модель: Stable Diffusion XL

Метод адаптации: LoRA (Low-Rank Adaptation)

Обучающий датасет: набор изображений в стиле Кандинского

Гиперпараметры: количество шагов, скорость обучения (learning rate), параметры генерации

пример настройки гиперпараметров:

Original size 1139x463

следующий шаг — запуск обучения

тренировка модели проводится с использованием загруженного скрипта DreamBooth

после обучения модель используется для создания изображений в стиле Кандинского

сгенерированные изображения

сгенерированные изображения

итоговый результат

Генерация изображений позволила получить несколько вариантов в духе Кандинского, с характерными чертами:

- Геометрические формы: круги, линии, трапеции, расположенные в динамичной композиции.

- Контрастные цвета: яркие, насыщенные палитры, передающие эмоциональную выразительность.

- Абстрактный стиль: отказ от реалистичных объектов в пользу чистой формы и цвета.

- Движение и баланс: игра между хаосом и структурой, создающая визуальную динамику.

сгенерированные изображения

характеристики итоговых изображений

Композиция и геометрия

Генеративная нейросеть успешно воспроизвела характерные формы, встречающиеся в работах Кандинского: круги, прямые и изогнутые линии, многослойные фигуры.

Некоторые изображения получили четкую структурированность, другие демонстрируют хаотичные формы, создавая эффект спонтанности.

сгенерированные изображения

Цветовые решения

Присутствуют характерные для художника сочетания контрастных цветов.

сгенерированные изображения

Текстуры и детализация

DreamBooth LoRA позволил сохранить текстурные особенности оригинального стиля, при этом сохранив высокое качество деталей.

В некоторых вариациях заметно влияние работы нейросети с шумами и цветовыми артефактами, которые могут быть интерпретированы как цифровая имитация мазков кисти.

связь с первоначальной идеей проекта

Проект был направлен на исследование возможности генеративного ИИ в создании изображений, стилизованных под работы Кандинского. Итоговые изображения демонстрируют, что нейросеть:

Успешно распознала ключевые элементы стиля художника и воспроизвела их.

Добавила новые вариации, создавая оригинальные интерпретации его работ.

Внесла неожиданные решения, сохранив дух абстрактной композиции.

сгенерированные изображения

дополнительные методы улучшения

Для повышения качества изображений использовались:

Upscaling (повышение разрешения): улучшение четкости мелких деталей.

Fine-tuning: дополнительная адаптация модели для лучшего переноса стиля.

Разные текстовые промпты: экспериментирование с описанием сцены для получения разнообразных вариаций.

сгенерированные изображения

визуальный анализ итоговых изображений

Разные сгенерированные изображения отличаются как композицией, так и балансом форм.

Нейросеть создала вариации, некоторые из которых ближе к раннему периоду творчества Кандинского, а другие напоминают его поздние работы.

Экспериментирование с параметрами привело к различным уровням детализации — от минималистичных форм до сложных структурированных композиций.

сгенерированные изображения

использование нейросетей в проекте

- ChatGPT (для написания экспликации, сжатия процесса обучения нейросети и дальнейшего пошагового описания, аналитики, корректировки структуры проекта)

- Mistral.ai (в помощи написания кода)

- Upscaler (для повышения разрешения и детализации итоговых изображений)

- Adobe Photoshop AI (для обложки проекта)

Обучение генеративной нейросети Stable Diffusion под стиль Кандинского