
В данном исследовании используется набор данных, представленный в табличной форме в открытом доступе на сайте «Gigasheet», и содержащий информацию о звездах. Таблица включает числовые параметры: светимость, радиус, звездная величина и тип, а также категориальные признаки: цвет и класс.

Я выбрала данные о звездах для анализа, потому что меня всегда интересовала астрономия, и этот набор данных позволяет практиковаться в анализе без нужды в глубоких астрономических знаниях. Цель — проверить на практике различные методы анализа данных на доступном и понятном примере.
Выбор данных для каждого типа графика обусловлен целесообразностью их визуализации с помощью именно этого типа графика. Например, распределение по классам лучше всего иллюстрируется столбчатой или круговой диаграммой, а взаимосвязь между двумя числовыми параметрами — точечной диаграммой.
Этапы
В первую очередь для написания кода были загружены библиотеки для работы с графиками и шрифтами, файл с таблицей и кастомный шрифт. Также для всех графиков была подобрана цветовая палитра с помощью Adobe Colour, напоминающая звёздное небо. Также с промптом «звёздное небо» была сгенерирована обложка проекта в нейросети Playground.


Палитра, созданная с помощью Adobe Color
Затем необходимо было обработать данные, убрав из них пустые ячейки, некорректные значения и изменить формат данных в подходящия для анализа, например перевести строки в числа и так далее.
Далее необходимо было перейти к построению графиков. На дланном этапе использовался чат GPT для решения возникающих проблем, нахождения ошибок в коде и подборе оптимальных методов построения. Например, поиск способов убрать сетку графика, белую обводку столбцов, создать легенду графика и переместить её в необходимое место. Далее этот же шаблон применялся при построении каждого графика.
В конце осталось лишь разместить код более удачно в рамках картинки и сохранить её в хорошем разрешении.
Графики
Частота встречаемости разных классов звёзд
Этот график показывсает, что чаще всего встречаются звёзды класса М — самого низкого из всех, а затем классы В и О — которые напротив занимают первое и второе место в классификации.
При этом следующий график демонстрирует, что звёзды класса M являются самыми маленькими, тогда как А имеют самый большой средний радиус.
Соотношение среднего радиуса звёзд и их класса
Зависимость цвета звёзд от температуры
Это т график показывает, как температура звёзд напрямую влияет на их цвет.
Как изменяется количество звезд в зависимости от свечения
И последней зависимостью, которую я исследую, является уровень светимости звёзд. Для этого я разделила все данные о светимости на пять равных интервалов и подсчитала количество звёзд в каждом.
Ссылки