ГЛАВНАЯ
> Вернуться к содержанию
Статьи автора Каранина Светлана Юрьевна
Кибернетика и программирование, 2018-1
|
Беликова М.Ю., Каранина С.Ю., Глебова А.В. - Экспериментальное сравнение алгоритмов кластеризации в задаче группировки данных о грозовых разрядах |
|
c. 15-26
|
DOI: 10.25136/2644-5522.2018.1.25261
Аннотация: В данной статье представлены результаты экспериментального сравнения кластерного анализа данных о грозовых разрядах алгоритмами k-means, dbscan и иерархическими агломеративными алгоритмами, где для вычисления межкластерного расстояния используются методы ближайшего соседа, полной и средней связи и метод Уорда. Произведена оценка влияния нормировочных параметров на количество кластеров, определяемых рассматриваемыми алгоритмами на тестовой выборке. В качестве тестовой выборки были использованы данные о времени регистрации и координаты грозовых разрядов, зафиксированные Всемирной сетью локализации молний (World Wide Lightning Location Network, WWLLN). Построение группировочных решений выбранными алгоритмами кластеризации производились с помощью па-кетов кластерного анализа Nbclust, dbscan и fpc, разработанных на языке R. Показано, что выбор значений нормировочных параметров имеет существенное влияние на количество выделяемых кластеров из рассматриваемой выборки при использовании иерархических алгоритмов кластеризации (особенно для метода ближайшего соседа). Выбор нормировочных параметров практически не влияет или оказывает незначительное влияние на результаты кластеризации грозовых разрядов с помощью алгоритмов k-means и dbscan. Наилучшее согласование с экспертной оценкой получено для алгоритма dbscan при нормировочных параметрах соответствующих линейным размерам грозовой конвективной ячейки 100 км и времени существования от 30 минут до часа.
|