DOI:
Автор:
Литвинов В.В., Чернігівський національний технологічний університет, м. Чернігів, Україна
Мойсеєнко О.П., Чернігівський національний технологічний університет, м. Чернігів, Україна
Мова статті: російська
Анотація:
Розглянуто принципи об’єднання схожих текстових документів у тематичні кластери, механізми формування центрів кластерів та правила зупинки процесу автоматичної кластеризації. Детально описані основні характеристики кластера та види кластеризації. Зроблений відступ у бік ітеративних методів як таких, що придатні для роботи з великими колекціями документів і тому, що саме на них ґрунтується розроблювана система автоматизованої обробки великих об’ємів динамічної текстової інформації. Розроблювана система націлена на виконання функцій пошуку, класифікації та кластеризації текстових документів за запитами користувача.
Ключові слова:
колекція документів, центр кластера, неієрархічна кластеризація, обробка текстових документів
Використана література:
1. Словари и энциклопедии. Кластерный анализ [Электронный ресурс]. – Режим доступа : http://dic.academic.ru/dic.nsf/enc_psychology/349/Кластерный.
2. Задачи кластерного анализа [Электронный ресурс]. – Режим доступа : http://ru.science.wikia.com/wiki/Кластерный_анализ.
3. Методы кластерного анализа [Электронный ресурс]. – Режим доступа : http://bug.kpi.ua/stud/work/RGR/DATAMINING/clusteranalisismethods.html.
4. Факторный, дискриминантный и кластерный анализ : пер. с англ. / Дж.-О. Ким, Ч. У. Мьюллер, У. Р. Клекка и др. ; под ред. И. С. Енюкова. – М. : Финансы и статистика, 1989. – 215 с.
5. SVM-Light Support Vector Machine [Электронный ресурс]. – Режим доступа : http://www.svmlight.joachims.org.
6. Литвинов В. В. Автоматизованная система обработки динамических коллекций разноязычных текстовых документов по морскому и речному делу / В. В. Литвинов, О. П. Мойсеенко // Математические машины и системы. – 2014. – № 2. – С. 59–64.