ISSN 2225-7551

DOI:

Автор:

Литвинов В.В., Чернігівський національний технологічний університет, м. Чернігів, Україна

Мойсеєнко О.П., Чернігівський національний технологічний університет, м. Чернігів, Україна

Мова статті: російська

Анотація:

Розглянуто принципи об’єднання схожих текстових документів у тематичні кластери, механізми формування центрів кластерів та правила зупинки процесу автоматичної кластеризації. Детально описані основні характеристики кластера та види кластеризації. Зроблений відступ у бік ітеративних методів як таких, що придатні для роботи з великими колекціями документів і тому, що саме на них ґрунтується розроблювана система автоматизованої обробки великих об’ємів динамічної текстової інформації. Розроблювана система націлена на виконання функ­цій пошуку, класифікації та кластеризації текстових документів за запитами користувача.

Ключові слова:

колекція документів, центр кластера, неієрархічна кластеризація, обробка текстових документів

Використана література:

1. Словари и энциклопедии. Кластерный анализ [Электронный ресурс]. – Режим доступа : http://dic.academic.ru/dic.nsf/enc_psychology/349/Кластерный.

2. Задачи кластерного анализа [Электронный ресурс]. – Режим доступа : http://ru.science.wikia.com/wiki/Кластерный_анализ.

3. Методы кластерного анализа [Электронный ресурс]. – Режим доступа : http://bug.kpi.ua/stud/work/RGR/DATAMINING/clusteranalisismethods.html.

4. Факторный, дискриминантный и кластерный анализ : пер. с англ. / Дж.-О. Ким, Ч. У. Мьюл­лер, У. Р. Клекка и др. ; под ред. И. С. Енюкова. – М. : Финансы и статистика, 1989. – 215 с.

5. SVM-Light Support Vector Machine [Электронный ресурс]. – Режим доступа : http://www.svmlight.joachims.org.

6. Литвинов В. В. Автоматизованная система обработки динамических коллекций разно­язычных текстовых документов по морскому и речному делу / В. В. Литвинов, О. П. Мойсеенко // Математические машины и системы. – 2014. – № 2. – С. 59–64.

Переглянути статтю    Завантажити pdf