Главная страница
russian   english
16+
<< назад

Название статьи

НОВЫЙ МЕТОД ПОИСКА НА ОСНОВЕ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ ПО ОБЛАСТЯМ ТЕКСТОВЫХ ДОКУМЕНТОВ


Номер журнала
4
Дата выпуска
2009

Тип статьи
научная статья
Коды УДК
025.4.03; 002.53:004.65
Страницы
165-171
Ключевые слова
Интернет-поиск, кластеризация, дерево областей

Авторы
Борисюк Ф.В.
Швецов В.И.

Место работы
Борисюк Ф.В.
Нижегородский госуниверситет им. Н.И. Лобачевского

Швецов В.И.
Нижегородский госуниверситет им. Н.И. Лобачевского


Аннотация
Рассмотрены вопросы развития систем информационного поиска, усовершенствования классификационных и словарных информационно-поисковых систем (ИПС). Раскрыты общие аспекты построения системы нового поколения, в которой объединяются достоинства классификационных и словарных ИПС. Представлен новый подход к кластеризации текстовых документов, размещенных в сети Интернет, на основе предлагаемого в статье алгоритма «Иерархическая кластеризация по областям».

Загрузить статью

Библиографический список
1 . Arasu A., Cho J., Garcia-Molina H., Paepcke A., Raghavan S. Searching the Web // ACM Transactions on Internet Technology (TOIT). 2001. V. 1. P. 2-43
2 . Kelleher D., Luz S. Automatic Hypertext Keyphrase Detection // Proceedings of the Nineteenth International Joint Conference on Artificial Intelligence, Edinburgh, Scotland, UK. 2005. P. 1608-1610
3 . Li W. Random texts exhibit Zipf's-law-like word frequency distribution // Information Theory, IEEE Transactions. 1992. V. 38. P. 1842-1845
4 . Zamir O., Etzioni O. Grouper: a dynamic clustering interface to Web search results // Computer Networks. 1999. V. 31. N. 11-16. P. 1361-1374
5 . Eissen S.M., Stein B., Potthast M. The Suffix Tree Document Model Revisited // Proceedings of the 5th International Conference on Knowledge Management (I-KNOW 05). 2005. P. 596-603
6 . Arthur D., Vassilvitskii S. How Slow is the k-Means Method? // Proceedings of the Twenty-second annual symposium on Computational geometry table of contents, Sedona, Arizona, USA. 2006. P. 144-153
7 . Ester M., Kriegel H.-P., Jцrg S., Xu X. A density-based algorithm for discovering clusters in large spatial databases with noise // Proceedings of the 2nd International Conference on Knowledge Discovery and Data Mining (KDD-96). 1996. P. 226-231