Главная страница
russian   english
16+
<< назад

Название статьи

РАСПРЕДЕЛЕННАЯ РЕАЛИЗАЦИЯ ПОСТРОЕНИЯ ИНДЕКСА ПОИСКОВОГО КАТАЛОГА


Номер журнала
1
Дата выпуска
2011

Тип статьи
научная статья
Коды УДК
025.4.03; 002.53:004.65
Страницы
201-204
Ключевые слова
индексирование, поисковый каталог

Авторы
Борисюк Федор Владимирович

Место работы
Борисюк Федор Владимирович
Нижегородский госуниверситет им. Н.И. Лобачевского


Аннотация
Рассматривается задача построения индекса текстовой коллекции документов поискового каталога с использованием платформы для распределенных вычислений Apache Hadoop. Основное внимание уделяется применению парадигмы MapReduce к решению поставленной задачи. Приводятся результаты вычислительных экспериментов.

Загрузить статью

Библиографический список
1 . Arasu A., Cho J., Garcia-Molina H. et al. Search-ing the Web // ACM Transactions on Internet Technolo-gy (TOIT). 2001. V. 1. P. 2 - 43.
2 . Borisyuk F., Shvetsov V. Adaptation of Hierar-chical Clustering by Areas for Automatic Construction of Electronic Catalogue // Proceedings of the 4th Spring/Summer Young Researchers' Colloquium on Software Engineering. 2010. P. 141-145.
3 . Dean J., Ghemawat S. MapReduce: Simplified Da-ta Processing on Large Clusters // Communications of the ACM. 2008. V. 51. P. 107-113.
4 . Официальная Веб-страница проекта Apache Hadoop [Электронный ресурс]. - Электрон. дан. - Режим доступа: http://hadoop.apache.org/, свободный.
5 . Kelleher D., Luz S. Automatic Hypertext Keyphrase Detection // Proceedings of the Nineteenth International Joint Conference on Artificial Intelligence. Edinburgh, Scotland, UK. 2005. P. 1608-1610.
6 . Алгоритм выделения псевдооснов Мартина Портера [Электронный ресурс]. - Электрон. дан. - Режим доступа: http://snowball.sourceforge.net, сво-бодный.