РАСПРЕДЕЛЕННАЯ РЕАЛИЗАЦИЯ ПОСТРОЕНИЯ ИНДЕКСА ПОИСКОВОГО КАТАЛОГА |
1 | |
2011 |
научная статья | 025.4.03; 002.53:004.65 | ||
201-204 | индексирование, поисковый каталог |
Рассматривается задача построения индекса текстовой коллекции документов поискового каталога с использованием платформы для распределенных вычислений Apache Hadoop. Основное внимание уделяется применению парадигмы MapReduce к решению поставленной задачи. Приводятся результаты вычислительных экспериментов. |
1 . Arasu A., Cho J., Garcia-Molina H. et al. Search-ing the Web // ACM Transactions on Internet Technolo-gy (TOIT). 2001. V. 1. P. 2 - 43. 2 . Borisyuk F., Shvetsov V. Adaptation of Hierar-chical Clustering by Areas for Automatic Construction of Electronic Catalogue // Proceedings of the 4th Spring/Summer Young Researchers' Colloquium on Software Engineering. 2010. P. 141-145. 3 . Dean J., Ghemawat S. MapReduce: Simplified Da-ta Processing on Large Clusters // Communications of the ACM. 2008. V. 51. P. 107-113. 4 . Официальная Веб-страница проекта Apache Hadoop [Электронный ресурс]. - Электрон. дан. - Режим доступа: http://hadoop.apache.org/, свободный. 5 . Kelleher D., Luz S. Automatic Hypertext Keyphrase Detection // Proceedings of the Nineteenth International Joint Conference on Artificial Intelligence. Edinburgh, Scotland, UK. 2005. P. 1608-1610. 6 . Алгоритм выделения псевдооснов Мартина Портера [Электронный ресурс]. - Электрон. дан. - Режим доступа: http://snowball.sourceforge.net, сво-бодный. |