三、功能实现 1.数据的爬取、清洗与储存 2.索引构建 3.查询处理 4.查询结果排序 四、工作计划与阶段划分 1.准备阶段 2.分布式存储的构建阶段 3.索引模块设计阶段 4.查询模块设计阶段 5.排序模块设计以及优化阶段 6.界面开发 五、组织结构及分工 1.项目经理(1人) 2.系统架构师(1人) 3.后端开发工程师(2人) 4.前端开发工程师(2人) 5.测试工程师(2人) 六、质量测试和非功能性保证 1.质量保证 2.非功能性保证 ③文档倒排索引的实验报告 一、实验要求 二、实验环境 三、数据准备 四、环境的安装与配置 1.虚拟机的安装与配置 2.JDK与Hadoop的安装 3.Hadoop集群配置 4.Hadoop集群启动前准备 5.Zookeeper的安装与集群配置 6.HBase的安装与集群配置 7.Hadoop、Zookeeper、HBase集群启动 五、算法及实现 1.倒排索引Mapper阶段实现代码及实现说明 invertedindexmapper.java代码: Mapper阶段类与数据类型定义