
目 录
1. 课题来源.................................................................................................................4
2. 任务描述.................................................................................................................4
2.1. 课题的总体结构 ..........................................................................................4
2.2. 核心功能模块与类设计 ..............................................................................4
2.3. 任务分工与工作量说明 ..............................................................................4
3. 程序(系统)详细设计.........................................................................................4
4. 程序(系统)实现与测试.....................................................................................5
5. 分析与讨论.............................................................................................................5
6. 结束语.....................................................................................................................5
1. 课题来源
课题名称:职手可热
课题来源:数据获取与预处理的实训选题,此课题在四个课题中属于较难的
一个,十分具备挑战性,适合喜欢解决难题的同学。
该课题主要爬取的内容为人才网的工作岗位信息。我选择此课题的原因是该
课题难度系数高,挑战性强,可以在实现该课题的过程中学习到更多的知识内容。
2. 任务描述
该课题要求爬取目标网站:https://www.51job.com 中,输入关键字后工作岗
位的基本信息如岗位名字、岗位薪资、base 地、福利、岗位要求、岗位需求公司、
发布日期、公司所属行业、公司性质、招聘岗位简介、公司简介等,爬取过程中
需要注意网页反爬机制。
(1)编写代码,模仿浏览器人为操作,通过关键字爬取人才网的职位信息;
(2)将爬取到的网页信息进行信息预处理、清洗等。
(3)将处理完的数据存储在 Mysql 数据库中,数据库名为 job,或者数据存
储在名为 job 的 Excel 表格或名为 job 的记事本文件中。
(4)用数据可视化处理数据,生成岗位在地图上面的热力图、热门地区岗