- 博客(35)
- 资源 (4)
- 收藏
- 关注
原创 Hadoop学习之工作流调度Azkaban
Hadoop学习之工作流调度Azkaban+azkaban任务调度mapreduce+azkaban任务调度hive+mysql数据库安装
2022-02-18 15:48:37
3270
原创 文本挖掘-实战记录(二)基于NMF和LDA模型的文本关键词提取和文档聚类
文本挖掘-实战记录(二)基于NMF和LDA模型的文本关键词提取和文档聚类
2022-01-16 12:16:45
6045
3
原创 文本挖掘-实战记录(一)新闻文本nmi降维+分类训练
nmi降维+Svc支持向量机+逻辑斯蒂分类+高斯朴素贝叶斯+随机森林+Knn+AdaBoost
2022-01-16 12:01:43
2603
原创 数据挖掘-实战记录(三)超市关联规则实验+mlxtend实现及其分析报告
数据挖掘-实战记录(三)超市关联规则Apriori实验+mlxtend实现及其分析报告
2022-01-16 11:17:45
12339
7
原创 网络爬虫-实战检验(一)scrapy爬取公考雷达网站首页顶部链接中的各个职位概括信息以及地点内容+mongdb+Middlewares中间件
网络爬虫-实战检验(一)scrapy爬取公考雷达网站首页顶部链接中的各个职位概括信息以及地点内容+mongdb+Middlewares中间件
2022-01-15 21:03:26
2207
原创 网络爬虫-学习记录(一)初步爬取豆瓣电影榜单
一、任务1.爬取豆瓣榜单第一的电影详细内容2.爬取豆瓣近期热门榜单的所有电影详细内容二、描述任务1.url:https://maoyan.com/board2.使用urllib库request模板中的urlopen函数获得请求数据,获取页面信息后运用beautifulSoup库定位HTML标签找到需要的网页信息(运用BeautifulSoup库中find和findAll函数进行标签定位查找)3.进行异常处理三、运用的库和模块1.Urllib库的request模块2.Bea
2022-01-15 18:55:25
757
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人