# weixinSpider
> weixin spider, wechat spider, crawl, 微信爬虫,微信万能key,微信阅读数采集,搜狗微信转永久url链接,微信评论采集,微信公众号采集
提供技术解决方案,解决微信相关的采集需求。帮助采集小伙伴解决技术壁垒。
# 实现的功能
- 文章评论内容采集
- 文章内容采集
- 搜狗微信转永久URL采集
- 公众号信息采集
- 公众号推送文章采集
- 公众号历史数据采集
- 视频号相关采集(开发中)
- ...
## 联系方式
- 电报(推荐) https://t.me/xxxweixin
- 邮箱:[email protected]
- potato账号(推荐)

# 技术方案
## 万能key
在获取阅读数或者评论数据时需要uin和key。每次请求key是变换的,微信有一个万能key,可以一直持续获取,只要保持更新就行了。
代码参考
```python
def get_rsp(self, uin, key, __biz, mid, sn, idx, comment_id):
headers = {
"Host": "mp.weixin.qq.com",
"origin": "https://mp.weixin.qq.com",
"x-requested-with": "XMLHttpRequest",
"user-agent": "自行替换,Mozilla/5.0...............",
"content-type": "application/x-www-form-urlencoded; charset=UTF-8",
"accept": "*/*",
"sec-fetch-site": "same-origin",
"sec-fetch-mode": "cors",
"sec-fetch-dest": "empty",
"accept-language": "zh-CN,zh;q=0.9,en-US;q=0.8,en;q=0.7"
}
url = "https://mp.weixin.qq.com/mp/getappmsgext"
params = {
"f": "json",
"mock": "",
"uin": uin,
"key": key,
"wxtoken": "777",
"devicetype": "Windows 11 x64",
"clientversion": "63060012",
"__biz": __biz,
"x5": "0"
}
data = {
# "r": "0.6980405644408527",
"__biz": __biz,
"appmsg_type": "9",
"mid": mid,
"sn": sn,
"idx": idx,
# "scene": "126",
"abtest_cookie": "",
"devicetype": "Windows 11 x64",
"version": "63060012",
"is_need_ticket": "0",
"is_need_ad": "0",
"comment_id": comment_id,
"is_need_reward": "0",
"both_ad": "0",
"reward_uin_count": "0",
"send_time": "",
"msg_daily_idx": "8",
"is_original": "0",
"is_only_read": "1",
"is_temp_url": "0",
"item_show_type": "0",
"tmp_version": "1",
"more_read_type": "0",
"appmsg_like_type": "2",
"related_video_sn": "",
"related_video_num": "5",
"vid": "",
"is_pay_subscribe": "0",
"pay_subscribe_uin_count": "0",
"has_red_packet_cover": "0",
"album_video_num": "5",
"cur_album_id": "undefined",
"is_public_related_video": "NaN",
"encode_info_by_base64": "undefined",
"exptype": ""
}
# response = requests.post(url, headers=headers, cookies=None, params=params, data=data, verify=False)
response = requests.post(url, headers=headers, cookies=None, params=params, data=data, )
# print(response.text)
return response
```


## 微信公众号推送采集
实时获取微信推送数据采集


## 微信历史数据采集

## 微信文章官方文章API接口
微信官方提供的数据api接口,搜狗微信也可以使用哦。

## 其他功能
需要其他功能,可以联系我
> seo:weixin spider, wechat spider, crawl, 微信爬虫,微信万能key,微信阅读数采集,搜狗微信转永久拦截,微信评论采集,微信公众号采集

JJJ69
- 粉丝: 6460
最新资源
- PHOTOSHOP说课稿.doc
- 计算机专业职业生涯规划书样本.doc
- c语言初学必背代码.doc
- 思科系统公司的无线网络帮助密尔沃基儿童医院改进患者服务.docx
- 物联网行业应用及技术.doc
- COMSOL激光熔覆技术详解:模型与视频教程助力高效表面改性 详解
- (源码)基于ROS和ChibiOS的移动机器人实时控制系统.zip
- 武汉智慧城市概念设计方案终稿.docx
- 网络营销技术组合.pptx
- 设计企业信息化解决方案.doc
- 项目管理的特点[最终版].pdf
- 2022年会计职称计算机考试题库.doc
- 2023年ORACLE定时备份方案.doc
- 企业会计学网络实验指导书.doc
- 山东省淄博市应用软件开发公司名录2019版762家.pdf
- 2023年二级C语言公共基础知识.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈


