python爬取淘宝天猫评论(通过cookie)

本文介绍如何使用Python通过Cookie爬取淘宝天猫商品评论。详细步骤包括分析产品页面,找到包含评论数据的script文件,理解URL和请求头中的Cookie及Referer需求,并提供完整源码。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

今天分享的是使用python语言然后通过cookie来爬取淘宝天猫评论的方法。

1、首先我们打开一个产品页,地址:几素usb小风扇,按下F12,然后下拉到产品评论可以看到如下图

在这里插入图片描述

2、点击这个script的文件,然后点preview进去看可以看到

在这里插入图片描述

3、可以看到我们需要爬取的内容全在这个script文件中了,接下来我们来分析这个文件,首先是url

在这里插入图片描述

4、然后是请求头,因为淘宝的反爬策略需要你将cookie和referer加入请求头中才有数据返回

在这里插入图片描述
完整源码如下:

# -*- coding: utf8 -*-
import requests
import simplejson
import json
import time
import random
import pymysql

db = pymysql.connect(host='localhost', user='root', password='root', db='data', charset='utf8mb4')
cursor = db.cursor()
sql_insert = 'INSERT INTO tianmao(productid, tm_date,tm_name,tm_productcolor,tm_content,tm_addcontent) ' \
             'VALUES (%s, %s, %s, %s, %s, %s)'
base_url = 'https://rate.tmall.com/list_detail_rate.htm?itemId=586696084498&spuId=1149458431&sellerId=2453972737&order=1&append=0&content=1&tagId=&posi=&picture=&groupId='
header =
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值