爬虫数据插入数据库

本文介绍了一种使用Python将爬取的数据保存到MySQL数据库的方法。通过连接本地数据库并创建表结构,可以批量插入爬虫抓取的信息,如标题、年份、公里数等字段。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

爬虫数据插入数据库

def save_mysql(self,title,year1,km,money,label,pic):
    mydb=pymysql.connect(host='localhost',user='root',passwd='3863599',database='pachong')
    cursor=pymysql.cursors.DictCursor
    print(mydb)

    mycon=mydb.cursor()

    mycon.execute('create table IF NOT EXISTS guazi(id INT AUTO_INCREMENT PRIMARY KEY ,title VARCHAR(255) ,year1 VARCHAR(255),km VARCHAR(255),money VARCHAR(255),label VARCHAR(255),pic VARCHAR(255))')
    # mycon.execute('show tables')
    mycon.execute('select * from guazi')
    for i in mycon:
        print(i)
    print((title,year1,km,money,label,pic))
    sql='insert into guazi (title,year1,km,money,label,pic)VALUES (%s,%s,%s,%s,%s,%s)'
    val=[(title,year1,km,money,label,pic)]
    mycon.executemany(sql,val)
    print(mycon.rowcount,'记录插入成功')
    # for i in mycon:
    #     print(i)
    mydb.commit()
对于Python爬虫数据导入数据库,您可以按照以下步骤进行操作: 1. 首先,确保您已经安装了Python和所需的数据库连接库,例如pymysql、psycopg2等。您可以使用pip命令安装这些库。 2. 导入所需的库和模块。通常需要导入数据库连接库和爬虫相关的库,比如requests、BeautifulSoup等。 3. 建立数据库连接。根据您使用的数据库类型,选择对应的数据库连接库,并使用连接参数(如主机名、用户名、密码等)建立连接。 4. 创建一个数据库表。您可以使用SQL语句来定义表结构,比如在MySQL中可以使用CREATE TABLE语句。 5. 在爬虫程序中,编爬虫逻辑,获取需要的数据。 6. 将数据插入数据库中。根据您选择的数据库连接库,使用相应的方法将数据插入数据库中。通常,您需要将数据转换为适合数据库插入的格式,比如将字典转换为SQL语句。 以下是一个简单的示例代码,假设您使用MySQL数据库和pymysql库: ``` import pymysql import requests from bs4 import BeautifulSoup # 建立数据库连接 conn = pymysql.connect(host='localhost', user='your_username', password='your_password', database='your_database') cursor = conn.cursor() # 创建数据表 create_table_sql = """ CREATE TABLE IF NOT EXISTS my_table ( id INT AUTO_INCREMENT PRIMARY KEY, title VARCHAR(255), content TEXT ) """ cursor.execute(create_table_sql) # 爬取数据 url = 'https://example.com' response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') title = soup.find('h1').text content = soup.find('div', class_='content').text # 插入数据 insert_sql = "INSERT INTO my_table (title, content) VALUES (%s, %s)" data = (title, content) cursor.execute(insert_sql, data) # 提交事务并关闭连接 conn.commit() cursor.close() conn.close() ``` 请根据您的实际情况修改代码中的连接参数、表结构以及爬虫逻辑。希望对您有所帮助!如果您还有其他问题,请随时提问。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值