自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Django+nginx+uwsgi上线阿里云

前言之前在阿里云上线过一次django项目,时间长了都快忘记了,今天没事做就再温习了一遍,跟着我的步骤做,一定可以上线成功!废话不多说,开整~第一步,搭建环境1.在root用户下更新软件列表(不更新可能装不上东西)apt update2.安装常用软件apt install nginxapt install mysql-server #安装过程会弹出一个输入密码的框,这...

2019-03-20 23:04:06 301

原创 pycharm操作git基本用法

1.VCS 版本控制服务器(GIT CVS SVN)2.VCS—>checkout from version control 从服务器clone代码并且创建本地项目,默认切换到主分支(master)3 .gitignore文件:用来添加忽略文件4.右键—>Git—>Repository—>Branches 创建并切换到dev分支5.开发到一定阶段将dev分支合并入主...

2019-01-17 10:39:09 1902

原创 Twisted 简介

Twisted是用Python实现的基于事件驱动的网络引擎框架,Twisted支持许多常见的传输及应用层协议,包括TCP、UDP、SSL/TLS、HTTP、IMAP、SSH、IRC以及FTP。就像Python一样,Twisted也具有“内置电池”(batteries-included)的特点。Twisted对于其支持的所有协议都带有客户端和服务器实现,同时附带有基于命令行的工具,使得配置和部署产品...

2019-01-17 09:10:09 266

转载 朴素贝叶斯与文本分类

朴素贝叶斯法(Naïve Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法,属于统计学分类方法。简单来说,朴素贝叶斯分类器假设在给定样本类别的条件下,样本的每个特征与其他特征均不相关,对于给定的输入,利用贝叶斯定理,求出后验概率最大的输出。朴素贝叶斯法实现简单,学习与预测的效率均较高,在文本分类领域有广泛的应用。1. 基于贝叶斯的分类  基于概率的分类问题,就是要求使得P(Y|X)P...

2019-01-11 10:35:51 714

原创 jupyter安装及使用

安装 pip install jupyter在终端里输入jupyter-notebook即可打开会在浏览器里显示出来在pycharm里新建一个pynb的文件,双击打开,如下图自从吃了Jupyter Notebook的安利之后,发现非常便利。记录一些常用的快捷键来提高使用的效率。Jupyter Notebook包含两种模式。一种是命令模式,按ESC键进入,这时边框是蓝色的;另一种是编辑...

2019-01-05 09:54:08 261

原创 python 练习题

1.简述cookie和session的作用以及在爬虫中的使用无状态http协议:session:服务器端的状态保持机制,需要想办法在发送请求的时候携带sessionID。cookies:客户端的状态保持机制,将信息存储在本地,有被劫持的危险;数量和大小有限制。有些状态不适合在服务端保持。#用于session模拟登陆知乎import requestsimport http.cookiej...

2019-01-02 10:42:11 285

原创 python 爬虫selenium自动化点击

import timeimport unittestfrom selenium import webdriverfrom selenium.webdriver.firefox.options import Options as FOptionsclass AutoTest(unittest.TestCase): def setUp(self): option...

2018-12-29 00:08:43 1191

原创 爬虫-之反爬,随机代理IP、限流器、伪造用户代理头等

from bs4 import BeautifulSoupimport requestsimport requests# 伪造用户代理头from fake_useragent import UserAgent# 重试下载from retrying import retry# 实现信息摘要算法 md5 shaimport hashlib# 队列import queueimpo...

2018-12-20 21:05:26 555

原创 爬虫-简单爬取贴吧网页通过mongo-cache存储到数据库中

话不多说,直接上源码,有问题请留言import requestsimport pickleimport zlibfrom datetime import datetime,timedeltafrom pymongo import MongoClientfrom bson.binary import Binaryclass Tieba_Spider(object): def _...

2018-12-19 14:10:21 200

原创 爬虫:通过简单代码实现爬取糗事百科前10页

import requestsclass Qiushi_Spider: def __init__(self): ''' 初始化信息 ''' self.url_base = 'https://www.qiushibaike.com/8hr/page/{}/' self.headers = {'User-Age...

2018-12-18 16:13:35 401

原创 Python选择排序

Python选择排序选择排序for循环形式lt = [8,8,4,8,7,9,4,1]for i in range(len(lt) - 1): for j in range(i+1,len(lt)): if lt[i] > lt[j]: t = lt[i] lt[i] = lt[j] ...

2018-12-17 23:09:11 131

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除