- 博客(11)
- 收藏
- 关注
原创 Django+nginx+uwsgi上线阿里云
前言之前在阿里云上线过一次django项目,时间长了都快忘记了,今天没事做就再温习了一遍,跟着我的步骤做,一定可以上线成功!废话不多说,开整~第一步,搭建环境1.在root用户下更新软件列表(不更新可能装不上东西)apt update2.安装常用软件apt install nginxapt install mysql-server #安装过程会弹出一个输入密码的框,这...
2019-03-20 23:04:06
301
原创 pycharm操作git基本用法
1.VCS 版本控制服务器(GIT CVS SVN)2.VCS—>checkout from version control 从服务器clone代码并且创建本地项目,默认切换到主分支(master)3 .gitignore文件:用来添加忽略文件4.右键—>Git—>Repository—>Branches 创建并切换到dev分支5.开发到一定阶段将dev分支合并入主...
2019-01-17 10:39:09
1902
原创 Twisted 简介
Twisted是用Python实现的基于事件驱动的网络引擎框架,Twisted支持许多常见的传输及应用层协议,包括TCP、UDP、SSL/TLS、HTTP、IMAP、SSH、IRC以及FTP。就像Python一样,Twisted也具有“内置电池”(batteries-included)的特点。Twisted对于其支持的所有协议都带有客户端和服务器实现,同时附带有基于命令行的工具,使得配置和部署产品...
2019-01-17 09:10:09
266
转载 朴素贝叶斯与文本分类
朴素贝叶斯法(Naïve Bayes)是基于贝叶斯定理与特征条件独立假设的分类方法,属于统计学分类方法。简单来说,朴素贝叶斯分类器假设在给定样本类别的条件下,样本的每个特征与其他特征均不相关,对于给定的输入,利用贝叶斯定理,求出后验概率最大的输出。朴素贝叶斯法实现简单,学习与预测的效率均较高,在文本分类领域有广泛的应用。1. 基于贝叶斯的分类 基于概率的分类问题,就是要求使得P(Y|X)P...
2019-01-11 10:35:51
714
原创 jupyter安装及使用
安装 pip install jupyter在终端里输入jupyter-notebook即可打开会在浏览器里显示出来在pycharm里新建一个pynb的文件,双击打开,如下图自从吃了Jupyter Notebook的安利之后,发现非常便利。记录一些常用的快捷键来提高使用的效率。Jupyter Notebook包含两种模式。一种是命令模式,按ESC键进入,这时边框是蓝色的;另一种是编辑...
2019-01-05 09:54:08
261
原创 python 练习题
1.简述cookie和session的作用以及在爬虫中的使用无状态http协议:session:服务器端的状态保持机制,需要想办法在发送请求的时候携带sessionID。cookies:客户端的状态保持机制,将信息存储在本地,有被劫持的危险;数量和大小有限制。有些状态不适合在服务端保持。#用于session模拟登陆知乎import requestsimport http.cookiej...
2019-01-02 10:42:11
285
原创 python 爬虫selenium自动化点击
import timeimport unittestfrom selenium import webdriverfrom selenium.webdriver.firefox.options import Options as FOptionsclass AutoTest(unittest.TestCase): def setUp(self): option...
2018-12-29 00:08:43
1191
原创 爬虫-之反爬,随机代理IP、限流器、伪造用户代理头等
from bs4 import BeautifulSoupimport requestsimport requests# 伪造用户代理头from fake_useragent import UserAgent# 重试下载from retrying import retry# 实现信息摘要算法 md5 shaimport hashlib# 队列import queueimpo...
2018-12-20 21:05:26
555
原创 爬虫-简单爬取贴吧网页通过mongo-cache存储到数据库中
话不多说,直接上源码,有问题请留言import requestsimport pickleimport zlibfrom datetime import datetime,timedeltafrom pymongo import MongoClientfrom bson.binary import Binaryclass Tieba_Spider(object): def _...
2018-12-19 14:10:21
200
原创 爬虫:通过简单代码实现爬取糗事百科前10页
import requestsclass Qiushi_Spider: def __init__(self): ''' 初始化信息 ''' self.url_base = 'https://www.qiushibaike.com/8hr/page/{}/' self.headers = {'User-Age...
2018-12-18 16:13:35
401
原创 Python选择排序
Python选择排序选择排序for循环形式lt = [8,8,4,8,7,9,4,1]for i in range(len(lt) - 1): for j in range(i+1,len(lt)): if lt[i] > lt[j]: t = lt[i] lt[i] = lt[j] ...
2018-12-17 23:09:11
131
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人