解斯特洛夫-CSDN博客

原创 Django+nginx+uwsgi上线阿里云

前言之前在阿里云上线过一次django项目，时间长了都快忘记了，今天没事做就再温习了一遍，跟着我的步骤做，一定可以上线成功！废话不多说，开整~第一步，搭建环境1.在root用户下更新软件列表（不更新可能装不上东西）apt update2.安装常用软件apt install nginxapt install mysql-server #安装过程会弹出一个输入密码的框，这...

2019-03-20 23:04:06 301

原创 pycharm操作git基本用法

1.VCS 版本控制服务器(GIT CVS SVN)2.VCS—>checkout from version control 从服务器clone代码并且创建本地项目，默认切换到主分支(master)3 .gitignore文件:用来添加忽略文件4.右键—>Git—>Repository—>Branches 创建并切换到dev分支5.开发到一定阶段将dev分支合并入主...

2019-01-17 10:39:09 1902

Twisted是用Python实现的基于事件驱动的网络引擎框架，Twisted支持许多常见的传输及应用层协议，包括TCP、UDP、SSL/TLS、HTTP、IMAP、SSH、IRC以及FTP。就像Python一样，Twisted也具有“内置电池”（batteries-included）的特点。Twisted对于其支持的所有协议都带有客户端和服务器实现，同时附带有基于命令行的工具，使得配置和部署产品...

2019-01-17 09:10:09 266

转载朴素贝叶斯与文本分类

朴素贝叶斯法（Naïve Bayes）是基于贝叶斯定理与特征条件独立假设的分类方法，属于统计学分类方法。简单来说，朴素贝叶斯分类器假设在给定样本类别的条件下，样本的每个特征与其他特征均不相关，对于给定的输入，利用贝叶斯定理，求出后验概率最大的输出。朴素贝叶斯法实现简单，学习与预测的效率均较高，在文本分类领域有广泛的应用。1. 基于贝叶斯的分类基于概率的分类问题，就是要求使得P(Y|X)P...

2019-01-11 10:35:51 714

原创 jupyter安装及使用

安装 pip install jupyter在终端里输入jupyter-notebook即可打开会在浏览器里显示出来在pycharm里新建一个pynb的文件，双击打开，如下图自从吃了Jupyter Notebook的安利之后，发现非常便利。记录一些常用的快捷键来提高使用的效率。Jupyter Notebook包含两种模式。一种是命令模式，按ESC键进入，这时边框是蓝色的；另一种是编辑...

2019-01-05 09:54:08 261

原创 python 练习题

1.简述cookie和session的作用以及在爬虫中的使用无状态http协议：session：服务器端的状态保持机制，需要想办法在发送请求的时候携带sessionID。cookies：客户端的状态保持机制，将信息存储在本地，有被劫持的危险；数量和大小有限制。有些状态不适合在服务端保持。#用于session模拟登陆知乎import requestsimport http.cookiej...

2019-01-02 10:42:11 285

原创 python 爬虫selenium自动化点击

import timeimport unittestfrom selenium import webdriverfrom selenium.webdriver.firefox.options import Options as FOptionsclass AutoTest(unittest.TestCase): def setUp(self): option...

2018-12-29 00:08:43 1191

原创爬虫-之反爬，随机代理IP、限流器、伪造用户代理头等

from bs4 import BeautifulSoupimport requestsimport requests# 伪造用户代理头from fake_useragent import UserAgent# 重试下载from retrying import retry# 实现信息摘要算法 md5 shaimport hashlib# 队列import queueimpo...

2018-12-20 21:05:26 555

原创爬虫-简单爬取贴吧网页通过mongo-cache存储到数据库中

话不多说，直接上源码，有问题请留言import requestsimport pickleimport zlibfrom datetime import datetime,timedeltafrom pymongo import MongoClientfrom bson.binary import Binaryclass Tieba_Spider(object): def _...

2018-12-19 14:10:21 200

原创爬虫：通过简单代码实现爬取糗事百科前10页

import requestsclass Qiushi_Spider: def __init__(self): ''' 初始化信息 ''' self.url_base = 'https://www.qiushibaike.com/8hr/page/{}/' self.headers = {'User-Age...

2018-12-18 16:13:35 401

原创 Python选择排序

Python选择排序选择排序for循环形式lt = [8,8,4,8,7,9,4,1]for i in range(len(lt) - 1): for j in range(i+1,len(lt)): if lt[i] > lt[j]: t = lt[i] lt[i] = lt[j] ...

2018-12-17 23:09:11 131

weixin_42725976的博客