- 博客(6)
- 收藏
- 关注
原创 微信机器人复活战!3种亲测有效的避坑方案
最近,我接到一个项目需求,需要搭建一个微信自动回复机器人。这让我想起了之前用Python打造的自动回复机器人,于是决定重新启动这个项目。然而,事情并没有想象中那么顺利。由于微信对网页版登录的限制,像itchat这类基于网页端的工具已经无法使用。无奈之下,我曾尝试用pywechatspy库搭建了一个本地机器人,但这次启动时,却遇到了两个棘手的问题:1.微信版本受限:之前用的微信版本太老,如今微信官方对2.8版本的登录进行了限制,导致旧版本微信无法正常使用。
2025-02-14 15:04:24
355
翻译 lightgbm 原理解析
任务内容:LightGBM算法梳理LightGBMLightGBM的起源gbdt是受欢迎的机器学习算法,当特征维度很高或数据量很大时,有效性和可拓展性没法满足。lightgbm提出GOSS(Gradient-based One-Side Sampling)和EFB(Exclusive Feature Bundling)进行改进。lightgbm与传统的gbdt在达到相同的精确度时,快20倍...
2019-08-15 21:08:21
495
原创 xgboost算法梳理
任务内容:1. XGB算法梳理XGB在GBDT的基础上,以二分类问题为例,损失函数为,其中,根据泰勒展开可得前向可加算法,t轮的预测与t-1轮预测的关系如下,其中ft(x)为t轮的预测函数,在XGB中即为决策树。损失函数为可变化如下:其中为复杂程度的惩罚项,上式根据泰勒二阶展开式可进一步展开为(注:GBDT按照泰勒一阶展开式):其中,由于是t-1轮的损失函数,当迭代到t轮时,可...
2019-08-12 20:59:01
715
原创 随机森林算法梳理——任务1
任务内容:随机森林算法梳理集成学习的概念集成学习的关键点(中心极限定理):让弱学习器相互独立(算法不同、使用的训练数据不同、使用的特征不同)。理想状态下,25个弱学习器中,一个弱学习器的误差率为0.35,强学习器的误差率为0.06。增加更多的基分类器基分类器应当好于随机猜测分类器,即误差率小于50%集成学习中基学习器的误差率不能超过50%,否则组合分类器的误差率会大于50%个体...
2019-08-07 20:59:09
169
原创 datawhale_1
import pandas as pdimport numpy as npimport warningswarnings.filterwarnings(‘ignore’)pd.set_option(‘display.max_columns’, None)alldata = pd.read_csv(r’D:\data\datawhale\data.csv’, encoding=‘gbk’)...
2019-08-06 21:49:12
235
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人