- 博客(48)
- 收藏
- 关注
原创 python transformers笔记(Trainer类)
Trainer是Hugging Face Transformers库中用于简化模型训练和评估的核心工具类。它封装了标准的训练循环(如批次处理、反向传播、优化器更新等),支持分布式训练、混合精度计算和自动日志记录,极大减少了重复代码。
2025-07-14 17:14:21
159
原创 python transformers笔记(TrainingArguments类)
TrainingArguments是Hugging Face Transformers库中用于集中管理超参数和配置的核心类。它定义了模型训练、评估、保存和日志记录的所有关键参数,并通过Trainer类实现自动化训练流程。
2025-07-09 15:39:00
498
原创 python transformers库笔记(BertForTokenClassification类)
BertForTokenclassification类是Hugging Face transformers库中专门为基于BERT的序列标注任务(如命名实体识别NER、词性标注POS)设计的模型类。它在BERT的基础上添加了一个线性分类层,用于对每个token进行分类。
2025-07-08 14:27:44
206
原创 chrome因使用selenium无图模式导致不再加载图片问题解决
因为使用了selenium的无图模式访问chrome的本地用户数据导致正常使用chrome访问网页时图片不加载
2025-05-19 14:16:47
314
原创 《数据库索引设计与优化》译本查错(1)
今天在学习《数据库索引设计与优化》第十一章第198页的时候遇到一个问题,即参数的文字描述与实际不符。我看的是从网络上找到的译本,许多喜欢白嫖的朋友可能也会像我一样遇到这种问题。
2025-02-24 23:32:14
460
原创 使用sklearn训练语种识别模型
训练语种识别模型使用的是sklearn的MultinomialNB方法,MultinomialNB是一种基于贝叶斯定理的分类算法,特别适用于处理具有离散特征的分类问题,如文本分类中的单词计数。它属于朴素贝叶斯算法的一种,主要应用于高维度的特征空间,常见于文档分类、垃圾邮件识别等领域。识别结果与模型的内容和大小有关,结果不一定准确,仅供参考。
2025-01-10 16:07:02
276
原创 git使用
白色:git commit提交之后的文件变成白色。红色:修改、创建、删除过的文件都显示红色。绿色:git add添加了的文件显示绿色。
2024-12-30 16:27:58
414
原创 python langid识别一段字符串是哪国语言
在利用爬虫抓取亚马逊网站的数据时,有时会出现所抓页面的语言类型发生错误的情况(如抓取沙特站数据时想要英文页面,抓到的确是阿拉伯语页面)。在数据量大的时候人工排查这类异常情况是非常麻烦的,这时候就可以用到langid模块。但langid模块的识别结果并不完全正确,但是用作参考还是够用的。
2024-12-24 18:14:20
390
原创 JavaScript获取两个日期的天数差
利用绝对值差除以一天的时间(毫秒级)得到的就是两个日期的天数差。使用new Date(日期).getTime()函数将两个时间都转化为时间戳;计算两个时间戳的绝对值差;
2024-12-03 13:57:57
634
原创 安装python时Install launcher for all users灰色无法选中解决方法
解决办法:可能是上一次卸载python没卸载干净,在控制面板中卸载,把Python Launcher卸载掉。卸载完后,就可以正常安装了。
2024-10-30 11:31:28
2552
2
原创 SlickGrid简单使用——一个高性能的datagrid库
SlickGrid是一个极速的JavaScript网格/电子表格库,提供现代化的数据处理和展示功能,在大数据量展示方面表现极好。与easyui和layui的datagrid相比,SlickGrid在大数据量展示方面具有极高的流畅性。本人实测,使用SlickGrid一页存放790000条数据时性能表现极佳。
2024-10-24 11:33:03
807
原创 python报错:SyntaxError: Non-UTF-8 code starting with ‘\xe8‘ in file解决方法
python报错:SyntaxError: Non-UTF-8 code starting with '\xe8' in file提示编码不能正确解码。在文件开头位置声明编码格式即可解决。
2024-07-22 17:09:04
1466
原创 python ftplib大文件分片上传(解决上传时间过长导致ftp断连问题)
python ftplib大文件上传时间过长导致ftp断连问题解决方案
2024-07-16 18:13:10
597
原创 jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框
jquery-easyui单击输入框弹出弹窗,在弹窗输入内容后返回到输入框
2024-05-11 16:34:19
429
1
原创 python selenium常用操作
找到对应系统及chrome版本号的驱动下载链接,例如我用的win32系统115.0.5763.x版本的chrome。
2024-05-10 14:17:19
341
1
原创 jquery-easyui+flask单/多文件上传
在文件框的标签加上multiple,使得上传文件时可以多选文件,再加上id,方便JavaScript获取文件。后端request.files接收到的是一个Dict类型的变量,遍历这个变量就可以挨个获取上传的文件。经过多方查找资料并借鉴其他框架的多文件上传,成功实现了jquery多文件上传的功能。先获取文件框里待上传的所有文件,创建文件类型变量,并遍历拼接文件型变量。
2024-04-30 17:35:01
726
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人