- 博客(26)
- 收藏
- 关注
原创 03 Linux基础(7.7)
useradd 用户名默认的家目录(可理解为房子/家):/home/milan0:关机1:单用户(找回丢失密码)2:多用户状态没有网络服务3:多用户状态有网络服务4:系统未使用保留给用户5:图形界面6:系统重启。
2025-07-09 13:43:05
676
原创 01 Linux基础(7.1)
方式一:文件夹整个拷贝,文件名一样或者重新取。方式二:两种克隆方法:(1)创建连接克隆:占用内存小,打开的为同一个系统;(2)创建完整克隆,类拷贝。
2025-07-05 22:19:12
412
原创 03 SQL基础(6.18)
此时将where后的e.age和order by后的e.age改为eage。将一列数据作为一个整体,进行纵向计算。null值不参与计算。使用别名,workaddress_count。
2025-06-19 09:23:15
226
原创 win11关闭防火墙、自动扫描
(3)在启用或关闭Windows defender 防火墙里关闭防火墙。(1)打开设置,选择隐私与安全性,选择Windows安全中心;(2)点击Windows defender 防火墙;(2)点击“打开Windows安全中心”;(4)点击第二个,病毒和威胁防护设置;(3)点击病毒和威胁防护;(1)打开“控制面板”;(5)关闭实时保护即可。
2025-06-16 19:53:20
868
原创 用word2vec训练中文词向量,并用kmeans算法聚类
(1)将已经分好词的中文用word2vec转化成词向量(2)将转化后的词向量用kmeans算法进行聚类,用手肘法和轮廓系数法确定最佳聚类数。
2024-10-21 16:35:01
1156
原创 利用LDA进行主题建模,用困惑度和一致性曲线选取最优主题数
如果困惑度和一致性曲线效果图较好,确定了主题数量后,再单独跑一下2里面的程序。2中topic为5是我主观设置的,不一定为最优。
2024-10-19 16:29:37
3658
原创 用python计算文本文档中中文的TF-IDF值
这里跟网上的不一样的是,在总词频统计时只循环了一次,分好的词都没有被再次分词。按照网上的循环两次,导致所有的词都被拆成一个字一个字的那种,也可能是因为网上的都是以英文文本为例去做的。filepath = open("D:\\data\\1\\江苏_2021_fc.txt", 'r', encoding='utf-8')file_path = "D:\\data\\1\\江苏_2021_fc.txt"# 计算每个词的 TF-IDF 值。# 计算每个词的 IDF 值。# 计算每个词的 TF 值。
2024-10-18 16:49:21
375
原创 学习Python第一天
①IDLE:在一打开的页面写代码按enter无法换行,换行需要按Ctrl+j;或者按file-new file,新建一个文件写,然后save,点run-run module。②规范(PEP8)③变量和字符串:变量:变量是名字,由字母、数字、下划线构成,不能以数字开头,区分大小写例如:x=3,x为变量名变量名可替代,取决于最后一次赋的值。传递性:x=3,y=5 x,y=y,x print(x,y) 输...
2021-11-24 21:42:24
2351
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人