
笔记
文章平均质量分 70
只须一笑不须愁X
欲买桂花同载酒,终不似少年游
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【机器学习+NER】手把手教你用机器学习CRF模型构建NER系统(CCL2021)
数据集来源:2021年中文计算语言学研究大会的智能对话诊疗评测比赛任务:利用机器学习CRF模型构建NER系统,得到下图所示的评估指标原始数据处理参考:医疗命名体识别之数据预处理(处理.json文件)此处机器学习CRF模型主要使用调用CRF进行搭建;可以通过:安装将索引和标签一一对应,存储到中读取字符字典文件将字符与索引编号对应,便于后续查找字符读取训练语料,将原始数据7成划分为训练集,3成划分为测试集,返回数据和标签简单测试一下,看数据是否对应上了转换数据格式,分别将数据与标签转原创 2022-07-05 16:31:06 · 1961 阅读 · 12 评论 -
【NER】CCL2021医疗命名体识别之数据预处理(处理.json文件)
数据来源:2021年中文计算语言学研究大会的智能对话诊疗评测比赛任务: 根据提供的医患对话,(1)识别其中的药物和症状实体名称。(2)然后根据医患对话中识别的症状和服用的药物名称,以及患者自述的上下文,根据模板生成医疗报告。数据预处理任务: 提取出文件中的标注,存放进文件中包含完整的医生和患者之间的对话信息,并且该数据中已经完成了疾病判断、自我报告、对话生成、序列标注任务,如下图所示:训练数据需要将文本和标注一一对应,如下图所示:......原创 2022-06-29 15:51:00 · 1862 阅读 · 0 评论 -
【汇编语言课程】 知识点+易错题 吐血整理(下)
知识点总结:易错题:(ah)=22H, (bh)=0A0H;贝lJ(ah)-(bh)=34-(-96)=82H, 82H 是-126 的补码所以sf=1这里虽然sf=1,但是并不能说明(ah)-96。下面的程序执行后:(ax)=?解:(ax)=0045h十二、内中断知识点总结:易错题:十三、int指令知识点总结:...原创 2022-06-11 20:35:57 · 1094 阅读 · 1 评论 -
【汇编语言课程】 知识点+易错题 吐血整理(中)
知识点整理:易错题:八、数据处理的两个基本问题知识点整理:易错题:知识点总结:易错题:若要使程序中的 jmp 指令执行后,CS:IP 指向程序的第一条指令,在 data 段中应该定义哪些数据?db 0,0,0程序如下。补全程序,使 jmp 指令执行后,CS:IP 指向程序的第一条指令。用 Debug 查看内存,结果如下:2000:1000 BE 00 06 00 00 00 …则此时,CPU 执行指令:后,(CS)=? , (IP)=?解:CS=0006H,IP=00BEH重点!原创 2022-06-10 21:09:22 · 820 阅读 · 0 评论 -
人工智能课程必背知识点
人工智能课程复习原创 2022-06-05 11:02:34 · 4481 阅读 · 0 评论 -
【OpenCV】利用OpenCV中的KNN算法实现手写数字和手写字母的识别
【OpenCV】利用OpenCV中的KNN算法实现手写数字和手写字母的识别一、KNN算法(K近邻)KNN(K Near Neighbor):k个最近的邻居,即每个样本都可以用它最接近的k个邻居来代表。距离度量:一般采用欧式距离度量,常用的距离度量方式还有:曼哈顿距离、切比雪夫距离K值是可以设置的变量:K值过小:k值小,特征空间被划分为更多子空间,整体模型变复杂,容易发生过拟合,k值越小,选择的范围就比较小,训练的时候命中率较高,近似误差小,而用测试集的时候就容易出错,估计误差大,容易原创 2022-05-07 11:08:13 · 6895 阅读 · 6 评论 -
【机器学习】交叉验证详细解释+10种常见的验证方法具体代码实现+可视化图
【机器学习】交叉验证详细解释+10种常见的验证方法具体代码实现+可视化图一、使用背景由于在训练集上,通过调整参数设置使估计器的性能达到了最佳状态;但在测试集上可能会出现过拟合的情况。 此时,测试集上的信息反馈足以颠覆训练好的模型,评估的指标不再有效反映出模型的泛化性能。 为了解决此类问题,还应该准备另一部分被称为 验证集的数据集,模型训练完成以后在验证集上对模型进行评估。 当验证集上的评估实验比较成功时,在测试集上进行最后的评估。然而,通过将原始数据分为3个数据集合,我们就大大减少了可用于模型学习的原创 2022-04-28 00:09:04 · 19657 阅读 · 4 评论 -
【机器学习】聚类算法DBSCAN、K-means、Mean Shift对比分析及具体代码实现
【机器学习】聚类算法DBSCAN、K-means、Mean Shift对比分析及具体代码实现一、DBSCAN算法(具有噪声的基于密度的聚类方法)1.算法原理基于数据分布密度不同对数据进行聚类,把高于设定阈值的密度区域划分同一数据簇。主要特点是不需预先设定形成的簇类的数量并且能在噪声数据集中实现任意形状的聚类2.算法实现流程图3.参数说明Eps:领域半径min_samples:密度阈值,即簇内点的个数4.具体代码实现import pandas as pdimport numpy as原创 2022-04-19 15:58:53 · 4659 阅读 · 0 评论 -
Mac系统下 安装并使用DOSBox编写汇编语言
Mac系统下 安装并使用DOSBox编写汇编语言工具:DOSBox(下载地址DOSBox官网 )工具:debug、edit、link、masm等(下载地址工具)步骤:安装DOSBox:在官网下载DOSBox后,将里面的应用图标文件复制到Application(形成打开程序的快捷方式)配置DOSBox环境:刚打开时的界面:在访达的用户目录下建立一个文件夹,命名为DOSBox将下载好的debug.exe,edit.exe等复制到DOSBox文件夹在DOSBox界面,输入mount原创 2022-04-06 16:39:17 · 4687 阅读 · 1 评论 -
【数学建模】Lingo软件介绍+常用函数总结+样例
【数学建模】Lingo软件介绍+常用函数总结+样例一、语法规定求目标函数的最大值或最小值分别用MAx=...或MIN=...来表示一行可以输入多个语句,一个语句也可以多行输入,但是每个语句必须以分号“;”结束;注释语句以“!”开头,以“;“结束默认情形下程序中所有的决策变量均取非负值Lingo模型以“model:”开头,以“end”结束变量名以字母开头,后跟字母、数字或下划线Lingo不区分大小写,即MAX和max一致二、Lingo的运算符1.算术运算符:用于数与数之间的数学运算。原创 2022-03-08 19:46:57 · 19311 阅读 · 3 评论 -
Mac Safari不借助第三方软件进行长截图的几种常见方法
Mac Safari不借助第三方软件进行长截图的几种常见方法方法一:借助打印,生成PDF文档步骤:1.打开需要长截图的网站,右击后点击“打印页面”2.导出为PDF即可方法二:直接长截图,生成.png格式的图片步骤:1.打开需要长截图的网站,右击后点击“检查元素”2.在弹出的“html”中,选中第一行并右键单击选择“捕捉屏幕快照”;3.最后在弹出的窗口,输入名称,选择存储位置,点击“存储”按钮,即可完成。...原创 2022-03-05 20:52:37 · 15283 阅读 · 0 评论 -
Mac打不开后缀名为txt文件,显示文本编码中文不适用的解决措施
Mac打不开后缀名为txt文件,显示文本编码中文不适用的解决措施问题: 未能打开文稿“.txt”。文本编码中文(GB 18030)不适用解决措施:1.打开文本编辑器的偏好设置;2.点击“打开和存储”;3.将纯文本文件编码改为Unicode(UTF-8)再重新打开文件就可以正常打开啦~...原创 2022-01-13 20:50:05 · 8768 阅读 · 5 评论 -
数据库课程复习之关系数据库标准语言SQL
数据库课程复习之关系数据库标准语言SQL教材适配:王珊、萨师煊编写1.结构化查询语言(SQL)是关系数据库的标准语言2.SQL的特点:综合统一:SQL集数据定义语言、数据操纵语言、数据控制语言于一体,语言风格统一,可以独立完成数据库生命周期的全部活动高度非过程化:只要提出“做什么”,而无须指明“怎么做”,因此无须了解存取路径。存取路径的选择以及SQL的操作过程由系统自动完成面向集合的操作方式:SQL采用集合操作方式,不仅操作对象、查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可原创 2021-12-25 23:42:50 · 456 阅读 · 0 评论 -
算法分析与设计课程复习之计算问题的复杂性
算法分析与设计课程复习之计算问题的复杂性一、判定问题和最优化问题1.判定问题: 在研究NP完全性理论时,我们很容易重述一个问题使它的解只有两个结论:yes或no,在这种情况下,称问题为判定问题。2.最优化问题: 最优化问题是关心某个量的最大化或最小化的问题。3.举例:(顾名思义)判定问题: ELEMENT UNIQUENESS.输入:一个整数序列S问题:在S中存在两个相等的元素吗?最优问题:ELEMENT COUNT输入:一个整数序列S输出:一个在S中频度最高的元素。二、P类问题1.原创 2021-12-09 14:54:39 · 1415 阅读 · 2 评论 -
算法分析与设计课程复习之分支限界
算法分析与设计课程复习之分支限界一、定义分支-限界法:在生成当前E-结点的全部儿子之后再生成其它活结点的儿子,并且,用限界函数帮助避免生成不包含答案结点子树。分支限界法以广度优先(bfs)或最小耗费(最大收益)的方式搜索解空间。二、分支限界法和回溯法的对比回溯法分支限界法对解空间的搜索方式深度优先搜索(dfs)广度优先搜索(bfs)存储节点的常用数据结构堆栈队列、优先队列(最小堆)节点的存储特征活结点的所有可行子结点被遍历后才被从栈中弹出每个结点只有一原创 2021-12-09 13:47:21 · 3991 阅读 · 0 评论 -
算法分析与设计课程复习之回溯法
算法分析与设计课程复习之回溯法一、基本思想1.解空间设问题的解向量为X=(x1,x2,…,xn) ,xi的取值范围为有穷集Si 。把xi的所有可能取值组合,称为问题的解空间。每一个组合是问题的一个可能解。2.状态空间树问题解空间的树形式表示活结点: 如果已生成一个结点而它的儿子结点还没有全部生成,则这个结点叫做活结点;当前正在生成其儿子结点的活结点叫E-结点(正在扩展的结点)。死结点:不再进一步扩展或者其儿子结点已经全部生成的生成结点是死结点。二、定义回溯法(backtracking)原创 2021-12-08 23:25:01 · 3567 阅读 · 0 评论 -
算法分析与设计课程复习之贪心法
算法分析与设计课程复习之贪心法一、定义贪心算法总是作出在当前看来最好的选择。也就是说贪心算法并不从整体最优考虑,它所作出的选择只是在某种意义上的局部最优选择。二、贪心算法与动态规划算法的区别贪心算法通常用来于求解最优化问题,即量的最大化或最小化。然而,贪心算法不像动态规划算法,它通常包含一个用以寻找局部最优解的迭代过程。在某些实例中,这些局部最优解转变成了全局最优解,而在另外一些情况下,则无法找到最优解。三、贪心算法的基本要素贪心选择性质所求问题的整体最优解可以通过一系列局部最优的选择,原创 2021-12-08 17:52:53 · 1044 阅读 · 0 评论 -
算法分析与设计课程复习之动态规划
算法分析与设计课程复习之动态规划一、基本思想将待求解问题分解成若干个子问题。保存已解决的子问题的答案。二、动态规划和分治法的区别分治法是把大问题分解成一些相互独立的子问题,递归的求解这些子问题然后将他们合并来得到整个问题的解动态规划是通过组合子问题的解来解决整个大问题。各个子问题不是独立的,也就是各个子问题包含公共子问题。它可以避免遇到的子问题的重复求解。三、动态规划算法的基本要素最优子结构重叠子问题四、经典问题1.背包问题(0-1背包)设U = {u1,u2,. . . ,un}原创 2021-12-08 12:59:36 · 1776 阅读 · 1 评论 -
算法与分析课程复习之分治法
算法与分析课程复习之分治法原创 2021-12-07 12:50:32 · 1373 阅读 · 0 评论 -
算法分析与设计课程复习之堆和不相交集(并查集)数据结构
算法分析与设计课程复习之堆和不相交集(并查集)数据结构一、堆1.定义:一个(二叉)堆是一个几乎完全的二叉树,它的每个节点都满足堆的特性:如果v和p(v)分别是节点和它的父节点,那么存储在p(v)中的数据项键值不小于存储在v中数据项的键值。2.堆上的运算Sift-up假定对于某个i>1, H[i]变成了键值大于它父节点键值的元素,这样就违反了堆的特性,因此这种数据结构就不再是堆了。如要修复堆的特性,需要用称为Sift-up的运算把新的数据项上移到在二叉树中适合它的位置上// heap[原创 2021-12-07 09:58:52 · 505 阅读 · 0 评论 -
算法分析与设计课程复习之数据结构
算法分析与设计课程复习之数据结构一、链表1.循环链表如果链表中存在由最后一个元素到第一个元素的链,那么这种链表称为循环链表2.双向链表如果在一个链表中每一个节点(第一个节点可能除外)也指向它的前驱节点,那么这个链表称为双向链表;3.循环双向链表如果第一个和最后一个节点也被一对链接起来,这就是一个循环双向链表。二、栈和队列1.栈(先进后出)栈是一种只允许在称为栈定的一端进行插入和删除运算的链表,也可以在数组中实现这些运算。2.队列(先进先出)队列是这样的一种链表:仅允许在称为队列尾部的原创 2021-12-06 10:36:05 · 488 阅读 · 0 评论 -
算法分析与设计课程复习之算法分析的基本概念
一、算法分析的基本概念1.二分搜索(针对有序序列)时间复杂度为O(log2n)//A为升序的数组,n为数组元素个数,x为要搜索的元素,函数返回元素的数组下标int BinarySearch(int A[],int n,int x){ int low = 0, high = n - 1; int mid; while (low <= high) { mid = (low + high) / 2; if (x == A[mid]) return mid; if (x &原创 2021-12-06 10:13:54 · 1182 阅读 · 0 评论 -
关于二维数组开太大导致崩溃的问题及解决措施
关于二维数组开太大导致崩溃的问题及解决措施用Xcode编译器运行,下面一行代码:#include <iostream>typedef unsigned long long ULL;using namespace std;int main(){ ULL a[1024][1024] = {1}; cout<<a[0][0]<<" "<<a[1][1]<<endl; return 0;}结果程序会崩溃,具体显示如原创 2021-11-08 08:27:53 · 4470 阅读 · 6 评论 -
编译错误Variable-sized object may not be initialized 出现的原因及解决措施
编译错误Variable-sized object may not be initialized 出现的原因及解决措施出现此错误的原因是可以用变量定义数组长度,但不可初始化。不用变量初始化后的结果为:错误消失原创 2021-11-05 19:50:22 · 22673 阅读 · 1 评论 -
Oracle Fusion中间件Oracle数据可视化用户指南之字符串函数总结
Oracle® Fusion中间件Oracle数据可视化用户指南String函数总结(按照字母顺序)功能举例描述AsciiAscii(‘a’)将单个字符字符串转换为其相应的ASCII代码,在0到255之间。如果字符表达式计算为多个字符,则返回与表达式中第一个字符对应的ASCII代码。Bit_LengthBit_Length(‘abcdef’)返回指定字符串的长度(以位数为单位)。每个Unicode字符的长度为2字节(相当于16位)。CharChar(35)将原创 2021-10-30 00:12:31 · 389 阅读 · 0 评论 -
左半部分和右半部分完全一样的特别数字 满分题解
思路:1.查看评分标准中n 的最大值达到了1e18,则一般的暴力算法会超时。2.总结特别数字的规律,发现当n在0-1000之间时,满足的数字有9个,即11、22、33、44、55、66、77、88、99;当n在1000-10000之间时,满足的数据有90个,即9*10;同理,当n在更高的位数时也有相同的规律。3.当数字为奇数位时,不是特别数字,直接跳过。4.当数字为偶数位时,可以利用2.中的规律进行判断。举例:123456为六位数,通过2.规律可得其在0-10000之间的特别数字有99个;..原创 2021-10-16 21:34:58 · 2164 阅读 · 0 评论