- 博客(25)
- 收藏
- 关注
原创 进程查看器htop
htop -u chenl 只看chenlt : 显示树形结构Space: tag process 标记进程c: 标记进程和子进程[非内部命令]一个互动的进程查看器,可以动态观察系统进程状况补充说明htop命令 是Linux系统中的一个互动的进程查看器,一个文本模式的应用程序(在控制台或者X终端中),需要ncurses。与Linux传统的top相比,htop更加人性化。它可让用户交互式操作,支持颜色主题,可横向或纵向滚动浏览进程列表,并支持鼠标操作。
2023-05-31 22:14:51
358
原创 dRep学习笔记
MrOlm/drep: Rapid comparison and dereplication of genomeshttps://blog.csdn.net/weixin_45552562/article/details/109668589点化了我推荐用conda安装conda create -n drepconda activate drepconda install drep -c bioconda也可以用pip,但是有一些依赖的包可能需要自己下pip install drep
2022-05-10 10:39:25
2544
转载 如何加快压缩和解压缩的速度
原文生信技能树本篇为学习该视频后的个人练习如何加快压缩和解压缩的速度gzip/gunzip压缩:gzip readme.txt解压:gunzip readme.txt.gzzip/unzip压缩:zip readme.txt.zip readme.txt解压:unzip readme.txt.zipbzip2压缩:bzip2 readme.txt解压:bizp2 readme.txt.bz2tar(适用于多个文件)压缩:tar -zcvf output.tar.g
2022-04-29 10:08:32
5741
原创 微生物多样性数据分析(16S)
微生物多样性数据分析(16S)9个可变区,10个保守区,扩增V3区、V4区、或者一起、或者V6、V9。OTU(Operational taxonomic unit)OTU(operational taxonomic units) 是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等)设置的同一标志。通常按照 97% 的相似性阈值将序列划分为不同的 OTU,每一个 OTU 通常被视为一个微生物物种。相似性小于97%就可以认为属于不同的种,相似性小于95%,可
2022-04-21 09:22:22
4530
1
原创 CheckM-Options-zn
CheckM的GitHub官网CheckM英文帮助文档参考链接CheckM (宏)基因组质量评估国家微生物科学数据中心-CheckM使用说明内有视频及PDF讲解,还可线上测试。BackgroundCheckM首先基于完整的已测序细菌基因组作为参考基因组,构建基因组的进化树,构建每个谱系(可以理解为一类物种)的单拷贝基因集(管家基因)(single copy genes,SCGs,为什么是单拷贝?因为这样可以开展基因组混合程度、污染程度等的评估)。在使用时,将我们的Bin与参考基因组一.
2022-04-20 15:03:47
3426
原创 生物统计学Nonparametric Tests and Basics of Linear Algebra
第八讲 非参数检验和线性代数基础第一部分 非参数检验对于非正态分布资料,实施统计处理的一个重要途径是先作变量的转换,使转换后的资料近似正态分布,然后按正态分布的方法作统计处理。相关系数的区间估计在ρ不为0时,r的抽样分布就不服从t分布或u分布(实质是偏态分布),所以不能套用第四章中置信区间公式。这时可以利用z转换,把r转换称z,而z是近似服从正态分布的。z=0.5ln1+r1−rσz=1n−3z=0.5ln\frac{1+r}{1-r}\\\sigma_z=\sqrt{\frac{1}{n
2022-04-13 11:23:21
300
原创 生物信息学Bioinformatics学习笔记(四)- Data analysis-16sRNA
Data analysis-16sRNA常用V3V4区域进行扩增子测序Basic analytical procedure1.原始数据处理·去除接头序列,并将双端测序序列拼接成单条序列。·根据测序barcode序列区分不同的样本序列。·过滤低质量序列和无法比对到16s rDNA数据库的序列。2.OTU(可执行操作单元)分类和统计·以97%的序列相似度将所有序列进行同源比对并聚类成OTUs (QIIME -ucluster)·与数据库GreenGenes比对 (uclust)http://
2022-04-07 10:17:33
2656
原创 生物统计学(Biostatistics)笔记第七讲-Linear regression and correlation analysis
Linear regression and correlation analysis•第五章中,我们介绍了如何研究两个定性变量是否有关系的问题。•实际工作中,我们经常需要研究两个或两个以上定量变量是否有关系,有怎么样的关系。•对于生物学数据,因为存在随机性和变异性等,所以通常不能推导出确定的函数关系,但是可以使用统计学上的回归与相关分析研究其分布情况(如平均数、标准差和置信区间)。因果关系与平行关系•经常地,我们发现一个变量随着另一个变量的变化而变化,但是这不一定说明两者存在因果关系。•还有
2022-04-06 13:11:18
1317
转载 Linux 打包及压缩命令使用总结
原文链接https://songzixian.com/linuxnote/1759.html在这篇文章中,我将总结 Linux 系统下面常见的几种压缩工具,包括它们的压缩命令、解压缩命令、特殊参数等,同时,我还将介绍打包命令 tar,以及如何将其与压缩命令同时使用。Linux 下面的压缩命令主要有下面几个:1.常用命令介绍zip,对应压缩文件格式:.zipgzip,对应压缩文件格式:.gzbzip2,对应压缩文件格式:.bz2xz,对应压缩文件格式:.xz打包命令:tar对应压缩文
2022-04-05 20:05:45
612
原创 Typora+Picgo-core+Gitee上传图片失败之全网问题小总结upload-picture
1.看看图片的链接是不是自己图床的链接,也就是https://gitee.com,有时候我自己忘上传了。2.图片太大了,超过1M就有可能显示不了,这时候就需要自己从本地复制粘贴上去了。3.批量上传本地图片失败,试试把本地图片路径改成英文English4.本地图片粘贴到Typora上显示不出来,可能是你图片的名字第一个不是数字或字母
2022-04-02 11:33:14
2209
原创 Google的Logo颜色参数
Google的Logo颜色参数colorRGBHex色调、饱和度、亮度蓝色[66, 153, 244]#4286F3140,214,146红色[234, 67, 53]#EB45373,195,135黄色[251, 188, 5]#FAC23030,231,120绿色[52, 168, 83]#55AF7B91,127,104自己随便弄的几张图片,好像不是很好看啊😂给个三连再走呗📢🙇🙏👍⭐️💓...
2022-04-02 09:39:37
3837
原创 生物信息学Bioinformatics学习笔记(三)-高通量测序
文章目录High throughput Sequencing基因组计划:**Human Genome Project, HGP**基因组测序方法2.1 鸟枪法测序2.2 新兴的测序技术第一代测序技术第二代测序技术第三代测序技术第四代测序技术2.3 基因组测序的未来High throughput Sequencing高通量测序技术基因组计划:Human Genome Project, HGP人类基因组计划与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划,是人类科学史上的又一个伟大工程,被誉为生命科学的
2022-04-01 17:03:08
1816
原创 MetaBAT2学习笔记
🏃以下均为我个人在宏基因组学习过程中的笔记,参考性不大,参考链接很靠谱。🙋有什么想找的请直接Ctrl + F (我写的很乱)😺下面🏃这些链接是我在学习中的参考文章https://www.jianshu.com/p/66ab14988a74https://zhuanlan.zhihu.com/p/54080691https://zhuanlan.zhihu.com/p/64607571https://mp.weixin.qq.com/s/BHCs2Y97jXL-2kInlu49UA分箱B.
2022-04-01 09:40:45
3773
1
原创 生物统计学Biostatistics笔记第六讲-方差分析
第六讲 方差分析第四章介绍了如何比较样本平均数与参考总体平均数,以及比较两个样本平均数。但如果有三个或更多的样本平均数有三个或更多的样本平均数时,u检验/t检验都有一定的局限,不适用本文有些数学公式使用md语法打的,刚学这个,有的嫌太累了😂直接用的图片第一节 方差分析•方差分析(analysis of variance,ANOVA)又称变量分析,是把所有分组的观测值作为一个整体,一次性比较各组的样本平均数并做出推断。•如果差异不显著,则认为各组都是相同的;如果差异显著,再进一步比较是哪组
2022-03-31 10:35:16
2270
原创 查看、修改图片gps地理位置信息
文章目录元数据XMPID3Exif如何在照片中查找地理位置等信息引用:参考链接1参考链接2了解GPS属于一种描述性元数据元数据元数据是指关于数据的数据。在这方面,数据是指您的数字资产,如图像。 元数据对于有效管理资产至关重要。元数据是资产可用的所有数据的集合,但不一定包含在该图像中。 元数据的一些示例包括:资产的名称。上次修改的时间和日期。资产存储在存储库中时的大小。其所包含文件夹的名称。相关资产或已应用的标记。、技术元数据(自动创建)描述性元数据(无法全自动创
2022-03-27 16:18:59
3927
1
原创 生物统计学(biostatistics)学习笔记(五)卡方检验
第五章卡方检验不是所有的样本都可以计算平均数和方差的;例如属性资料的样本,和一些计数资料的样本属性资料计数资料用1. 统计次数法;2. 评分法服从二项分布,则可以利用二项分布的公式来研究其概率分布,有时可近似成正态分布将其转化为计数资料无论是否服从二项分布,都可以使用χ2检验来研究其概率分布χ2检验(chi-square test)①一个样本的方差同质性检验;②适合性检验;只有右尾检验③独立性检验;只有右尾检验•对于计数资料或属性资料,其观测值Oi与理
2022-03-24 17:19:27
1833
原创 生物统计学(biostatistics)学习笔记(四)统计推断(已知样本推总体)
第四章统计推断(已知样本推总体)文章目录第四章统计推断(已知样本推总体)假设检验的原理与方法样本方差的同质性检验样本平均数的假设检验参数估计上一章我们讨论了已知总体的时候样本的特征,即抽样分布。本章我们来讨论已知样本的时候如何推断总体的特征,主要任务是分析差异产生的原因,是随机误差导致的,还是一些处理效应导致的。假设检验的原理与方法假设检验(hypothesis test):也叫显著性检验(significance test),是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出
2022-03-24 16:17:35
2258
原创 生物信息学学习笔记(二)--蛋白质的结构分析与预测Structural analysis & prediction of proteins
生物信息学-蛋白质的结构分析与预测Structural analysis & prediction of proteins文章目录生物信息学-蛋白质的结构分析与预测1.蛋白质结构分类 (Classification)2.蛋白质结构显示 (Visualization)3.蛋白质结构预测 (Prediction)蛋白质结构从头预测方法的探索4.蛋白质结构分析的应用 (Application)1.基本理化性质分析2.蛋白转运信号与细胞定位分析3.跨膜蛋白结构分析4.修饰位点、切割位点分析及其他1
2022-03-24 11:50:07
8355
1
原创 生物信息学简史,A brief history of bioinformatics- Briefings in Bioinformatics综述解读
A brief history of bioinformatics 原文DOI号:10.1093/bib/bby063参考链接生物信息学简史-生信自学网A Brief history of Bioinformatics1950–1970: The originsProtein analysis was the starting point生物信息学在DNA中的应用要落后于蛋白质研究将近20年时间,因为50年代早期普遍认为蛋白质才是遗传信息载体。Dayhoff: the first bio.
2022-03-22 10:01:29
2173
原创 生物信息学Bioinformatics学习笔记(一)
文章目录生物信息学第一章 绪论History(根据19年的一份综述)生物信息学的研究内容生物信息学的应用领域第二章 模式生物和生物信息学数据库资源第一节 模式生物测序第二节 三大核酸数据库第三节 蛋白质数据库第三章 生物信息学数据库查询第一节 生物信息数据库的储存第二节 GenBank中序列的获取第三节 数据库文献的检索第四章 序列分析第一节 序列比对的内容Sequence Alignment第二节 BLAST应用示例第五章 进化与系统发生分析第一节 生物进化的分子基础第二节 基本概念第三节 系统发生树的构
2022-03-21 23:32:24
8509
原创 Lunix下建立新用户-.Xauthority does not exist-不显示用户名和路径
useradd -d /name -s /bin/bash -m namepasswd name/usr/bin/xauth: file /home/user/.Xauthority does not existchown username:username -R /home/user_dir
2022-03-21 17:15:47
13128
原创 生物统计学(biostatistics)学习笔记(三)
第三章概率分布生物统计学最主要的任务是用样本统计数来推断其所属总体的参数从同一总体中随机抽取样本,每次得到的样本不会完全相同,用不同样本去推断同一总体将得到不同的结论,如何判断这些结论的可靠性•这些推断的基础是关于概率分布的基本知识,以及抽样分布。概率基础知识•必然事件**(certain event),以U表示。**•不可能事件**(impossible event),以V表示。**•随机事件**(random event,简称事件),指在某些确定条件下,因为偶然因素的影响而
2022-03-20 20:59:14
1572
原创 生物统计学(biostatistics)学习笔记(二)
第二章资料整理与特征数计算资料的类型资料(data):在生物学试验及调查中能够获得大量的原始数据,是在一定条件下对某种具体事物或现象观察的结果,称之为资料。资料就是变量的值。对某种现象只能观察不能测量的资料一般是由计数和测量得到的。质量性状(qualitative character)资料数量性状(quantitative character)资料花瓣的颜色鱼尾数,玉米籽粒数治疗疾病的痊愈,好转高度,重量•生物统计学归根结底就是用样本来估计总体的问题,所以
2022-03-20 20:54:02
1621
原创 生物统计学(biostatistics)学习笔记(一)
生物统计学(biostatistics)第一章绪论定义:用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科生物的特点:随机性、变异性、复杂性•同质(homogeneity):根据研究目的所确定的观察单位其性质应大致相同。•变异(variation):即使性质相同的事物,由于存在个体差异,同一指标的测量结果也不同。•总体(population):具有相同性质的个体所组成的集合,指研究对象的全体。(有限总体、无限总体)•个体(individual):组成总体的基本单位
2022-03-20 16:32:50
3507
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人