科学网

 找回密码
  注册
linux文本处理工具awk
王梦南 2021-6-15 17:02
我们知道grep与sed工具主要是针对行操作,awk是linux系统中,针对文件列处理的工具。 awk的语法结构为:awk ' 条件1{操作1} 条件2{操作2}......' awk中有一些特殊的模块:BEGIN,NF,FS,NR BEGIN模块为:awk命令前的声明模块,例如: awk 'BEGIN{FS=:} pri ...
个人分类: linux|1628 次阅读|没有评论
[转载]如何从gff3文件中提取蛋白序列
王梦南 2021-6-11 23:22
sed-n'/^#/p'Sc_augustus_out.gff3|sed-n'/start/,/\]/p'|sed's/#startgene//g;s/proteinsequence\=\ //g;s/^\s//g'seq.fa
2178 次阅读|没有评论
gff3文件结果去重复之grep
王梦南 2021-6-11 17:58
当我们从ggf3文件中提取出蛋白序列,并与数据库比对获得基因ID后,我们会发现,我们获得的单个基因有多个ID。这是因为,我们设置了比对的p值阈值,因此只要是高于阈值的相似基因ID都会被列出。我们需要的是匹配度最高,也就是pvalue最高的ID,因此,我们需要去重复。 ...
9171 次阅读|没有评论
艺术的起源
王梦南 2021-6-10 23:17
在人类从最原始的猿人分化出来时,并没有所谓的艺术一说。目前,我们所了解人类最早的艺术形式,是绘画在山洞中壁画。这可以认为是艺术出现的雏形。我们需要关注一点,在早期智人能够进行壁画的创作时,智人已经能够通过劳动满足最基本的生存条件。艺术的出现,建立于物质满足生存 ...
3383 次阅读|没有评论
基因组功能注释
王梦南 2021-6-10 22:48
我们在通过基因组从头预测后,获得gff3文件。在gff3文件中,我们可看到组装的contig或scafford上的基因结构。从gff3文件中,我们无法得到基因的功能信息。此时,我们需要对已知结构的基因进行功能注释。 功能注释,即通过核酸或蛋白序列的 ...
4208 次阅读|没有评论
conda安装生信软件
王梦南 2021-6-9 23:02
在使用conda安装软件时,conda install software 时常出现错误,这是需要制定安装的库,将命令改为 conda install -c bioconda software 版本,即可安装成功。
1459 次阅读|没有评论
Linux虚拟机网络连接问题
王梦南 2021-6-6 23:58
今天在笔记本装了Centos8系统,在设置网络时遇见一些问题,但已经解决。具体解决的方法如下: 首先将网络链接方式设置为自定义(VMnet8NAT),然后启动DHCP服务。此时电脑依然无法上网,然后我们需要在Linux终端进入: /etc/sysconfig/network-scripts/ifcfg-ens33文件中,添加&nb ...
1085 次阅读|没有评论
linux中wtdbg2组装软件的参数-k
王梦南 2021-6-4 23:09
我们知道三代基因组测序,具有长读长的优点。wtdbg2软件,采用 De Bruijn算法。在进行三代测序基因组组装时,wtdbg2软件首先将长片段打断为1000bp左右的reads,在计算时软件将reads继续打断为长度为0-25bp长度的k-mer(也就是-k,-p选项的参数设置)。 &n ...
1586 次阅读|没有评论
[转载]linux系统环境变量详解
王梦南 2021-6-4 16:47
环境变量配置文件 在 Ubuntu 中有如下几个文件可以设置环境变量 1 、 /etc/profile: 在登录时 , 操作系统定制用户环境时使用的第一个文件 , 此文件为系统的每个用户设置环境信息 , 当用户第一次登录时 , 该文件被执行。(etc即为:etcetera,附件,附属物) 2 、 /etc/environment: 在登录时操作系统使用的第二个文 ...
8120 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-19 08:04

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部