科学网

 找回密码
  注册
[转载]如何从gff3文件中提取蛋白序列
王梦南 2021-6-11 23:22
sed-n'/^#/p'Sc_augustus_out.gff3|sed-n'/start/,/\]/p'|sed's/#startgene//g;s/proteinsequence\=\ //g;s/^\s//g'seq.fa
2145 次阅读|没有评论
gff3文件结果去重复之grep
王梦南 2021-6-11 17:58
当我们从ggf3文件中提取出蛋白序列,并与数据库比对获得基因ID后,我们会发现,我们获得的单个基因有多个ID。这是因为,我们设置了比对的p值阈值,因此只要是高于阈值的相似基因ID都会被列出。我们需要的是匹配度最高,也就是pvalue最高的ID,因此,我们需要去重复。 ...
9119 次阅读|没有评论
艺术的起源
王梦南 2021-6-10 23:17
在人类从最原始的猿人分化出来时,并没有所谓的艺术一说。目前,我们所了解人类最早的艺术形式,是绘画在山洞中壁画。这可以认为是艺术出现的雏形。我们需要关注一点,在早期智人能够进行壁画的创作时,智人已经能够通过劳动满足最基本的生存条件。艺术的出现,建立于物质满足生存 ...
3324 次阅读|没有评论
基因组功能注释
王梦南 2021-6-10 22:48
我们在通过基因组从头预测后,获得gff3文件。在gff3文件中,我们可看到组装的contig或scafford上的基因结构。从gff3文件中,我们无法得到基因的功能信息。此时,我们需要对已知结构的基因进行功能注释。 功能注释,即通过核酸或蛋白序列的 ...
4152 次阅读|没有评论
conda安装生信软件
王梦南 2021-6-9 23:02
在使用conda安装软件时,conda install software 时常出现错误,这是需要制定安装的库,将命令改为 conda install -c bioconda software 版本,即可安装成功。
1430 次阅读|没有评论
Linux虚拟机网络连接问题
王梦南 2021-6-6 23:58
今天在笔记本装了Centos8系统,在设置网络时遇见一些问题,但已经解决。具体解决的方法如下: 首先将网络链接方式设置为自定义(VMnet8NAT),然后启动DHCP服务。此时电脑依然无法上网,然后我们需要在Linux终端进入: /etc/sysconfig/network-scripts/ifcfg-ens33文件中,添加&nb ...
1060 次阅读|没有评论
linux中wtdbg2组装软件的参数-k
王梦南 2021-6-4 23:09
我们知道三代基因组测序,具有长读长的优点。wtdbg2软件,采用 De Bruijn算法。在进行三代测序基因组组装时,wtdbg2软件首先将长片段打断为1000bp左右的reads,在计算时软件将reads继续打断为长度为0-25bp长度的k-mer(也就是-k,-p选项的参数设置)。 &n ...
1544 次阅读|没有评论
[转载]linux系统环境变量详解
王梦南 2021-6-4 16:47
环境变量配置文件 在 Ubuntu 中有如下几个文件可以设置环境变量 1 、 /etc/profile: 在登录时 , 操作系统定制用户环境时使用的第一个文件 , 此文件为系统的每个用户设置环境信息 , 当用户第一次登录时 , 该文件被执行。(etc即为:etcetera,附件,附属物) 2 、 /etc/environment: 在登录时操作系统使用的第二个文 ...
8093 次阅读|没有评论
杂合与纯合
王梦南 2021-6-3 11:08
我们在进行性状的介绍时,经常会提到纯合杂合的问题。比如:Mendel的豌豆实验。Mendel的杂合与纯合主要是依据表型来进行区分。 我们时常会在测序或基因组装的过程中,接触到杂合率评估这个名词。这里的杂合率主要是指基因中的杂合。这个基 ...
3516 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 09:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部