chen7qi的个人博客分享 http://blog.sciencenet.cn/u/chen7qi

博文

这个为生信学习打造的开源Linux教程真香!!!

已有 2096 次阅读 2020-9-1 10:58 |系统分类:科研笔记

生物信息学习的正确姿势

NGS系列文章包括NGS基础在线绘图、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程)、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-step))、批次效应处理等内容。

1 Linux初探,打开新世界的大门

1.1 Linux系统简介和目录理解

1.1.1 为什么要用Linux系统1.1.2 Linux系统无处不在1.1.3 免费的Linux系统来一套1.1.4 Linux系统登录-联系远方的她1.1.5 初识Linux系统 - 黑夜中的闪烁是你的落脚点1.1.6 我的电脑在哪?1.1.7 系统配置怎样?来看看256M硬盘的服务器1.1.8 看下目录下都有什么1.1.9 新建一个目录1.1.10 访问文件1.1.11 查看帮助,获取可用命令行参数1.1.12 小结1.1.13 做个小测试

1.2 Linux下文件操作

1.2.1 文件按行翻转和按列翻转1.2.2 新建文件的n种方式1.2.3 文件拷贝、移动、重命名、软链1.2.4 Linux下命令的一些突发事故1.2.5 了解和操作你的文件1.2.6 小结和练习

1.3 Linux终端常用快捷操作

1.4 Linux下的标准输入、输出、重定向、管道

1.5 Linux文件内容操作

1.5.1 命令组合生成文件1.5.2 文件排序原来有暗仓

1.6 Linux下的查找命令 - 文件哪里跑

1.6.1 命令/可执行程序查找 - 定位脚本的位置1.6.2 locate普通文件快速定位1.6.3 find让文件无处可逃 find按时间查找限制查找深度1.6.4 按文件内容查找 grep

1.7 一句话加速grep近30倍

1.7.1 获取单基因表达量1.7.2 那如果获取多个基因怎么操作呢?

1.8 监控程序的运行时间和资源占用

2 Linux下软件安装相关

2.1 文件属性和可执行属性

2.1.1 文件属性2.1.2 可执行属性

2.2 PATH和path,傻傻分不清

2.2.1 小事也不能忽略

2.3 软件安装的几种传统方式

2.3.1 系统包管理器安装2.3.2 下载二进制文件2.3.3 源码编译安装2.3.4 Python包的安装2.3.5 Anaconda的两个福利2.3.6 R和R包的安装2.3.7 Perl包的安装

2.4 Conda安装配置生物信息软件

2.4.1 Conda安装和配置2.4.2 Conda基本使用2.4.3 Conda的channel2.4.4 创建不同的软件运行环境2.4.5 移除某个conda环境2.4.6 Conda配置R2.4.7 Conda环境简化运行2.4.8 Conda环境备份2.4.9 Conda环境导出和导入2.4.10 Conda软件安装 core dump error/Segment fault/段错误 怎么办2.4.11 Conda为什么越来越慢?2.4.12 Conda是如何工作的2.4.13 Conda哪一步慢?2.4.14 如何提速Conda2.4.15 下载提速2.4.16 使用conda-pack直接从已经安装好的地方拷贝一份 (同一操作系统)

2.5 Docker安装

2.5.1 Docker能做什么2.5.2 Docker的几个基本概念2.5.3 安装和配置2.5.4 Docker用户权限2.5.5 Docker试用2.5.6 Docker系统基本操作2.5.7 使用Dockerfile自动构建镜像2.5.8 Docker的特征2.5.9 Docker使用注意

2.6 Makefile知识

2.6.1 参考

3 Linux神器

3.1 正则表达式替换文本随心所欲

3.2 awk-生信分析不可缺少

3.2.1 awk基本参数解释3.2.2 awk基本常见操作3.2.3 awk糅合操作 - 命令组合体现魅力

3.3 SED命令 - 文本替换舍我其谁

3.3.1 sed基本参数解释3.3.2 常见操作

3.4 VIM的使用

3.4.1 初识VIM3.4.2 VIM中使用正则表达式

3.5 有了这些,文件批量重命名还需要求助其它工具吗?

3.5.1 简单重命名rename演示3.5.2 复杂重命名假如已经有对应关系组合文件名,使用mv重命名使用rename会不会稍微简单一点?从原文件名获取对应关系基于paste

3.6 耗时很长的程序忘加nohup就运行了怎么办?

4 Bash 字符串处理

4.1 Bash特殊字符

4.2 Bash变量

4.3 Bash操作符

4.4 Shell中条件和test命令

4.5 Shell流控制

4.6 Shell函数

4.7 输入输出

4.8 命令行处理 命令行处理命令

4.9 进程和作业控制

4.10 寻找Cas9的同源基因并进行进化分析

4.11 如何获取目标基因的转录因子(上)——biomart下载基因和motif位置信息

4.11.1 文件准备4.11.2 什么是bed文件?4.11.3 BioMart数据下载

4.12 如何获取目标基因的转录因子(下)——Linux命令获取目标基因TF

4.12.1 基础回顾4.12.2 文件格式处理4.12.3 计算基因的启动子区4.12.4 取两文件的交集4.12.5 提取我们关注的基因4.12.6 重点总结

4.13 emboss的使用

4.14 使用samtools计算SNP

4.15 Bedtools使用

4.16 SRA toolkit使用

4.17 生信流程开发

4.18 数据同步和备份

4.18.1 原创拷贝scp4.18.2 镜像备份和增量同步 rsync4.18.3 增量备份,记录各个版本 rdiff-backup

5 生物信息中Linux命令练习

5.1 统计GTF文件中染色体数目?

5.2 统计GTF文件中基因数目?

5.3 计算GTF中外显子总长度?

5.4 计算GTF文件中基因所拥有的平均转录本数目

5.5 生成一个多行Fasta测试序列供后续运算 (也可使用我们前面提供的脚本生成)

5.6 test.fa中的序列全转成大写

5.7 计算多行FASTA文件test.fa中每条序列长度

5.8 多行FASTA转单行FASTA序列

5.9 取出单行FASTA文件中序列长度大于40的序列的名字

5.10 分别用awkgreptest.fa中提取给定ID对应的序列

5.11 利用AWK对基因表达数据进行标准化

5.12 写出3种写法,去掉上一题test.expr矩阵中的第一行?

5.13 分别用awksedtest.expr矩阵加上标题行?

5.14 给定一个BAM文件,怎么计算有多少基因组区域被测到了?平均测序深度是多少?

5.15 如何使用bedtools的其它工具或其它Linux命令实现bedtools jaccard子功能?

5.16 如何使用命令生成这次课程的目录


点击Linux学习直达教程




https://blog.sciencenet.cn/blog-118204-1248785.html

上一篇:别人的电子书,你的电子书,都在bookdown
下一篇:不用做实验也可以轻松找到癌症组织特异性基因
收藏 IP: 125.33.17.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 22:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部