微生信分享 http://blog.sciencenet.cn/u/chinapubmed 0代码在线绘制160+科研图

博文

实验送样、数据分析样品、组名命名规范、

已有 2658 次阅读 2022-11-13 17:14 |系统分类:科研笔记

俗话说巧妇难为无米之炊,而样品就是“米”,没有样品,就无法开展实验,无法获得数据,无法毕业,无法发文章。鉴于样品的重要性,非常有必要对样品进行详细且规范的记录,方便他人也方便自己。以下根据小编工作经验,并参考相关资料,总结下几个样品名、组名命名小技巧,欢迎补充!

1, 样品名唯一性

不管是自己做实验还是外送公司做实验,同一批送的样品,样品名字要唯一,不能有重复。

错误示例(×):a1a2a3a4a5a5

正确示例(√):a1a2a3a4a5a6

错误说明:错误示例中有两个a5,如果我们要对a5样品进行PCR,那么到底是处理第1个a5,还是处理第2个a5

2, 样品名要有意义,简单、易读

样品名要根据实际样品属性进行命名。

错误示例(×):a,bcdef

正确示例(√):con_1con_2con_3exp_1exp_2exp_3

错误说明:遇见这种纯字母的样品名,如果没有额外的记录,那么1个月以后,连你自己都无法区分你的样品了。并且reviewer看到这种样品名后,他也很难知道你哪些是对照,哪些是实验,第一印象就不好。

3, 样品名不能过长或过短,尽量保持均衡

样品名长度无论对于实验人员还是分析人员都是一种挑战。

如果样品名过长:

1)在录入计算机时会更容易出错(因为需要打的字更多)

2)仪器或者软件识别不了很长的名字,例如如果以样品名作为excel的sheet名,那么长度不能超过31,超过就会截断

3)出图的时候,长的样品名会影响图的布局或者拼图,名字可能会被截断,或者出现图被缩小或者看不见的情况。想象一下你的样品名长度为256个字符,那么这个名字在任何图上都会出问题。

4)同一批样品名字有长有短,影响视觉效果。例如做热图时,名字有的很长,有的很短,短的名字下面会出现大片空白区域。

fig2.png 

1. 非常长的名字影响图的布局和美观度

错误示例(×):human_tissue_control_sample_24_hour_BCG_1, human_tissue_control_sample_24_hour_BCG_2

正确示例(√):BCG_1BCG_2

错误说明:错误示例中,当利用样品名作为sheet名写到excel中时,会写入失败,因为human_tissue_control_sample_24_hour_BCG_1human_tissue_control_sample_24_hour_BCG_2会被截断成相同的名字human_tissue_control_sample_24_,而excel中是不允许有两个sheet名一样,此时就会报错

4, 样品名尽量使用英文体系名字

样品名一般使用英文字母和数字组合进行命名。请勿使用罗马数字,中文等

错误示例(×):样品1(25%药物处理)

正确示例(√):s1_25pct

错误说明:使用计算机处理样品名时,如果不专门设置,中文名或者罗马数字会出现解码错误。例如可能会报:Non-ASCII character on line 1, but no encoding declared的错误。

5, 样品名缩写要遵循常规设定

错误示例(×):对照样品命名为cl_1cl_2cl_3

正确示例(√):对照样品命名为ctrl_1ctrl_2ctrl_3

错误说明:ctrl一般认为是control的缩写,尽量不要自己随意制造缩写。

6, 样品名区分大小写

错误示例(×):con_1,Con_1

正确示例(√):con_1,con_2

错误说明:由于windows系统上,不区分大小写,因此样品名con_1Con_1是一个,违背了上面的样品唯一性规则。

7, 尽量避免同时使用1、l和I;以及0和O等

错误示例(×):l1,Il,1l

正确示例(√):尽量不要将数字1,字母l和字母I放一起。

错误说明:由于不同字体展示英文字母的形式不一样,因此常规情况下,我们肉眼很难区分I、l和1(分别是大写字母I、小写的字母l和数字1),或者难以区分0、O和o(分别是零、大写的字母O和小写的字母o

22.png 

2. 数字1还是字母l

 8, 尽量避免使用纯数字

错误示例(×):12,3,4,5,6

正确示例(√):s1s2s3t4t5t6

错误说明:由于纯数字既可以作为纯数字(integer),又可以作为字符串(string,因此在编程语言中尽量避免使用。

9, 尽量避免使用特殊符号

错误示例(×):s-1,s-2,s-3

正确示例(√):s_1,s_2,s_3

错误说明:如无特殊处理,R语言默认会把“-”变成“.”,所以请尽量避免使用。

111.png 

3. 特殊符号

10, 尽量避免使用系统或者程序内置关键词

错误示例(×):con

正确示例(√):ctrl

错误说明:由于windows系统中con为系统关键词,所以我们不能将我们的样品名写作con,因为这个名字的文件根本没法在windows系统上创建,会报“指定的设备名无效”错误。

figx.jpg 

4. 常见内置关键词(避免使用)

11, 注意区分6和9、Z和2

特别对于手写的样品名,如果将6倒过来看就变成9了(图5);而2和Z的手写体也较难区分。

fig4.png 

5. 6还是9?此处请将手机倒置查看)

正确的一般是在数字下面加一横线,在Z中间加个小横线,写成Ƶ

 12, 样品名不能带空格

错误示例(×):sample 1

正确示例(√):sample_1

一般编程语言都是不允许使用带有空格的变量名的,因此尽量避免在样品名中使用空格,可以使用下划线“_”代替。

 13, 命名方式一致性

错误示例(×):s1sample2sample_3,sample-4

正确示例(√):s1,s2,s3,t4,t5,t6

错误说明:错误示例中样品名的规则很乱,让人看着不舒服。

14, 比较时组名顺序

错误示例(×):control vs experiment

正确示例(√):experiment vs control

一般我们比较的时候都是实验组vs对照组,因此,请实验组写在前面,对照组写在后边。否则比较的时候,有可能会比反(也就是上调变下调,下调变上调)。

1.png 

6. 组名顺序不一样,上下调反了

 

样本名、组名不仅是给自己看的,也是给实验人员,数据分析人员,reviewer看的,因此要认真对待自己的样品名,这也是一个优秀科研人员的基本素养。

附:R变量命名规则

1)变量名是区分大小写的,比如:变量y和变量Y两者是不同变量;

2)变量名的首字母不能是数字和符号,比如:2y和_xy都不能作为变量名;

3)变量名不能包含空格号,比如:my name不能作为变量名,可以用my.name或者my_name替代。

微生信助力高分文章,用户58000+,引用750+

 

 

 

 




https://blog.sciencenet.cn/blog-707141-1363552.html

上一篇:利用m7Ghub数据库查询并使用iRNA-m7G软件预测RNA m7G修饰位点
下一篇:使用DESeq2进行转录组原始count标准化和差异分析
收藏 IP: 117.135.95.*| 热度|

1 梁洪泽

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-25 02:49

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部