|
俗话说巧妇难为无米之炊,而样品就是“米”,没有样品,就无法开展实验,无法获得数据,无法毕业,无法发文章。鉴于样品的重要性,非常有必要对样品进行详细且规范的记录,方便他人也方便自己。以下根据小编工作经验,并参考相关资料,总结下几个样品名、组名命名小技巧,欢迎补充!
1, 样品名唯一性
不管是自己做实验还是外送公司做实验,同一批送的样品,样品名字要唯一,不能有重复。
错误示例(×):a1,a2,a3,a4,a5,a5
正确示例(√):a1,a2,a3,a4,a5,a6
错误说明:错误示例中有两个a5,如果我们要对a5样品进行PCR,那么到底是处理第1个a5,还是处理第2个a5?
2, 样品名要有意义,简单、易读
样品名要根据实际样品属性进行命名。
错误示例(×):a,b,c,d,e,f
正确示例(√):con_1,con_2,con_3,exp_1,exp_2,exp_3
错误说明:遇见这种纯字母的样品名,如果没有额外的记录,那么1个月以后,连你自己都无法区分你的样品了。并且reviewer看到这种样品名后,他也很难知道你哪些是对照,哪些是实验,第一印象就不好。
3, 样品名不能过长或过短,尽量保持均衡
样品名长度无论对于实验人员还是分析人员都是一种挑战。
如果样品名过长:
1)在录入计算机时会更容易出错(因为需要打的字更多)。
2)仪器或者软件识别不了很长的名字,例如如果以样品名作为excel的sheet名,那么长度不能超过31,超过就会截断。
3)出图的时候,长的样品名会影响图的布局或者拼图,名字可能会被截断,或者出现图被缩小或者看不见的情况。想象一下你的样品名长度为256个字符,那么这个名字在任何图上都会出问题。
4)同一批样品名字有长有短,影响视觉效果。例如做热图时,名字有的很长,有的很短,短的名字下面会出现大片空白区域。
图1. 非常长的名字影响图的布局和美观度
错误示例(×):human_tissue_control_sample_24_hour_BCG_1, human_tissue_control_sample_24_hour_BCG_2
正确示例(√):BCG_1,BCG_2
错误说明:错误示例中,当利用样品名作为sheet名写到excel中时,会写入失败,因为human_tissue_control_sample_24_hour_BCG_1和human_tissue_control_sample_24_hour_BCG_2会被截断成相同的名字human_tissue_control_sample_24_,而excel中是不允许有两个sheet名一样,此时就会报错
4, 样品名尽量使用英文体系名字
样品名一般使用英文字母和数字组合进行命名。请勿使用罗马数字,中文等
错误示例(×):样品1(25%药物处理)
正确示例(√):s1_25pct
错误说明:使用计算机处理样品名时,如果不专门设置,中文名或者罗马数字会出现解码错误。例如可能会报:Non-ASCII character on line 1, but no encoding declared的错误。
5, 样品名缩写要遵循常规设定
错误示例(×):对照样品命名为cl_1,cl_2,cl_3
正确示例(√):对照样品命名为ctrl_1,ctrl_2,ctrl_3
错误说明:ctrl一般认为是control的缩写,尽量不要自己随意制造缩写。
6, 样品名区分大小写
错误示例(×):con_1,Con_1
正确示例(√):con_1,con_2
错误说明:由于windows系统上,不区分大小写,因此样品名con_1和Con_1是一个,违背了上面的样品唯一性规则。
7, 尽量避免同时使用1、l和I;以及0和O等
错误示例(×):l1,Il,1l
正确示例(√):尽量不要将数字1,字母l和字母I放一起。
错误说明:由于不同字体展示英文字母的形式不一样,因此常规情况下,我们肉眼很难区分I、l和1(分别是大写字母I、小写的字母l和数字1),或者难以区分0、O和o(分别是零、大写的字母O和小写的字母o)。
图2. 数字1还是字母l
8, 尽量避免使用纯数字
错误示例(×):1,2,3,4,5,6
正确示例(√):s1,s2,s3,t4,t5,t6
错误说明:由于纯数字既可以作为纯数字(integer),又可以作为字符串(string),因此在编程语言中尽量避免使用。
9, 尽量避免使用特殊符号
错误示例(×):s-1,s-2,s-3
正确示例(√):s_1,s_2,s_3
错误说明:如无特殊处理,R语言默认会把“-”变成“.”,所以请尽量避免使用。
图3. 特殊符号
10, 尽量避免使用系统或者程序内置关键词
错误示例(×):con
正确示例(√):ctrl
错误说明:由于windows系统中con为系统关键词,所以我们不能将我们的样品名写作con,因为这个名字的文件根本没法在windows系统上创建,会报“指定的设备名无效”错误。
图4. 常见内置关键词(避免使用)
11, 注意区分6和9、Z和2
特别对于手写的样品名,如果将6倒过来看就变成9了(图5);而2和Z的手写体也较难区分。
图5. 6还是9?(此处请将手机倒置查看)
正确的一般是在数字下面加一横线,在Z中间加个小横线,写成Ƶ。
12, 样品名不能带空格
错误示例(×):sample 1
正确示例(√):sample_1
一般编程语言都是不允许使用带有空格的变量名的,因此尽量避免在样品名中使用空格,可以使用下划线“_”代替。
13, 命名方式一致性
错误示例(×):s1,sample2,sample_3,sample-4
正确示例(√):s1,s2,s3,t4,t5,t6
错误说明:错误示例中样品名的规则很乱,让人看着不舒服。
14, 比较时组名顺序
错误示例(×):control vs experiment
正确示例(√):experiment vs control
一般我们比较的时候都是实验组vs对照组,因此,请将实验组写在前面,对照组写在后边。否则比较的时候,有可能会比反(也就是上调变下调,下调变上调)。
图6. 组名顺序不一样,上下调反了
样本名、组名不仅是给自己看的,也是给实验人员,数据分析人员,reviewer看的,因此要认真对待自己的样品名,这也是一个优秀科研人员的基本素养。
附:R变量命名规则
1)变量名是区分大小写的,比如:变量y和变量Y两者是不同变量;
2)变量名的首字母不能是数字和符号,比如:2y和_xy都不能作为变量名;
3)变量名不能包含空格号,比如:my name不能作为变量名,可以用my.name或者my_name替代。
微生信助力高分文章,用户58000+,引用750+
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 01:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社