气宇轩分享 http://blog.sciencenet.cn/u/yufree

博文

污染物危害评价攻略

已有 4315 次阅读 2014-7-4 12:39 |个人分类:科搜研手册|系统分类:科研笔记| 数据库, 污染物, 危害

只要提及污染物,大家反映基本一致,那就是有害,然后就完了,不论污染物名字是呋喃咪唑联苯醚孔雀石绿二噁英双酚A之类其实对多数人而言没太多区别,都是有害,可能名字长一点会觉得危害大一点。这里就不吐槽污染物那些乱七八糟的命名法了,这篇是写给那些想对具体污染物危害进行评价但又没有太多专业知识的人的一篇攻略。

第一步 搞到CAS号

污染物有天然的人为的,拜祖宗进化所赐,原本可能有毒有害的都适应差不多了,不适应的可能都成化石了,所以我们很少听说氧气中毒之类的话,你要不潜水,估计也体会不到被氮气搞晕了的情况。但也有些不那么常见的物质没有一个生存进化的机制督导所以毒性还是很高,这些自然源的污染物一般是混合的,不那么好解析,但天然的从来都不代表无害的,只是工业社会中一种自以为是且有商业价值的联想而已。说道人为的,那就相对简单,工业品的基础是矿产,矿产中煤炭与石油不仅仅是资源还是能源,多数现代人口中的化学物质的来源除了固氮就是这些石化产品,有些如多氯联苯本来是作为阻燃剂等使用的,有的则属于无意识产生如二噁英一般来自低温燃烧,但只要是你知道名字的,报纸网站上见过的,基本都是前人研究过的。一般而言,美国化学会下的化学文摘会为在文献中出现过有明确指称的物质一个编号,这就是CAS号,如果想对一个物质的性质进行检索,那么至少你要有这个号。当然,也有没编号的,这时候可以用SMILES之类的化合物表示方法,不过估计日常应该见不到。当你看到媒体报道了检出某种物质后,一般拿名字去维基百科试试就能见到CAS号,其他的内容就不用看了,维基上很多物质的毒性描述不全,有时还会有所偏重。

第二步 eChemPortal 检索

eChemPortal 是OECD提供的一个检索工具,对接了美国,加拿大,欧盟等不同地域的政府或研究机构提供的化合物物化性质/环境行为/毒性数据库,可以通过CAS号直接查询相关的数据,也可以通过物化性质去筛选符合条件的化合物。但值得注意的是毒性数据一般会有不同的endpoint供选择,例如同一种化合物的皮肤毒性与神经毒性数据会是不一样的,有的可能还有缺失。一般而言,化学品会经过急慢性毒性测试(致死),致癌,致畸变等的测试,但可能较少化学品有翔实的endpoint数据,这个开销很大,涉及专业知识也较深,一般以期刊论文形式发表。虽然数据库会尽可能快而全的收录相关数据,但如果你想了解某种污染物的某种毒性没有数据,那么就会进入第三步。

第三步 QSAR Toolbox

中学化学常说一句话:结构决定性质。QSAR(定量结构效应关系)的本质就在于此,当我们收集足够的数据后,可以将化合物某些结构与效应进行建模,进而预测某些新结构化合物的效应,在这里效应指的是毒性描述。例如,我收集100种多氯联苯的分子描述符(X)与急性毒性实验数据(Y),以被试的半数致死量表示,对XY建模,现在有一种多氯联苯不在这个库里,但这个分子的分子描述符(x)可以通过量子化学的方法计算得到,将x代入建好的模型就可以对急性毒性试验数据y进行估计。这样不用做实验我们就可以得到一个预测数据。但前提是你这种物质要与训练数据足够相似且你选择的分子描述符确实与某些效应相关,这里面需要很多专业知识。好在现在也有现成的工具,OECD的QSAR Toolbox可以大幅简化这一过程,你只要输入CAS号与你关心的毒性终点,程序可自动生成一个QSPR模型对原本不存在的数据进行预测,当然里面需要调节很多参数,网页下端有教程,但目前来说是最傻瓜的了。如果你打算做paper提高预测精度或预测范围,相信我,这是一个很痛苦的过程,统计推断与专业知识的对应会把人搞疯的。这样你大概就得到了你想要问题的答案。其实类似的软件很多,对非专业人员最友好的可能就是这个了。

回顾一下,想知道一种物质更准确的毒性,首先提取CAS号作为唯一标识符,然后在eChemPortal 里检索,如果检索到相关数据break,没有则使用QSPR Toolbox构建模型根据结构相似物质的相关毒性推断你关心物质的毒性,至此结束。



https://blog.sciencenet.cn/blog-430956-808966.html

上一篇:漫谈统计学习中的 Bias-Variance Trade-Off思想
下一篇:动态报告与可复算性研究简介
收藏 IP: 159.226.240.*| 热度|

2 强涛 Vetaren11

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 00:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部