|
题目:基于揭示数据中的隐藏模式以蛋白质和分子亲和力预测为例
主讲人:余卓航
地点: 腾讯会议
时间: 2024-01-15
简介:
1,数据是人工智能技术的核心之一。面对数据的多样性包括规则结构数据和潜在结构数据等。常见的规则结构数据如图片和文本等,这类数据有很强的空间位置关系和局部关联性现有的方法对于这类数据研究的非常广泛。潜在结构数据如蛋白质序列和分子序列等,这类数据只有序列信息,其中隐含了结构关系所以大多数方法不能起到作用。目前研究针对潜在结构数据的方法最流行的是图神经网络,因为图神经网络需要预先知道邻接矩阵,因此在未知的情况下无法使用图神经网络。现有的方法还未有人提出不需要先验信息并能准确预测的模型,所以我们在蛋白质-配体亲和力预测的例子中展示了我们提出的解决该问题的方法。
2,难点: 现有的研究潜在结构数据的方法无法摆脱先验支持,如何设计一个仅在数据表征的情况下摆脱先验信息并能给出准确率的预测结果。
参考文献:
[1] Mastropietro, A., Pasculli, G., & Bajorath, J. (2023). Learning characteristics of graph neural networks predicting protein–ligand affinities. Nature Machine Intelligence, 1-10.
[2] Gao, B., Qiang, B., Tan, H., Ren, M., Jia, Y., Lu, M., ... & Lan, Y. (2023). DrugCLIP: Contrastive Protein-Molecule Representation Learning for Virtual Screening. arXiv preprint arXiv:2310.06367.
[3] Mastropietro, A., Pasculli, G., & Bajorath, J. (2023). Learning characteristics of graph neural networks predicting protein–ligand affinities. Nature Machine Intelligence, 1-10.
[4] Mastropietro, A., Pasculli, G., & Bajorath, J. (2023). Learning characteristics of graph neural networks predicting protein–ligand affinities. Nature Machine Intelligence, 1-10.
[5] Merger, C., René, A., Fischer, K., Bouss, P., Nestler, S., Dahmen, D., ... & Helias, M. (2023). Learning Interacting Theories from Data. arXiv preprint arXiv:2304.00599.
[6] He, X., Hooi, B., Laurent, T., Perold, A., LeCun, Y., & Bresson, X. (2023, July). A generalization of vit/mlp-mixer to graphs. In International Conference on Machine Learning (pp. 12724-12745). PMLR.
[7] Murray, D., Yoon, J., Kojaku, S., Costas, R., Jung, W. S., Milojević, S., & Ahn, Y. Y. (2023). Unsupervised embedding of trajectories captures the latent structure of scientific migration. Proceedings of the National Academy of Sciences, 120(52), e2305414120.
[8] Huang, Y., Zeng, Y., Wu, Q., & Lü, L. (2023). Higher-order graph convolutional network with flower-petals laplacians on simplicial complexes. arXiv preprint arXiv:2309.12971.
[9] Bi, X., Zhang, S., Ma, W., Jiang, H., & Wei,
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 02:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社