|
数据分析模型评估
赵秀举,41*3915,dzrdez@163.com
数据分析模型尤其是人工智能深度学习模型和[预训练]大模型,除了模型参数(准确度、灵敏度、特异度、F分数、G分数、曲线下面积)外,需要评估实时性(实时低延迟)、稳健性(对样本或变量的增减不敏感)、可扩展性(快速泛化迁移到其它场景尤其相似场景)、可解释性(深度神经网络或深度森林每一层有确切生物学或物理学意义,白盒化)和效率能耗(总碳排放)。
我偏理论,技术弱。所以我一直觉得思想、想法、方法、技术、算法、代码等都不容易。书斋田野兼顾,学者顾问合一,尊重不同层面,有机会结合,这本就是生态系统的意义。有了孙宇熙的图数据库、王峰的人群队列和杨中正的样本库,我的想法才往前推动了一点。图数据库具备第三代人工智能四要素。图计算是人工智能领域与机器学习并列的学科。图数据库是计算机科学与技术领域基础软件。(国家自然科学基金委NSFC信息科学代码F,计算机F02,人工智能F06)http://blog.sciencenet.cn/blog-392245-1308288.html
我提出生物数据学,倡议生物数据信息智能技术BDIIT融合,凝炼数据共享KANC模式和数据活动DCSCE机制;概括类脑图数据库概念,总结图数据库与群体学习等机器学习算法和混合模型的抉择和结合规则,梳理从数据整合到图数据库的背景过程,大家都可以用(详询dzrdez@163.com)。疏漏和不足之处,请告知。共同构建数据生态,促进远缘交叉融合,推动原创探索。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-19 04:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社