BETVLCTOR伟德官方网站王鑫副教授指导2022级博士研究生隽歆同学的论文" Molecular Data Programming: Towards Molecule Pseudo-labeling with Systematic Weak Supervision"被CCF-A类会议CVPR 2024接收。CVPR,全称为计算机视觉和模式识别会议( IEEE / CVF Computer Vision and Pattern Recognition Conference),是计算机视觉领域的顶级国际会议。
第一作者隽歆同学主要从事图数据上的弱监督学习和不平衡学习等研究工作,本工作与MIT博士后周楷雄博士后和陈天龙博士后合作完成。
论文题目:Molecular Data Programming: Towards Molecule Pseudo-labeling with Systematic Weak Supervision
论文作者:隽歆(2022级博士研究生)
收录会议:CVPR’2024
指导教师:王鑫副教授
论文概述:
分子图机器学习取得巨大进步的前提是有大量标记数据的支持。在许多现实世界的场景中,标记的分子图数量有限或者获取起来十分繁琐。最近的伪标记方法通常基于单一领域知识设计,因此无法理解全面的分子图结构配置,并且限制了它们在不同生化背景下的泛化能力。为此,我们引入了一种创新的分子伪标记处理范式,称为分子图数据编程(MDP)。具体来说,我们通过构建多个图标记函数采用系统化的监督源,涵盖了图核、分子指纹和拓扑特征的各种分子图结构知识。它们为未标记的分子创建了不确定和偏差标签。为了解决不同伪标记之间的决策冲突,我们设计了一个标签同步器来差分建模标记函数之间的置信度和相关性,从而产生适用于特定应用的概率分子图标签。这些概率分子图标签用于训练分子图分类器,以提高其泛化能力。在八个基准数据集上进行的大量实验证明了MDP在弱监督分子图分类任务上的有效性。