近日,开云(中国)弘深青年学者冯磊撰写的论文《Pointwise Binary Classification with Pairwise Confidence Comparisons》在第38届国际机器学习会议(The 38th International Conference on Machine Learning)(CCF A类)上发表。这是机器学习领域公认的顶级国际学术会议,在学术界享有极高的声誉,计算机学院首次以第一单位在该会议上发表学术论文,实现了零的突破。
该论文的第一作者与通讯作者均为冯磊,合作者来自日本东京大学、日本理化学研究所先进智能研究中心、新加坡南洋理工大学、澳洲昆士兰大学、中国香港浸会大学等著名高校或研究机构。
传统的监督式学习技术已经取得了巨大进步,但却需要大量精准的标记数据。在许多现实场景中,由于隐私、机密性或安全性等原因,收集大量精准标记数据会变得太困难。这种时候,样本的点式标记将无法访问。因此研究者们开始考虑使用成对的而不是点式的标记。然而,由于成对标记表示两个数据点是否共享同一点式标记,若任意一个样本的正标记或负标记的后验概率接近相等,则不容易收集到其成对标记。
为了解决上述问题,冯磊与合作者们提出了一种被称为“成对比较分类”的新型弱监督二分类问题,其中只有成对的未标记数据被提供,而我们仅知道其中一个比另一个有更大的概率拥有正标记。针对这个新型弱监督二分类问题,冯磊与合作者们首先从数学上对成对比较数据的生成过程进行建模,推导出了一种具有理论保证的无偏风险估计量,并进一步利用修正函数对其进行改进以解决在使用复杂模型时所面临的过拟合问题。然后,还将成对比较分类问题与噪声标记学习问题相联系,提出了一种渐进式的无偏风险估计量,并通过引入一致性正则化对其进行了改进。针对该论文中所提出的算法还进一步从理论上提供了估计误差上界,以证实其可学习性。最后,实验证实了所提出算法的有效性,并表明成对比较分类是除了成对标记学习外另一种有价值与实用性的成对监督问题。
个人简介:
冯磊,男,出生于1995年4月,博士毕业(直博并提前毕业)于新加坡南洋理工大学,目前为开云(中国)弘深青年学者引进人才、博导,兼任日本理化学研究所先进智能研究中心(RIEKN Center for Advanced Intelligence Project)客座科学家(Visiting Scientist)。自2021年1月起加入计算机学院工作至今,入职时仅25岁,这是计算机学院目前年龄最小的引进人才,也是学院有史以来首次直接给应届博士毕业生正高/博导岗位。冯磊的主要研究方向为机器学习、数据挖掘、人工智能。近三年来,已在ICML、NeurIPS、KDD、CVPR、AAAI、IJCAI等国际顶级(CCF A类)会议与中科院一区期刊上以第一作者或通讯作者发表论文十余篇。研究成果在弱监督学习领域做出了许多重要的贡献。在学术服务方面,担任IJCAI 2021高级程序委员会委员(senior program committee member),ICML 2021专家审稿人(expert reviewer),以及其他国际顶级(CCF A类)会议(包括NeurIPS、KDD、CVPR、ICCV、AAAI)的程序委员会委员/审稿人,并受邀担任多个国际知名期刊(包括JMLR、IEEE TPAMI、IEEE TIP、IEEE TNNLS、MLJ)审稿人。
个人主页:/info/1325/5242.htm