| 改善基于图表半监督学习的实例选择方法 | 雷峰网
0
本文作者: 章敏 | 2016-08-24 16:51 |
导读:PRICAI 2016是环太平洋国际人工智能会议 ,每两年举行一次,大会专注于人工智能的理论,技术及其在社会领域的应用,和其对于太平洋沿岸国家经济的重要性。
摘要:基于图表半监督学习(GSSL)是最重要的半监督学习(SSL)范式之一。尽管GSSL方法在很多情况下都有用,但在使用无标记数据时它可能会降低性能。本文中,我们提出了一种新的GSSL方法:基于实例选择的GSSLIS以降低性能恶化的可能性。我们的基础想法是给出一系列未标记的实例,利用所有未标记的实例并非是最好的方法;相反,我们应该利用那些有很高概率有助于改善性能的未标记实例,同时避免使用有高风险的未标记实例。大量的数据实验表明,我们提出的方法性能恶化的机会比大多数最优GSSL方法小得多。
关键词:基于图表的半监督学习·性能恶化·实例选择
王海(Hai Wang)
职位:南京大学计算机科学与技术系理科硕士/LAMDA Group
研究方向:数据挖掘,机器学习
导师:李宇峰
职位:南京大学计算机科学与技术系博士助理研究员/LAMDA Group
研究方向:机器学习,数据挖掘,半监督学习,多实例学习,多标记学习等
相关出版物:
·Graph Quality Judgement: A Large Margin Expedition(IJCAI,2016)
·Kenerlized matrix factorization for collaborative filtering(SDM,2016)
Via:PRICAI 2016
PS : 本文由雷锋网独家编译,未经许可拒绝转载!
雷峰网原创文章,未经授权禁止转载。详情见转载须知。