针对机器学习中残缺数据的近似补全方法

通知公告

交大新闻

过刊浏览

10 现在的位置：首页 > 期刊导读 > 2012 > 10 >

【作者】曹卫权褚衍杰李显

【关键词】机器学习残缺项二次规划补全方法

【摘要】针对机器学习中含残缺项的数据不能被有效利用,导致分类和回归准确率不高的问题,提出了一种近似补全方法——k-ANNO方法.给定残缺的数据样本,该方法首先通过离线构建的图结构来近似搜索与该样本最接近的k个近邻顶点,然后采用快速二次规划估计各近邻的最优权重,最后基于权重值来补全样本中的残缺项,用户可以根据实际需求在补全效率与准确性之间折中.k-ANNO方法较好地解决了机器学习中普遍存在的数据残缺问题,有效抑制了数据残缺对分类和回归精度的干扰.利用多份公开数据集评估了k-ANNO方法的补全效果,结果表明:当加速比在2～10之间时,k-ANNO方法的分类错误率比已有的均值补全、C均值补全、自组织映射补全方法低1％～4％,回归均方根误差比已有方法低约0.5～2.0;当样本规模为4 000时,在不同加速比参数下,k-ANNO方法的计算效率比朴素k近邻方法高约35％～320％.

上一篇：气体放电管直流击穿电压测量技术的研究
下一篇： 采用深度学习的异步电机故障诊断方法

10 现在的位置：首页 > 期刊导读 > 2012 > 10 >

针对机器学习中残缺数据的近似补全方法

【作者】 曹卫权 褚衍杰 李显

【关键词】 机器学习 残缺项 二次规划 补全方法

【作者】曹卫权褚衍杰李显

【关键词】机器学习残缺项二次规划补全方法