AMiner平台由清华大学计算机系研发,拥有我国彻底自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。web
机器学习算法的样本复杂度(sample complexity)表示成功学习目标函数所需的训练样本数。更准确地说,样本复杂度是开发者须要提供给算法的训练样本的数量,以使算法返回的函数在最佳函数的任意小偏差范围内,而且几率任意接近1。样本复杂度有两种变体:弱变量固定特定的输入-输出分布。强变量采用全部输入-输出分布中最差状况的样本复杂性。算法
根据AMiner-NeurIPS 2020词云图和论文能够看出,与sample complexity是在本次会议中的热点,下面咱们一块儿看看sample complexity主题的相关论文。
微信
1.论文名称:Planning in Markov Decision Processes with Gap-Dependent Sample Complexity网络
论文连接:https://www.aminer.cn/pub/5ee3526a91e011cb3bff73ff?conf=neurips2020机器学习
简介:咱们提出MDP-GapE,这是一种新的基于轨迹的蒙特卡洛树搜索算法,用于在马尔可夫决策过程当中进行规划,其中对过渡具备有限的支持。 咱们证实了对MDP-GapE识别高几率接近最优动做所需的生成模型的调用次数的上限。 这个与问题相关的样本复杂性结果用探索过程当中访问的状态-动做对的次优差距表示。 咱们的实验代表,与其余在固定置信度设置中具备样本复杂性保证的算法相反,MDP-GapE在实践中也颇有效,而这些算法大可能是理论上的。svg
2.论文名称:Sample Complexity of Uniform Convergence for Multicalibration函数
论文连接:https://www.aminer.cn/pub/5eb3dc4191e011ce31f27f31?conf=neurips2020学习
简介:人们愈来愈关注机器学习系统中的社会问题,尤为是在公平方面。多重校准提供了解决组公平性的综合方法。在这项工做中,咱们解决了多重校准偏差,并将其与预测偏差解耦。使公平性度量标准(多重校准)与准确性(预测偏差)脱钩的重要性在于二者之间固有的权衡,以及有关“正确权衡”的社会决策(监管机构屡次强加)。咱们的工做为多重校准偏差的统一收敛保证提供了样本复杂性界限,这意味着不管准确度如何,咱们均可以保证经验和(真实)多重校准偏差相近。咱们强调咱们的结果:(1)比之前的界限更笼统,由于它们适用于不可知论和可实现的设置,而且不依赖于特定类型的算法(例如递归私有),(2)比之前的多重校准更好样本复杂度界限和(3)暗示了经典校准偏差的一致收敛保证。
测试
3.论文名称:Estimating decision tree learnability with polylogarithmic sample complexity编码
论文连接:https://www.aminer.cn/pub/5f7fdd328de39f0828397e8a?conf=neurips2020
简介:咱们代表自上而下的决策树学习启发式方法适合于高效的可学习性估计:对于单调目标函数,这些启发式方法构造的决策树假设的偏差能够经过多对数估计的多个带标签的示例进行估计,其指数小于运行这些启发式方法,而且实际上比学习一个好的决策树所需的信息理论最小值小得多。这增长了少许但不断增加的基础学习算法列表,这些算法已被证实适合于可学习性估计。在得出此结果的过程当中,咱们设计并分析了自上而下的决策树学习启发式方法的样本有效迷你批处理版本,并代表它们得到了与完整批处理版本相同的可证实保证。咱们进一步给出这些启发式的“活动本地”版本:给定一个测试点x^ star,咱们展现如何用多对数方法来计算决策树假设T的标签x^star许多带有标签的示例,其数量比学习T所需的数量小得多。
4.论文名称:Sample complexity and effective dimension for regression on manifolds
论文连接:https://www.aminer.cn/pub/5ee8986891e011e66831c35b?conf=neurips2020
简介:咱们考虑使用重现内核希尔伯特空间方法对流形进行回归的理论。 流形模型出如今各类各样的现代机器学习问题中,咱们的目标是帮助理解利用流形结构的各类隐式和显式降维方法的有效性。 咱们的第一个主要贡献是根据微分几何创建Weyl定律的一种新的非渐近形式。 因而可知,流形上的光滑函数的某些空间其实是有限维的,其复杂度根据流形维数而不是任何环境数据维来缩放。 最后,咱们显示给定的(可能有噪声的)函数值在流形上随机地均匀地获取,核回归估计量(从流形的频谱分解中得出)产生由有效维数控制的偏差范围。
5.论文名称:Revisiting the Sample Complexity of Sparse Spectrum Approximation of Gaussian Processes
论文连接:https://www.aminer.cn/pub/5f7fdd328de39f0828397ec0?conf=neurips2020
简介:咱们为高斯过程引入了一种新的可伸缩近似,它具备可证实的保证,同时可在其整个参数空间上保持有效。 咱们的近似值是经过对稀疏频谱高斯过程(SSGP)进行改进的样本复杂度分析得到的。 特别是,咱们的分析代表,在必定的数据分解条件下,SSGP的预测和模型证据(用于训练)能够很好地近似具备较低样本复杂度的完整GP的预测和模型证据。 咱们还开发了一种新的自动编码算法,该算法可找到一个潜在空间,以将潜在输入坐标分解为良好分隔的聚类,这适合咱们的样本复杂度分析。 咱们在几个基准上验证了咱们提出的方法,并为咱们的理论分析提供了有但愿的结果。
根据主题分类查看更多论文,扫码进入NeurIPS2020会议专题,最前沿的研究方向和最全面的论文数据等你来~
扫码了解更多NeurIPS2020会议信息
添加“小脉”微信,留言“NeurIPS”,便可加入【NeurIPS会议交流群】,与更多论文做者学习交流!
本文同步分享在 博客“AMiner科技”(CSDN)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。