A strategy to apply machine learning to small datasets in materials science

摘要:机器学习的方法在材料科学研究中的应用越来越广泛。然而,与其他领域相比,材料数据集通常更小,有时更为多样化,但材料数据集的大小对训练机器学习模型的影响还未有人进行研究,这阻碍了使用小样本的材料数据集建立高精度的机器学习模型。本文分析了材料数据的大小和机器学习模型的预测能力之间的基本相互作用。结果显示数据大小的影响不是直接影响模型的精度,而是通过影响模型的自由度(DoF),间接影响模型的预测精度
相关文章
相关标签/搜索