#优刊热文# #计算机科学# 【针对小数据与有限数据的机器学习综述 | Journal of Big Data】A review of machine learning with small and limited data http://t.cn/AXXsnyHO
丰富的大规模数据集推动了机器学习(ML)模型在性能和可扩展性方面的突破。然而,在许多领域和实际应用中,人们还必须应对小数据和极小数据集所带来的限制。本综述全面审查了专为数据稀缺这一根本限制场景所设计的机器学习方法中的前沿技术与挑战。
我们首先概述了小数据学习依赖的理论基础。随后,我们讨论了数据相关框架(即训练和评估方法等)以及算法架构(元学习和迁移学习)的最新进展。我们还探讨了为小数据设计模型时固有的权衡及相关问题,如过拟合、泛化误差和偏差-方差困境,并指出了能够克服这些问题的最小化干预措施。
此外,本综述涵盖了合成数据生成和基于模拟的方法在扩大数据可用性方面的作用,同时批判性地评估了这些技术对模型性能的影响。
最后,通过综合公开文献,我们阐明了旨在克服有限数据所带来挑战的新兴趋势与研究方向,例如引入领域知识和因果原理来指导学习过程,以及将符号推理与统计学习相结合。
期刊简介
Journal of Big Data 发表关于数据科学和数据分析的原创性研究成果。欢迎深度学习算法和大数据的应用相关稿件,调查论文和案例研究也在范围之内。
该期刊探讨大数据当前和未来面临的挑战,包括但不限于:数据捕获和存储;搜索、共享和分析;大数据技术;数据可视化;大规模并行处理架构;数据挖掘工具和技术;大数据机器学习算法;云计算平台;分布式文件系统和数据库;以及可扩展存储系统。
IF - 6.4 (2024)
5年 IF - 13.4(2024)
下载量:3.1M(2025)
JCR分区:计算机科学,理论与方法Q1
中科院分区:计算机科学2区
投稿到初审意见:57天(中值)
点击链接进入期刊查看详情:http://t.cn/AX6eJzjI
