T-Rex Label

集成学习是一类通过组合多个基础模型(学习器)来构建最终预测模型的技术,能够显著提升预测准确性和稳定性。集成利用各个基础模型之间的差异性——它们各自的随机误差相互抵消——同时保留单一模型的优势。主要方法包括 Bagging(自助聚合),即在重采样的数据子集中训练多个模型,然后对预测结果取平均或多数表决;Boosting(提升方法),按序训练模型,聚焦前一轮误分类样本(如 AdaBoost、Gradient Boosting、XGBoost);以及 Stacking(堆叠),训练元学习器对基础学习器输出进行再学习。集成学习在各类竞赛中常获佳绩,并广泛应用于表格数据、计算机视觉和自然语言处理领域。