T-Rex Label

改为中文:决策树是一种非参数化的监督学习方法,用于分类和回归,通过基于特征阈值的递归分割将输入空间划分为同质区域。每个内部节点根据某一特征的取值进行判断,每条分支对应判断结果,叶节点则给出预测标签或数值。常见分裂准则有基尼不纯度(Gini Impurity)、信息增益(Entropy)和方差减少(Variance Reduction)。决策树易于理解和可视化,且对数据预处理要求较低,但未经剪枝时容易过拟合。常用剪枝方法包括限制树深的预剪枝和基于成本复杂度的后剪枝。决策树是随机森林和梯度提升树等集成方法的基础。