题目
请解释什么是过拟合,并列出常见的解决手段。
参考答案
过拟合(Overfitting):模型在训练集上表现很好,但在验证/测试集上表现差——即模型”记住了”训练数据的噪声与细节,而非学到通用规律,泛化能力差。
典型信号:训练损失持续下降,验证损失却开始上升。
成因:
- 模型容量过大(参数过多)
- 训练数据太少或噪声多
- 训练轮数过多
- 特征数量远多于样本数量
解决手段:
| 类别 | 手段 | 说明 |
|---|---|---|
| 数据 | 增加数据 | 更多样本/数据增强,治本之策 |
| 数据 | 降噪 | 清洗错误标注与异常值 |
| 模型 | 降低复杂度 | 减层/减神经元/减特征 |
| 正则 | L1/L2 正则 | 在损失加权重惩罚,L1 稀疏、L2 平滑 |
| 正则 | Dropout | 训练时随机失活神经元,强制冗余表征 |
| 训练 | 早停(Early Stopping) | 验证损失上升即停训 |
| 训练 | 交叉验证 | 选最优轮次与超参 |
| 集成 | Bagging/集成 | 多模型平均降方差(如随机森林) |
| 数据 | 特征选择 | 剔除冗余特征(Lasso/PCA) |
面试易错点:题目常以”下列哪种不属于过拟合解决手段”出现,需注意——数据增强、正则化、Dropout、早停属于;而增大学习率、增加训练轮数、增加模型层数不属于(反而可能加剧)。
出处:机器学习算法工程师面试题集(人人文库《2026 人工智能算法工程师机器学习深度学习面试题》)。
内容来源
整理自机器学习算法工程师面试题集
本站内容整理自公开面经与开源仓库,仅供学习交流,严禁杜撰。