基础理论简单

大模型解码策略对比：top-p / top-k / temperature 怎么选？

#采样策略#温度#top-k / top-p#重复惩罚

题目

请对比 greedy / beam search / top-k / top-p / temperature 等解码策略，说明各自适用场景与常见参数选择。

基础策略：

采样策略（引入随机性）：

Temperature（温度）：调整 softmax 锐度。 $T<1$ 更确定（分布尖锐）， $T>1$ 更随机（分布平坦）。 $T=0$ 退化为贪心。
Top-k 采样：只在前 $k$ 个最高概率 token 中采样。 $k$ 越大越多栞性越强。
Top-p（nucleus）采样：选累计概率达到 $p$ 的最小 token 集合中采样。自适应——分布集中时少选，分散时多选，比 top-k 更稳健。

对比表：

常见工程参数（对话场景）：temperature=0.7, top_p=0.9, top_k=50，并加 frequency_penalty / presence_penalty 抑制重复。

重复惩罚：

面试加分点：

出处：大模型面经、OpenAI API 文档、HuggingFace Transformers 文档。

内容来源

整理自大模型面经与 OpenAI / HuggingFace 文档

本站内容整理自公开面经与开源仓库，仅供学习交流，严禁杜撰。