Skip to content

方向性刺激提示

Li 等人,(2023)提出了一種新的提示技術,以更好地指導 LLM 生成所需的摘要。

訓練了一個可調節的策略 LM 來生成刺激/提示。越來越多地使用 RL 來優化 LLM。

下圖顯示了方向性刺激提示與標準提示的比較。策略LM可以很小,並且可以優化以生成指導黑盒凍結 LLM 的提示。