方向性刺激提示¶
Li 等人,(2023)提出了一種新的提示技術,以更好地指導 LLM 生成所需的摘要。
訓練了一個可調節的策略 LM 來生成刺激/提示。越來越多地使用 RL 來優化 LLM。
下圖顯示了方向性刺激提示與標準提示的比較。策略LM可以很小,並且可以優化以生成指導黑盒凍結 LLM 的提示。
Li 等人,(2023)提出了一種新的提示技術,以更好地指導 LLM 生成所需的摘要。
訓練了一個可調節的策略 LM 來生成刺激/提示。越來越多地使用 RL 來優化 LLM。
下圖顯示了方向性刺激提示與標準提示的比較。策略LM可以很小,並且可以優化以生成指導黑盒凍結 LLM 的提示。