ON THE ROLE OF ATTENTION HEADS IN LARGE LANGUAGE MODEL SAFETY 原文摘要 研究背景与现状 背景 LLMs 在多种语言任务上表现出色,但其安全防护措施...