把RoPE扔掉，AI更能看懂長上下文，Transformer作者團隊開源大模型預訓練新方法

技術背景與問題提出

針對大模型在處理長文本時的困難，Transformer架構的核心作者之一Llion Jones領導的研究團隊，提出了一項新技術DroPE，旨在解決長上下文理解的問題。

DroPE技術不依賴昂貴的長上下文訓練，便能實現無監督零次推斷（zero-shot inference）的上下文擴展，讓模型在不進行額外訓練的情況下，也能處理更長的輸入序列。

團隊已在一系列開源的預訓練大語言模型上驗證了此方法的有效性，並展示了其在長序列處理上的優異表現。