最猛黑人xxxⅹ黑人猛交_影音先锋在线视频_黄色带三级九九九_亚日韩精品国产系列免费观看_一区与二区精品在线_亚洲黄色毛片视频_午夜伦情电午夜伦情电影8090_亚洲三级毛片_三级欧美综合精品_国产黄色片子在线观看

站長(zhǎng)之家 - 業(yè)界 2025-03-12 22:51:03

大語(yǔ)言模型Transformer架構(gòu)的稀疏注意力機(jī)制與超長(zhǎng)文本處理優(yōu)化,清華大學(xué)等基于APB的序列并行推理模型在大規(guī)模文本處理中相比Flash Attention提升10倍的性能

聲明:本文來(lái)自于(ID:ykqsd.com)授權(quán)轉(zhuǎn)載發(fā)布。

機(jī)器之心由

機(jī)器之心編輯

在 ChatGPT 爆火兩年多的時(shí)間里,大語(yǔ)言模型的上下文窗口長(zhǎng)度基準(zhǔn)線被拉升,以此為基礎(chǔ)所構(gòu)建的長(zhǎng) CoT 推理、多 Agent 協(xié)作等類型的高級(jí)應(yīng)用也逐漸增多。

隨之而來(lái)的是,長(zhǎng)文本推理速度被提出更高要求,而基于現(xiàn)有 Transformer 架構(gòu)的模型受限于注意力機(jī)制的二次方復(fù)雜度,難以在較短時(shí)延內(nèi)處理超長(zhǎng)文本請(qǐng)求。

針對(duì)這一痛點(diǎn),清華大學(xué) NLP 實(shí)驗(yàn)室聯(lián)手中南大學(xué)、北京郵電大學(xué)以及騰訊微信 AI 實(shí)驗(yàn)室取得了突破,共同提出了APB 框架—— 其核心是一個(gè)整合了稀疏注意力機(jī)制的序列并行推理框架,通過(guò)整合局部 KV 緩存壓縮方式以及精簡(jiǎn)的跨 GPU 通信機(jī)制,解決了長(zhǎng)上下文遠(yuǎn)距離語(yǔ)義依賴問(wèn)題,在無(wú)性能損失的前提下大幅度提升超長(zhǎng)文本預(yù)填充的效率。

在 128K 文本上,APB 能夠出色地平衡性能與速度,達(dá)到相較于傳統(tǒng) Flash Attention 約 10 倍的加速比,在多種任務(wù)上甚至具有超越完整 Attention 計(jì)算的性能;與英偉達(dá)提出的同為分布式設(shè)定下的Star Attention 相比,APB 也能達(dá)到 1.6 倍加速比,在性能、速度以及整體計(jì)算量上均優(yōu)于 Star Attention。

這一方法主要用于降低處理長(zhǎng)文本請(qǐng)求的首 token 響應(yīng)時(shí)間。未來(lái),APB 有潛力運(yùn)用在具有低首 token 響應(yīng)時(shí)間要求的模型服務(wù)上,實(shí)現(xiàn)大模型服務(wù)層對(duì)長(zhǎng)文本請(qǐng)求的高效處理。

瓶頸:加速長(zhǎng)文本預(yù)填充效率

長(zhǎng)文本預(yù)填充的效率受到計(jì)算的制約。由于注意力機(jī)制的計(jì)算量與序列長(zhǎng)度呈二次方關(guān)系,長(zhǎng)文本的計(jì)算通常是計(jì)算瓶頸的。主流加速長(zhǎng)文本預(yù)填充的路線有兩種,提升并行度減少計(jì)算

然而,簡(jiǎn)單地提升并行度和減少計(jì)算并不能在加速長(zhǎng)文本預(yù)填充上取得足夠的效果。若要將二者結(jié)合又具有極大挑戰(zhàn),這是因?yàn)橄∈枳⒁饬C(jī)制中,決定計(jì)算何處注意力通常需要完整輸入序列的信息。在序列并行框架中,每個(gè) GPU 僅持有部分 KV 緩存,無(wú)法在不通過(guò)大規(guī)模通信的前提下獲得足夠的全局信息來(lái)壓縮注意力的計(jì)算。

針對(duì)這一問(wèn)題,現(xiàn)有研究提出了兩種關(guān)鍵方法:英偉達(dá)提出的 Star Attention 通過(guò)去除序列并行中的所有通信,僅計(jì)算 GPU 局部區(qū)域的注意力,但這種簡(jiǎn)化策略導(dǎo)致顯著的計(jì)算效率損失。另一項(xiàng)研究由卡內(nèi)基梅隆大學(xué)提出,即 APE 方法,專注于 RAG 桅ma場(chǎng)景下的長(zhǎng)文本預(yù)填充加速,通過(guò)均勻劃分上下文、縮放注意力計(jì)算并調(diào)整 Softmax 溫度,實(shí)現(xiàn)了并行編碼。然而,該方法在處理需要遠(yuǎn)距離依賴的文本時(shí)仍存在一定效率損失。

與上述方法相比,APB 通過(guò)創(chuàng)新設(shè)計(jì)面向序列并行的低通信稀疏注意力機(jī)制,成功構(gòu)建了一個(gè)在計(jì)算效率和性能表現(xiàn)上均更優(yōu)的長(zhǎng)文本加速框架,該框架能夠很好地適應(yīng)通用長(zhǎng)文本任務(wù)。

APB:面向序列并行的稀疏注意力機(jī)制

相較于現(xiàn)有研究,APB 通過(guò)以下方式提出了一種創(chuàng)新的面向序列并行框架的稀疏注意力機(jī)制:

以該機(jī)制為基礎(chǔ),APB 的推理過(guò)程如下:

該方法顯著提升了長(zhǎng)文本推理速度的同時(shí)保持了較高的計(jì)算效率。

研究團(tuán)隊(duì)采用了 Llama-3.1-8B-instruct、Qwen-2.5-14B-instruct 以及 Yi-34B-200K 模型,在 InfiniteBench 和 RULER 平臺(tái)上進(jìn)行了系統(tǒng)評(píng)估,全面考察了任務(wù)性能(%)和推理速度(tok/s)指標(biāo)。

從實(shí)驗(yàn)結(jié)果來(lái)看,F(xiàn)lash Attention 作為無(wú)序列并行的精準(zhǔn)注意力算法,在任務(wù)性能方面表現(xiàn)優(yōu)異,但推理速度最慢;而 Ring Attention 和 Ulysses 作為序列并行的精準(zhǔn)注意力算法,通過(guò)優(yōu)化并行度顯著提升了推理速度;MInference 作為一種無(wú)序列并行的稀疏注意力機(jī)制,在性能上也存在一定局限性;Star Attention 則作為序列并行與稀疏注意力結(jié)合的初始嘗試,在推理速度上表現(xiàn)尚可,但計(jì)算效率明顯下降。

相較于上述基線算法,APB 在多種模型和任務(wù)場(chǎng)景中展現(xiàn)出更優(yōu)的性能表現(xiàn)和更快的推理速度。這表明,APB 方法實(shí)現(xiàn)了計(jì)算效率與推理速度的最佳平衡。

此外,研究團(tuán)隊(duì)在不同數(shù)據(jù)長(zhǎng)度的場(chǎng)景下對(duì) APB 與基線算法的性能表現(xiàn)和推理速度進(jìn)行了全面評(píng)估,并提供了整體計(jì)算量的數(shù)據(jù)支持,結(jié)果表明 APB 在各類場(chǎng)景中均展現(xiàn)出顯著的優(yōu)勢(shì)。

From the figure, it can be observed that APB demonstrates superior task performance and inference speed across various input lengths. The speed advantage becomes more pronounced as the input sequence lengthens. APB achieves this improvement because it requires fewer computations, with the computational efficiency gap widening as the sequence becomes longer.

Additionally, researchers conducted a pre-filled time decomposition analysis on both APB and baseline algorithms and found that leveraging sequence parallelism can significantly reduce the time spent on attention and feed-forward (FFN) operations.

Furthermore, the sparse attention mechanism in APB allows for further reduction in attention time. The Star Attention mechanism, however, suffers from significant extra overhead due to its large anchor block, while APB mitigates this issue by utilizing passing blocks to transmit long-range semantic dependencies, thereby enabling a much smaller anchor block size and reducing the extra overhead at the FFN stage.

APB exhibits excellent compatibility, being adaptable to different distributed settings (e.g., number of GPUs) and various model sizes. It achieves impressive performance and inference speed across multiple model configurations and distributed setups.

**Biography of Core Authors**

- **Yuxiang Huang**: An undergraduate student in the fourth year at Tsinghua University, currently a Ph.D. candidate candidate in the 2025 intake at the THUNLP Lab, advised by Prof. Liu Zhiyuan. He has previously participated in projects such as MiniCPM, model efficient fine-tuning, and speculative sampling. His primary research interests revolve around constructing efficient large-model inference systems, with a focus on model compression, speculative sampling, and fast inference techniques for long-text sparse retrieval.

- **Mingyue Li**: An undergraduate student in their third year at Central South University, who joined the THUNLP Lab as an intern in June 2024. He has been involved in the speculative sampling project. His main research interests include accelerating large-model inference, particularly techniques such as speculative sampling and acceleration methods for long-text retrieval.

申花0-4慘敗分析攻防轉(zhuǎn)換與技術(shù)差距,教練艾迪:勝負(fù)差距主要在攻防轉(zhuǎn)換速度上,需要改進(jìn) 達(dá)柳斯加蘭1號(hào)位的全能戰(zhàn)士新手也能輕松駕馭,《美職籃全明星》達(dá)柳斯加蘭介紹 高難度怪物刷取攻略睡覺(jué)與選怪物的高效技巧,怪物獵人:荒野捕捉高難度怪物技巧解析 基拉·多加塞可繆完美展現(xiàn),《高達(dá)鋼鐵之詩(shī)》乍得多加介紹 淘汰之王來(lái)了,《極品飛車:集結(jié)》S5賽季介紹 超級(jí)火拳必殺技大招,《海賊王:波特卡斯·D·艾斯技能解析》 越級(jí)空間 純電新標(biāo)桿,A+級(jí)純電轎跑新標(biāo)桿 榮威純電D6正式發(fā)布 俄羅斯在庫(kù)爾斯克州解放關(guān)鍵村莊進(jìn)展順利,俄軍隊(duì)長(zhǎng)發(fā)起全面攻勢(shì),烏克蘭軍隊(duì)撤退 《暗影帷幕五輪傳奇》新平臺(tái)發(fā)布售價(jià)92元,暗影五環(huán)Shadowveil: The Five Rings游戲價(jià)格介紹 掌握高效采集技巧,怪物獵人荒野快速采集指南
     
李元濤

李元濤

大?。?em>47mb更新:2025-03-12 22:51:03

類別:系統(tǒng):Android

立即下載(42.54MB)
  • 李元濤
  • 李元濤
  • 李元濤

游戲特色

“我們是冠軍!”在比賽結(jié)束后,整個(gè)體育館瞬間沸騰,球迷們揮舞著旗幟,回蕩著勝利的歡呼聲。湘北球員們無(wú)法抑制內(nèi)心的激動(dòng),他們歡呼雀躍著,心中充滿了難以言喻的喜悅。

這是勝利的滋味,是對(duì)球員們不懈努力和堅(jiān)持的最好證明,更是無(wú)數(shù)個(gè)日日夜夜訓(xùn)練的回報(bào)。這場(chǎng)比賽的勝利,也就代表著他們拿下了冬季選拔賽的冠軍。

這也是湘北隊(duì)第一個(gè)冠軍,雖然只是一個(gè)含金量不高的地區(qū)冠軍,但對(duì)于他們來(lái)說(shuō)意義非凡,是他們成長(zhǎng)道路上的一個(gè)重要里程碑。

同時(shí),他們也獲得了參加冬季大賽的資格。這意味著他們獲得了與來(lái)自其他地區(qū)的強(qiáng)隊(duì)一較高下的機(jī)會(huì)。注視著對(duì)面的歡聲笑語(yǔ),然而這一切在高宮本宇的眼中卻顯得格外刺眼。

他的對(duì)手們都在歡慶著勝利,而他卻只能在一旁默默品嘗著失敗的苦澀。高宮本宇站在場(chǎng)邊,心里越想越氣,仿佛要將他整個(gè)人吞噬。

終于,他再也無(wú)法抑制內(nèi)心的憤懣,像三井一樣用力地踢向一旁的垃圾桶。沉悶的聲音響起,垃圾桶被踢得搖晃了幾下,上面更是多了一個(gè)凹槽,但并沒(méi)有像他預(yù)期的那樣倒下。

原來(lái),這是一個(gè)被固定在地面上的垃圾桶,是專門為了防止此類事件而設(shè)計(jì)。力的作用是相互的,沒(méi)有踢翻垃圾桶,讓高宮本宇的右腳受到了嚴(yán)重的沖擊。

他感到一股劇烈的疼痛從腳底直沖腦門,痛得他幾乎無(wú)法站立?!鞍?!”高宮本宇痛苦地抱著右腳,發(fā)出了一聲撕心裂肺的慘叫。

“完了!”這一刻,他的內(nèi)心充滿了絕望,他擔(dān)心自己的籃球生涯可能就此結(jié)束。因?yàn)樗杏X(jué)自己好不容易愈合的右腳腳掌似乎又?jǐn)嗔?!他的心中充滿了悔恨,自己為什么要踢垃圾桶泄憤。

這下可好,舊傷復(fù)發(fā),反噬來(lái)了!“隊(duì)長(zhǎng)!”海南附中的球員們紛紛圍了過(guò)來(lái),他們的眼神中充滿了擔(dān)憂??粗粨?dān)架抬走的高宮本宇,木暮忍不住搖了搖頭,喃喃自語(yǔ):“有些人看似還活著,實(shí)際上已經(jīng)死了”

游戲亮點(diǎn)

實(shí)際上他們不知道的是,高振東在前幾次會(huì)議的各種技術(shù)和建議,已經(jīng)幫他們避開了很多大雷,大大的加快了這個(gè)彈的研制速度。

這大概就是另一個(gè)版本的“善戰(zhàn)者無(wú)赫赫之功”,有高振東的引導(dǎo)在前,270mm火箭彈的研制顯得非常的順利,反而少了幾分跌宕起伏的緊張感,也不需要頻頻救火或者解決問(wèn)題。

因?yàn)槟切﹩?wèn)題,早就在開始研制之前,就被高振東給悄悄的用技術(shù)改進(jìn)給覆蓋掉了,導(dǎo)致他們完全沒(méi)有感覺(jué)。而現(xiàn)在高振東雖然還沒(méi)找到問(wèn)題所在,但是僅僅通過(guò)故障現(xiàn)象和試驗(yàn)結(jié)果的數(shù)學(xué)統(tǒng)計(jì)分析,就大致推斷出了一個(gè)很大膽、但是看起來(lái)又很有道理的結(jié)果,而且還算是一個(gè)類似“不幸中的萬(wàn)幸”的結(jié)論,這讓他們既佩服,又高興。

沒(méi)人敢指望技術(shù)支援專家能夠坐下來(lái)一瞪眼,就把問(wèn)題解決掉,那不科學(xué),也不是事物發(fā)展的普遍規(guī)律。掌握情況都還需要花大半天呢,沒(méi)那么簡(jiǎn)單?,F(xiàn)在能夠初步排除一個(gè)方向上的問(wèn)題,已經(jīng)是意外之喜了。

游戲玩法

另一種是燧石人,這個(gè)沒(méi)法比,天地造就這個(gè)族群就很神奇。說(shuō)回機(jī)械文明,堂堂九大父神之一,為何親自來(lái)詭異攪碎機(jī)這里查看?按說(shuō)這點(diǎn)小事,用不著這種高層出現(xiàn)的,他就是出現(xiàn)了。

托尼的話讓丹妮莉絲的表情變得凝重起來(lái)。她并非沒(méi)有想到這一點(diǎn)。那些美酒尚且如此神奇,那么那個(gè)奇怪的擂臺(tái)呢?還有那個(gè)掛著藏寶閣的牌匾,以及指引向餐廳的標(biāo)識(shí)……

她認(rèn)真請(qǐng)教。在幾人的介紹下,她對(duì)酒館的了解快速加深著。那些美酒已經(jīng)讓她感到格外不可思議了,看到藏寶閣內(nèi)的藏品時(shí),她更加的難以置信。

評(píng)測(cè)

武宗近戰(zhàn)狂潮 法宗法術(shù)之刃,《踏風(fēng)行》開局流派選擇

主導(dǎo)全球武器貿(mào)易,樞密院十號(hào):關(guān)鍵證據(jù)!俄烏戰(zhàn)爭(zhēng)讓美國(guó)獲益匪淺……

探索與跳躍的秘密,《開放空間》回溯玩法技巧分享

詹姆斯回升,近況:詹姆斯自遭雷迪克批評(píng)后表現(xiàn)搶眼,攻防一體

騰勢(shì)N9上市解析,騰勢(shì)N9即將于3月21日正式上市,售價(jià)45-55萬(wàn)元。

顯示全部

熱門推薦
玩家評(píng)論
我要跟貼
取消
最新手游