- 全新冒險攻略指南,《代號:超自然》最新打大熊攻略
- 獲取資源的多種途徑,《破碎之地》多晶硅獲取攻略
- 新手入門指南,《傭兵小鎮(zhèn)》首日玩法建議
- 更新速覽,《絕區(qū)零》1.2霸主座上賓成就達成攻略
- 節(jié)日驚喜搶先看,《光遇》2024年秋宵節(jié)物品兌換圖一覽
- 必備武器指南,《三角洲行動》大戰(zhàn)場強勢武器選擇推薦
- 全新視角,《爐石傳說》深暗領域新機制介紹
- 烹飪進階指南,《下一站江湖2》瓦舍小食配方攻略
- 探秘指引,《代號:超自然》古墓深層圖1攻略
- 新手必看,《荒野求生模擬器》萌新開局攻略
聲明:本文來自于(ID:ykqsd.com)授權轉載發(fā)布。
說到視頻生成模型,只知道Sora的,那可就有點掉隊了。
稀宇科技旗下的海螺AI一經推出,便在業(yè)內脫穎而出,廣受好評。如今,海螺AI不僅蟬聯(lián)2024年12月和2025年1月的全球出??偘衽琶?月的榜單中繼續(xù)占據(jù)"視頻生成"類的榜首。
當下,國內視頻生成領域的重量級企業(yè)不外乎"六小強",而海螺AI無疑是其中之一。這是一家成立于2021年的科技公司,不斷深化技術優(yōu)勢,成功殺出一條血路。
稀宇科技致力于與用戶共同創(chuàng)造智能未來。
一張照片就能"創(chuàng)作"出一部電影,這是Sora的創(chuàng)新之處。
Sora的橫空出世,為視頻生成賽道注入了新的活力。然而,就像所有新技術一樣,一旦走向生產環(huán)境,實現(xiàn)行業(yè)應用時,總會遇到各種挑戰(zhàn)。其中,最令人頭疼的莫過于讓視頻承擔起敘事功能時,如何統(tǒng)一主角的外貌特征。
很多人有這樣的體驗:上一部視頻主角是小A,下一視頻主角卻變成了另一張臉。無論怎么調整,兩個版本的主角無法統(tǒng)一為同一個人。
稀宇科技最新推出的S2V-01視頻模型,將這一難題徹底解決。用戶只需提供一張正面照片,無論生成多少段風格各異的視頻,主角始終是同一個人。人們驚嘆道,一張照片,一部大片,這不是天方夜譚嗎?
在技術研發(fā)的道路上,稀宇科技始終堅持"技術為王"的理念。如何在動態(tài)視頻中保持人物面部多角度的真實度和穩(wěn)定性,如何在連續(xù)片段拼接創(chuàng)作時,使人物角色保持高度一致,這些問題困擾著整個行業(yè),成為稀宇科技"啃硬骨頭"的課題。
通過技術創(chuàng)新,稀宇科技不斷推動行業(yè)進步。在動態(tài)視頻制作中實現(xiàn)人物面部多角度真實性的技術突破,正是其追求卓越的體現(xiàn)。
研發(fā)團隊投入了大量技術探索,考察了多種技術路徑,最終開發(fā)出了S2V-01視頻模型——這一模型在計算成本和等待時間方面均遠超傳統(tǒng)方案,卻提供了令人滿意的用戶體驗。
令人稱贊的是,“海螺AI”在藝術審美方面同樣表現(xiàn)出色,它能夠通過專業(yè)級調光與構圖營造美學氛圍,精細控制光影效果與景別變化,其畫面質感堪稱頂級水準。
可以說,MiniMax的突破徹底解決了跨視頻片段主體一致性創(chuàng)作的痛點,使得用戶在進行更完整內容表達的視頻創(chuàng)作時,能夠將更多精力投入到內容本身。
在開源首秀中,MiniMax發(fā)布“王炸”級成果
在“百?;鞈?zhàn)”的“亂斗”階段,要想讓大模型“活下去”并走得更遠,仍有許多技術難關亟待攻克:錯誤率持續(xù)下降、支持無限長輸入與輸出、多模態(tài)能力等。
在AGI(通用人工智能)領域,OpenAI一度成為風向標。當全球期待OpenAI盡快給出答案,哪怕是提供解題思路時,MiniMax已暗下決心——在算力與數(shù)據(jù)資源都不占優(yōu)的情況下,開創(chuàng)一條獨特的優(yōu)化大模型之路。
自2023年夏季起,公司投入了80%的算力與研發(fā)資源用于底層架構研發(fā),這在外界看來似一場冒險。幸運的是,MiniMax成功推出國內首個基于MoE架構的模型。研發(fā)團隊隨后將目光轉向提升模型速度的技術難關——線性注意力。
在大多數(shù)學術集上,MiniMax均取得與海外第一梯隊相媲美的成績。
今年1月,MiniMax完成了開源首秀,以兩個“王炸”之勢亮相:分別是基礎語言大模型MiniMax-Text-01和視覺多模態(tài)大模型MiniMax-VL-01。在與海外頂尖模型的基準性能測試中,這兩款模型在多個核心任務上表現(xiàn)不遜,甚至在某些任務上超越對手。在綜合性能與海外頂尖模型持平的基礎上,MiniMax-Text-01在處理長文本時更是大顯身手——支持高達400萬個token的上下文輸入。
這是什么概念呢?400萬個token的上下文窗口相當于可以一次性處理約700萬個漢字。通行的一百二十回本《紅樓夢》總字數(shù)約為96萬字,700萬個漢字相當于7部多《紅樓夢》。
更值得關注的是,MiniMax在架構設計上實現(xiàn)了突破性創(chuàng)新,通過大規(guī)模應用線性注意力機制,成功突破了傳統(tǒng)Transformer架構的內存瓶頸。這一突破使中國公司首次實現(xiàn)了對傳統(tǒng)Transformer架構的重大突破。
MiniMax-Text-01模型架構
研發(fā)團隊需要具備"極致熱情"
當前,AI行業(yè)正處于蓬勃發(fā)展的階段。 MiniMax副總裁劉華向新民晚報記者表示,這一現(xiàn)象得到了廣泛認可。他認為,高水平模型的開源不僅能夠讓更多普通人享受到大模型技術的能力,還能推動人工智能技術的普及和應用率提升;同時,通過開源也能吸引更多開發(fā)者參與進來,共同促進大模型技術的快速發(fā)展。
在開源模型的后續(xù)更新方面, MiniMax開發(fā)者社區(qū)負責人蔡佳人補充道,全球開發(fā)者的智慧對于將AI變得可用、好用至關重要。無論是對模型優(yōu)化的建議,還是對創(chuàng)作者體驗的改進,公司都會給予高度關注,并采取積極措施跟進。同時, MiniMax也會第一時間向開發(fā)者分享開放模型的后續(xù)更新。
劉華進一步指出,創(chuàng)業(yè)公司在中國大模型領域將繼續(xù)發(fā)揮著重要作用。大模型研發(fā)框架需要不斷迭代,研發(fā)團隊對技術變革的熱忱和開放態(tài)度是關鍵。 MiniMax正是通過招聘大量年輕研究員,并給予充分的授權,才得以建立起高效的研發(fā)組織體系。公司目前擁有一支年輕化、專業(yè)化的發(fā)展團隊,其中許多人仍在攻讀博士學位,但已在公司實習并加入團隊。
在這一充滿活力和潛力的領域, Mini華表示, MiniMax將保持專注,堅持技術回歸本源,這也是公司未來發(fā)展的核心理念。
原文標題:連續(xù)三個月登頂全球AI視頻榜,這家上海大模型初創(chuàng)公司憑什么 standing out? | 產業(yè)進化論
欄目編輯:左妍 圖片來源:采訪對象供圖,東方IC
來源:新民晚報 郜陽
火星探測新突破國際合作再升級,張松山:中國太空探索展現(xiàn)開放與合作精神 特朗普施壓關稅政策引發(fā)爭議,特朗普又被批評。前經濟顧問表示,關稅政策有誤,對美國不利。 李锘醫(yī)生 敏感肌護膚 溫和清潔,紅、腫、熱、疼,敏感肌到底該怎么護膚? 優(yōu)雅加長,試駕全華寶馬X3:豪華SUV的進化之路(解釋:標題改寫后:1. 保留了"試駕全華寶馬X3"的核心要素2. "豪華SUV的進化之路"既保留了豪華SUV的核心主題,又簡化了語序3. 使用"進化"替代"全面進階",使表達更簡潔4. 整體標題更流暢,更符合標題風格5. 突出了試駕體驗和豪華SUV的主題,同時保持了信息完整性) 34號房接取任務攻略,《心動小鎮(zhèn)》潮流記者位置大全 掌控巔峰澤文契約與協(xié)定加點技巧,《決勝巔峰》澤文技能加點建議 探索長橋盡頭的秘密,雙影奇境游戲節(jié)目任務觸發(fā)方法及如何觸發(fā)游戲節(jié)目任務介紹 鬼人槽強化觸發(fā),怪物獵人荒野雙劍鬼人槽有什么用處-鬼人槽有什么用途介紹 長隊捧相片等待離世紅色記憶與集體回望,演員于洋追悼會引發(fā)關注!遺照黨旗引發(fā)討論,女兒情緒低落,葛優(yōu)陶玉玲出席 雪球蟲之謎爆裂冰彈生成器讓你輕松捕捉雪球蟲,輕松捕捉雪球蟲!掌握這些技巧你是否還在為雪球蟲的收集方法而發(fā)愁?現(xiàn)在掌握這些技巧,輕松捕捉雪球蟲!