近日,OpenAI 傳來令人振奮的消息,GPT-4o 正式上線微調(diào)功能,并且限時免費開放,每日還附贈百萬訓(xùn)練 token,這一舉措在開發(fā)者群體中引起了巨大的轟動。
據(jù)了解,每個組織每天都能免費獲得 100 萬個訓(xùn)練 token,此福利將持續(xù)到 9 月 23 日。這意味著開發(fā)人員現(xiàn)在可以使用自定義數(shù)據(jù)集微調(diào) GPT-4o,從而以低成本構(gòu)建自己的應(yīng)用程序。OpenAI 在公告中透露,GPT-4o 微調(diào)訓(xùn)練成本為每 100 萬 token 25 美元,這意味著每天都能為開發(fā)者節(jié)省 25 美元。
消息公布后,收到郵件的開發(fā)者們激動不已,紛紛奔走相告,如此大的“羊毛”怎能不薅?而且,OpenAI 還提到,只需訓(xùn)練數(shù)據(jù)集中的幾十個示例就可以產(chǎn)生良好效果,并曬出了成功案例。
首先是一款代碼助手 Genie,來自 AI 初創(chuàng)公司 Cosine,專為協(xié)助軟件開發(fā)人員而設(shè)計。據(jù) Cosine 官方介紹,Genie 的開發(fā)過程采用了一種專有流程,使用數(shù)十億個高質(zhì)量數(shù)據(jù)對非公開的 GPT-4o 變體進行了訓(xùn)練和微調(diào)。經(jīng)過微調(diào),Genie 在上周二 OpenAI 全新發(fā)布的代碼能力基準測試 SWE-BenchVerified 上,取得了 43.8%的 SOTA 分數(shù)。與此同時,Genie 還在 SWE-BenchFull 上的 SOTA 分數(shù)達到了 30.08%,破了之前 19.27%的 SOTA 紀錄。
另一個案例來自 Distyl,這是一家為財富 500 強企業(yè)提供 AI 解決方案的公司,最近在領(lǐng)先的文本到 SQL 基準測試 BIRD-SQL 中排名第一。經(jīng)過微調(diào),其模型在排行榜上實現(xiàn)了 71.83%的執(zhí)行準確率,并在查詢重構(gòu)、意圖分類、思維鏈和自我糾正等任務(wù)中表現(xiàn)出色,尤其是在 SQL 生成方面表現(xiàn)尤為突出。
除了提供案例,OpenAI 還在公告中特意強調(diào)了數(shù)據(jù)隱私和安全問題。開發(fā)者的業(yè)務(wù)數(shù)據(jù)(包括輸入和輸出)不會被共享或用于訓(xùn)練其他模型。針對微調(diào)模型實施了分層安全緩解措施,例如不斷對微調(diào)模型運行自動安全評估并監(jiān)控使用情況。
不過,在一片熱鬧之際,也有網(wǎng)友認為微調(diào)仍然比不上提示詞緩存。提示詞緩存具有速度更快、成本更低的優(yōu)勢,對開發(fā)者更友好。但也有人為微調(diào)打 call,認為微調(diào)在塑造響應(yīng)方面更有效。
GPT-4o 微調(diào)限時免費開放這一舉措為開發(fā)者們帶來了巨大的機遇,相信在未來會有更多精彩的應(yīng)用誕生。