国产美女爆乳午夜性涩视频_无码人妻精品一区二区三18禁_无码精品A∨在线观看十八禁下载_亚洲AvV无码一区二区在线播放

您的位置:首頁 >綜合 > 正文

五千萬元只夠看一次煙花!大模型的泡沫大嗎?

來源:揚子晚報2023-09-30 09:58:29

“做通用大模型,?5000萬元只夠看一次‘煙花’,這是一次的訓(xùn)練成本。”

“現(xiàn)在大模型應(yīng)用的數(shù)量遠(yuǎn)遠(yuǎn)不夠,企業(yè)基本是有很模糊的需求,但又把期望值放得很高。”

“給做AI應(yīng)用創(chuàng)業(yè)的公司兩個建議,一是第一筆錢最好來自客戶而不是VC(投資人),二是六個月內(nèi)最好打平你的成本,然后可以賺錢?!?/p>


(相關(guān)資料圖)

ChatGPT爆紅之后,大模型點燃的人工智能新一輪熱潮還在繼續(xù),近日,OpenAI宣布即將推出能夠理解語音和圖片的新版本ChatGPT,另有消息稱,OpenAI或趕在谷歌發(fā)布Gemini之前推出同為多模態(tài)大模型的GPT-vision,而微軟也推出了全新的Copilot平臺。

從國內(nèi)發(fā)展情況來看,百度創(chuàng)始人李彥宏在9月初稱,億級參數(shù)的大型語言模型,國內(nèi)已經(jīng)發(fā)布了超過70個。?360創(chuàng)始人周鴻祎更是直言,現(xiàn)在是“百模大戰(zhàn)”,未來很有可能演化為“萬模群舞”。

絕大部分已發(fā)布大模型的企業(yè)認(rèn)為,目前許多行業(yè)的關(guān)鍵環(huán)節(jié)都值得用大模型改造一遍,也有人將大模型比作移動時代的操作系統(tǒng),號召創(chuàng)業(yè)者們在大模型的基礎(chǔ)上開發(fā)出足夠多的AI應(yīng)用。只是與發(fā)布企業(yè)的火熱相比,普通大眾尚未感知到大模型的“魅力”,一些To C端(用戶端)的應(yīng)用在發(fā)布后僅帶來短暫的熱度。

國內(nèi)是否需要這么多基礎(chǔ)大模型?當(dāng)互聯(lián)網(wǎng)大廠的大模型還沒找到清晰的商業(yè)模型,創(chuàng)業(yè)公司的出路在哪里?現(xiàn)階段大模型的火熱有沒有泡沫?企業(yè)客戶和個人用戶的使用感受如何?近日,澎湃新聞記者采訪了多位大模型方面的從業(yè)者、創(chuàng)業(yè)者、使用者試圖尋找答案。

創(chuàng)業(yè)公司更大的機會在“中間層”“應(yīng)用層”?

“國外大模型我們在用Open?AI?的GPT-4,有的客戶會有私有化部署的要求,所以國產(chǎn)大模型我們基本也跑了試試,上億級的模型進步很快,但與GPT-3.5還有差距。分類來看,BAT等大廠自帶場景、數(shù)據(jù),是認(rèn)真在做,創(chuàng)業(yè)公司里智譜AI、MiniMax、百川智能等頭部公司也做的不錯,拿下了一部分客戶。但業(yè)界確實有些公司,更多是為了融資造勢,拿了部分垂類的行業(yè)數(shù)據(jù),根據(jù)自己的資金實力,找一個開源的模型訓(xùn)一下,就說自己做了大模型?!被诖笳Z言模型的自動化平臺公司瀾碼科技CEO周健在接受澎湃新聞記者采訪時說。

周健曾在谷歌、阿里云、弘璣RPA等公司工作,也曾是“AI四小龍”依圖科技的第10號員工,今年2月,周健創(chuàng)立了瀾碼科技,并與金山辦公等多家上市公司和獨角獸企業(yè)達(dá)成戰(zhàn)略合作。在周健看來,因為大模型的“幻覺問題”和權(quán)限問題,終端用戶或者甲方企業(yè)客戶很難和大模型直接合作,需要像瀾碼科技這樣的中間廠商,這也是創(chuàng)業(yè)公司的機會。

在基礎(chǔ)大模型與用戶端需要“中間廠商”,OpenAI的首席執(zhí)行官山姆·奧特曼(Sam?Altman)也曾作出這樣的判斷。奧特曼表示,將來只會有一小部分基礎(chǔ)大模型,會有一批新的創(chuàng)業(yè)公司采用已有的大模型,并對其進行調(diào)整,創(chuàng)造更多價值,“他們有獨特的數(shù)據(jù)飛輪,隨著時間的推移不斷改進,我認(rèn)為中間那一層會創(chuàng)造很多價值?!?/p>

周健告訴澎湃新聞記者,除非大資本支持,大部分創(chuàng)業(yè)公司并不具有做基礎(chǔ)大模型的實力,因此把目光投向“中間層”或“應(yīng)用層”是更務(wù)實的做法。

“有家做大模型的企業(yè)曾告訴我,他們之前訓(xùn)練的大模型大概花了兩、三個億(元),現(xiàn)在算力漲價,新訓(xùn)一個估計花費要五個億(元),而大部分創(chuàng)業(yè)公司根本不可能隨手一拍就是5億(元)。我們作為中間層,不需要負(fù)責(zé)大模型智能能力的提升,只是用大模型做產(chǎn)品和商業(yè)化,并不需要大規(guī)模算力,但在拿了數(shù)千萬元的A輪融資后,我們還是用了一部分資金購買算力?!敝芙≌f。

國盛證券報告在今年2月曾估算,GPT-3訓(xùn)練一次的成本約為140萬美元,對于一些更大的?LLM(大型語言模型),訓(xùn)練成本介于200萬美元至1200萬美元之間。以ChatGPT在2023年1月的獨立訪客平均數(shù)1300萬計算,其對應(yīng)芯片需求為3萬多片英偉達(dá)A100 GPU,初始投入成本約為8億美元,每日電費在5萬美元左右。

創(chuàng)業(yè)公司Zilliz主要提供面向AI應(yīng)用的新一代數(shù)據(jù)庫技術(shù),幫助企業(yè)開發(fā)AI應(yīng)用,并已拿到超6000萬美元的B輪融資,該公司觀察到,在過去幾個月,各行各業(yè)應(yīng)用大模型都需要將自己企業(yè)內(nèi)部知識庫跟大模型整合,而這些需求也是Zilliz發(fā)展壯大的機會。

Zilliz技術(shù)合伙人兼首席技術(shù)官欒小凡在接受澎湃新聞記者采訪時表示:“說得夸張些,可能在十年后,不會用大模型就和現(xiàn)在不會用手機一樣?!睓栊》舱J(rèn)為現(xiàn)在的大模型確實會存在成本過高的問題,但他相信隨著技術(shù)發(fā)展,大模型的成本會越來越低,行業(yè)內(nèi)態(tài)度也比較樂觀,“現(xiàn)在的大模型就像是十年前的云計算,集中式發(fā)展會帶來成本下降。”

談及大模型應(yīng)用創(chuàng)業(yè)的現(xiàn)狀,周健直言:“公司很多,但都沒有做出來。”

大模型“有幻覺”還能應(yīng)用嗎?

“林黛玉三打白骨精、賈寶玉倒拔垂楊柳,大模型開的藥方不敢吃,寫的律師函也不敢用?!?/p>

大模型的“幻覺”問題(指模型生成不正確、無意義或不真實的文本)是大模型要落地應(yīng)用面臨的問題之一。有業(yè)內(nèi)人士指出,AI在大部分領(lǐng)域要做到足夠好,達(dá)到甚至超過人類水平才能產(chǎn)生實際商業(yè)價值,也許AI智商從0到70是巨大進步,但自己仍不會為它付費,“就像水必須燒到100度才能驅(qū)動蒸汽機,你99度的水就不行?!?/p>

欒小凡也向澎湃新聞記者坦言,大模型應(yīng)用的運作建立在概率之上,可以通過大量參數(shù)的導(dǎo)入不斷提高正確率,但也只能無限接近于100%,和計算機程序原有的運行原理相比,更像是人類的思考方式。正因如此,大模型應(yīng)用適合被用來進行輔助工作,最終還是需要人來做判斷。

值得關(guān)注的是,9月12日,為了進一步推動人工智能應(yīng)用的落地和創(chuàng)新,工業(yè)和信息化部工業(yè)文化發(fā)展中心在北京召開AI應(yīng)用工作組籌備會,并正式成立AI應(yīng)用工作組。

AI應(yīng)用工作組執(zhí)行組長、行行AI董事長李明順在接受澎湃新聞記者采訪時表示:“大模型不是技術(shù)創(chuàng)新,也不是技術(shù)革命,它只是一個技術(shù)的發(fā)現(xiàn)。這個技術(shù)一旦眾所周知后,拼的是數(shù)據(jù)能力、算力投入,本質(zhì)上是錢的問題。所以,我們看到許多起初做基礎(chǔ)大模型的創(chuàng)業(yè)公司,現(xiàn)在慢慢轉(zhuǎn)了方向,在找垂直場景做應(yīng)用?!?/p>

李明順表示,大模型別怕有“幻覺”,AI應(yīng)用落地是循序漸進的,哪怕是嚴(yán)肅的場景,也可以先把一些可能產(chǎn)生“幻覺”的場景給B端專業(yè)人士使用,做輔助決策,然后再推向C端,“比如,把大模型用在醫(yī)療上,它的回答可能不那么專業(yè),但這不影響把大模型應(yīng)用給年輕的醫(yī)生做輔助決策。大家還是要找準(zhǔn)大模型應(yīng)用的方向,你可以利用AI操控電風(fēng)扇,但你不能依靠它問股票漲不漲,哪只股票會漲,這本身就不理性?!?/p>

周健也向澎湃新聞記者表示,容錯度高的領(lǐng)域更適合做大模型,“審核、合規(guī)、支付這些容錯度低的,利用大模型就要謹(jǐn)慎?!?/p>

大模型是否有泡沫?

大模型很熱,其中有沒有“泡沫”?是否需要這么多大模型?

多位從業(yè)人士在澎湃新聞記者的采訪中表示有泡沫,所謂“百模大戰(zhàn)”“萬模群舞”,在業(yè)內(nèi)人士看來最終需要的大模型可能只在個位數(shù)。

“當(dāng)然有泡沫,上游產(chǎn)能需求暴增,英偉達(dá)的芯片只能加價買,價格漲了50%-60%,反過來說,如果沒有這么多公司想要做大語言模型,算力不該那么緊張?!敝芙≌f。

欒小凡也坦言,大模型可能正處于泡沫的頂點,“一段時間后大家的熱情會下降,然后再到下一步的研究,要經(jīng)過一個過程?!?/p>

李明順則判斷,底座大模型可能只需要幾家,數(shù)量不超過5個。

目前,B端和C端對大模型應(yīng)用的使用感受如何?人們什么時候能夠普遍感受到大模型應(yīng)用的價值?

在B端,中小型企業(yè)魯邦通云與數(shù)字化服務(wù)中心CTO楚寧志向澎湃新聞記者表示,若采用云的模式來按需使用大模型,成本并不高,先低成本的驗證,再考慮私有化部署,但建議中小企業(yè)要有一個理解大模型并嘗試使用大模型支持企業(yè)業(yè)務(wù)的過程。

楚寧志告訴記者,該公司已經(jīng)“嘗鮮”了國內(nèi)一家互聯(lián)網(wǎng)大廠的大模型,應(yīng)用方向包括設(shè)備AI智能巡檢、預(yù)測性維護,以及醫(yī)療物聯(lián)網(wǎng)產(chǎn)品的健康體征分析報告?!熬同F(xiàn)狀而言,大模型應(yīng)用落地的挑戰(zhàn)還是在于數(shù)據(jù)本身,缺乏有效的數(shù)據(jù)積累,對于中小企業(yè)而言,是一個大問題,這需要國家政策、標(biāo)準(zhǔn)和法規(guī)的支持和引導(dǎo)?!背幹菊f。

在C端,一位前互聯(lián)網(wǎng)大廠的資深創(chuàng)意負(fù)責(zé)人、AI驅(qū)動的創(chuàng)意公司zax創(chuàng)始人趙晨已將ChatGPT、Stable Diffusion等工具熟練地應(yīng)用在其工作中。趙晨告訴澎湃新聞記者,AIGC(生成式人工智能)已改變他的工作流,“AIGC生產(chǎn)的DEMO基本接近終稿的七八成且速度快,人來畫需要三四天,用AIGC基本半小時可以完成,只是沒有那么精細(xì)。另外,我也節(jié)約了成本,客戶最終買的只是‘一稿’,但在最終定稿前,會過好幾版,如果沒有AI,我要多找?guī)讉€插畫師,每幅畫都要付出成本,這很貴。”

“我認(rèn)為,未來替代你的不是AI,而是會用AI的人。”趙晨告訴澎湃新聞記者,使用AIGC工具在技巧方面有一定門檻,在廣告創(chuàng)意領(lǐng)域,AIGC工具還遠(yuǎn)遠(yuǎn)沒有普及。

東方證券在研報中指出,大模型企業(yè)在獲得備案和向公眾開放后,各類C端應(yīng)用將從過去的邀請制、限制名額的注冊制,進入到全面推廣期,這將對各類基于大模型的應(yīng)用推廣打下更好基礎(chǔ)。B端應(yīng)用方面,大模型與企業(yè)知識庫、工作流的結(jié)合,具備較好的粘性和應(yīng)用空間,未來大模型+流程、大模型+知識庫、大模型+低代碼均具備較好的落地空間。

天風(fēng)證券則指出,下半年開始海外巨頭應(yīng)用和模型迭代速度提升明顯,預(yù)計海外巨頭相關(guān)AI事件和AI產(chǎn)品迭代,或?qū)⑷缤习肽闓PT4發(fā)布一樣成為持續(xù)催化AI行情的重要事件,而現(xiàn)階段Copilot發(fā)布和Adobe AI產(chǎn)品開啟定價僅是AI應(yīng)用落地趨勢的開始,預(yù)計會有更多AI應(yīng)用有望隨著大模型技術(shù)升級不斷涌現(xiàn)。

關(guān)鍵詞:

最近更新