新聞中心
云VS本地:誰是生成式人工智能主導的未來戰(zhàn)場?
云計算 人工智能+數(shù)據(jù)+規(guī)模經(jīng)濟學將決定未來幾年內(nèi)行業(yè)的基本結(jié)構(gòu)。

在東山等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供網(wǎng)站設(shè)計、網(wǎng)站建設(shè) 網(wǎng)站設(shè)計制作定制網(wǎng)站設(shè)計,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站設(shè)計,網(wǎng)絡(luò)營銷推廣,外貿(mào)營銷網(wǎng)站建設(shè),東山網(wǎng)站建設(shè)費用合理。
企業(yè)客戶的數(shù)據(jù)明確但存在沖突。盡管有94%的客戶表示他們今年在人工智能上的投入更多,但由于預算的限制,這將會削減在其他項目的投入。此外,關(guān)于在哪里運行生成式AI的問題,客戶幾乎完全分為公共云和本地/邊緣計算兩派。讓問題變得更加復雜的是,開發(fā)人員稱公共云在功能豐富性和創(chuàng)新速度方面的體驗非常出色,然而知識產(chǎn)權(quán)泄露、合規(guī)性、法律風險和成本等問題將限制組織機構(gòu)對公共云的使用。
在這份報告中,我們將分享關(guān)于大型語言模型采用情況的最新數(shù)據(jù)和思考,以及影響市場發(fā)展的因素。與往常一樣,我們將分享最新的ETR數(shù)據(jù),以揭示客戶在平衡風險和價值實現(xiàn)時間方面所面臨的關(guān)鍵問題。
企業(yè)IT支出仍然緊縮
下面的圖表是最新的ETR支出快照中的數(shù)據(jù)。該數(shù)據(jù)包括1,777名高級IT決策者,代表了超過7500億美元的支出能力。
高級IT決策者們在2022年結(jié)束時期望他們的預算能增加4-5%。但到了一月份,這個數(shù)字反而下降了4.1%,盡管在今年的各個時間段都有小幅度的增長,但目前仍然只增長了2.9%,遠低于最初的預期。
預算限制迫使進行權(quán)衡
在預算有限的情況下,生成式AI的迅速發(fā)展導致組織機構(gòu)不得不重新設(shè)置優(yōu)先級。正如我們在去年與Andy Thurai進行的分析中所分享的那樣,人工智能投資回報一直難以捉摸。但ChatGPT熱潮促使董事會下達了一項自上而下的命令,并因此改變了企業(yè)技術(shù)方面的支出重點。
上圖顯示了ETR追蹤的行業(yè)。凈分數(shù)或支出動力位于縱軸上,調(diào)查中的普及度位于橫軸上。雖然所有行業(yè)在2022年都感受到了預算限制的壓力,但AI作為領(lǐng)先的細分市場之一,到了2022年10月,被壓縮到低于40%的紅色虛線——即支出速度的高水位線。ChatGPT在11月份進入市場后,AI支出加速增長。然而,預算并沒有發(fā)生明顯變化。
因此,我們看到其他行業(yè)出現(xiàn)了壓縮的情況,這表明在短期內(nèi),對生成式AI的資金投入將對市場的其他細分領(lǐng)域產(chǎn)生一定程度的稀釋效應(yīng)。
對AI的支出超過其他項目
正如我們之前提到的,在下面的數(shù)據(jù)中顯示,94% 的客戶報告稱他們將在2023年增加他們在AI上的支出。
盡管大多數(shù)客戶報告稱其支出增長幅度為10%或更低,但有36%的客戶表示他們的支出將增長兩位數(shù)。
高層領(lǐng)導的要求與風險偏好相沖突
來自高層自上而下的壓力要求企業(yè)“搞清楚”生成式AI,這是一項緊迫的任務(wù),實際執(zhí)行起來更具有挑戰(zhàn)性。下圖顯示了客戶在生產(chǎn)環(huán)境中如何使用生成式AI。雖然有34%的客戶表示他們不在評估中,但這個數(shù)字較上一季度大幅下降。
無論如何,在實際生產(chǎn)環(huán)境中,有兩件事值得注意:
1)大多數(shù)人仍處在評估階段;
2)使用案例相當直觀,聊天機器人是最重要的應(yīng)用領(lǐng)域,其次是代碼生成、文本摘要和撰寫市場營銷文案。
我們認為,組織必須真正理解商業(yè)案例并確定投資回報率。最大的投資回報驅(qū)動因素將是降低勞動力成本。你可以將其歸類為提高生產(chǎn)力,但最終目標是減少對人力資源的需求。這并不一定意味著失業(yè)率會上升——它只是意味著價值的主要驅(qū)動因素將是減少員工數(shù)量。這無疑會改變就業(yè)所需的技能。
組織必須評估GenAI的風險
一個關(guān)鍵挑戰(zhàn)是,在上層動力確實存在的情況下,部署會帶來一系列風險問題。下面這張幻燈片來自Technalysis發(fā)布的一項最新研究,該獨立分析公司由分析師鮑勃·奧唐奈爾運營。它展示了1,000名IT決策者所關(guān)注的GenAI相關(guān)最重要的問題,包括合規(guī)性、知識產(chǎn)權(quán)泄露、法律問題(如版權(quán)侵犯)、數(shù)據(jù)和工具質(zhì)量等。
這些都是對生成AI及其使用方式謹慎的合理原因。
重新思考云與本地之間的平衡
對于GenAI風險的擔憂導致許多組織表示他們將在本地進行GenAI部署。
下面是ETR提供的一些數(shù)據(jù),顯示組織報告了相同比例的私有和公有基礎(chǔ)架構(gòu),即公共云或本地/邊緣部署。云的吸引力在于它擁有最好的工具,但出于Technalysis調(diào)查中提到的原因,私有基礎(chǔ)架構(gòu)預計將成為一個流行的部署選項。
但云仍然具有優(yōu)勢。目前,云中存儲了大量的數(shù)據(jù)——我們認為40-45%的工作負載正在云上運行,也許到明年可能達到50%。正如我們在以前的研究中報道的那樣,云和本地正在趨于平衡——云仍在以更快的速度增長——但對于許多傳統(tǒng)應(yīng)用程序來說,遷移到云端的商業(yè)案例還沒有那么強大。我們相信,云端增長的很大一部分來自于現(xiàn)有云工作負載之上的新應(yīng)用程序或功能。
本地工作負載正成為注入人工智能的良機,諸如思科、IBM、戴爾技術(shù)和HPE等老牌企業(yè)正在尋找機會并積極投資。
云依然具有巨大優(yōu)勢
事實上,在與開發(fā)人員交流時,他們普遍認為云在人工智能領(lǐng)域非常強大。以下是我們強調(diào)過的八個觀點,開發(fā)者告訴我們公共云滿足了這些需求。我們相信,在考慮云和本地GenAI解決方案之間的功能權(quán)衡時,這些觀點可以作為客戶的參考指南。
AI的創(chuàng)新速度,建立在像Amazon SageMaker這樣的先前工具之上。集成的簡易性和推動的生產(chǎn)力……使開發(fā)人員能夠迅速實現(xiàn)預期結(jié)果。我們鼓勵我們的社區(qū)訪問thecubeai.com作為一個示例,并注冊我們的私有測試版。我們的團隊使用AWS上現(xiàn)成可用的工具,包括開源LLMs、MongoDB、Milvus作為我們的向量數(shù)據(jù)庫和其他云工具,在幾周內(nèi)迅速構(gòu)建了這個平臺。
根據(jù)我們收到的查詢,模型訓練需要更多時間,但是MVP(最小可行產(chǎn)品)開發(fā)時間僅為正常軟件產(chǎn)品開發(fā)周期的十分之一。
我們在上述第4點中強調(diào)了重要性——即模型選項的多樣性——不僅來自云供應(yīng)商,還來自于第三方供應(yīng)商。
第5點和第6點也非常關(guān)鍵——能夠隔離推理請求,使LLM供應(yīng)商無法訪問任何客戶數(shù)據(jù)。安全性提供豐富性也是關(guān)鍵因素。例如,確保數(shù)據(jù)保留在特定地區(qū)以及對數(shù)據(jù)傳輸進行加密等功能。
云提供了從硅到AI工具鏈、最大程度的數(shù)據(jù)庫選擇、治理選擇、身份訪問、開源工具可用性以及豐富的合作伙伴生態(tài)系統(tǒng)的一流工具。
因此,盡管HPE和Dell這樣的公司已經(jīng)宣布提供LLMs作為服務(wù),但他們的能力如何,以及他們是否真正將LLMs無縫地集成到解決方案中,還并不確定。
雖然在本地進行工作可以降低風險并且非常合理,但現(xiàn)有企業(yè)需要做大量工作來建立全面的解決方案和生態(tài)系統(tǒng)合作伙伴堆棧。
比較云與現(xiàn)有企業(yè)之間客戶支出勢頭
與現(xiàn)有企業(yè)基礎(chǔ)設(shè)施供應(yīng)商相比,云供應(yīng)商具有更強勁的業(yè)務(wù)動力。盡管有關(guān)云優(yōu)化、重返本地和增長放緩等話題屢見不鮮,但數(shù)據(jù)仍明顯支持云供應(yīng)商。
上面是ETR數(shù)據(jù),顯示了幾位有潛力的LLM領(lǐng)導者的凈分數(shù)分解。凈分數(shù)是一種度量支出速度的指標。它跟蹤新客戶的百分比-這就是酸橙色。深綠色表示與去年相比支出增加6%或更多。灰色表示支出持平,粉紅色表示支出減少6%或更糟,明亮紅色表示流失客戶。將紅色從綠色中減去,就可以得到右側(cè)柱形圖中顯示的凈分數(shù)。
在凈分數(shù)右側(cè),我們顯示了調(diào)查中的回應(yīng)數(shù)量,這是市場影響力的代理變量。因此,正如您所看到的,AWS、微軟和谷歌的凈分數(shù)分別為51%、49%和34%,并且N值接近或超過1,000。
DELL和HPE相比,在市場影響力方面,DELL有著很強的存在感(N超過800),HPE也高達483。但從支出角度來看,云計算仍然具有明顯較高的動力。
追蹤一些關(guān)鍵數(shù)據(jù)平臺
下面我們展示了Databricks、Snowflake、IBM和Oracle等一些重要的數(shù)據(jù)平臺名稱的同樣數(shù)據(jù)。Databricks具有非??煽康?0%凈分數(shù),已經(jīng)超過了47%的Snowflake,盡管Snowflake在市場影響力上更大。但顯然Databricks正在逐漸接近Snowflake的傳統(tǒng)領(lǐng)域。正如您所看到的,IBM和Oracle的凈分數(shù)較低,分別為10%和-1%,但數(shù)據(jù)集中有大量數(shù)據(jù)。
GenAI何時會在利潤表中顯示出來?
我們預計對人工智能(包括GenAI)的支出將在2023年下半年開始對利潤表產(chǎn)生明顯影響。
以AWS為代表,下圖顯示了AWS自2022年第一季度以來的收入增長率。我們認為,在第三季度,減速將趨于穩(wěn)定,根據(jù)當前的預測,由于人工智能作為助推因素和第四季度的季節(jié)性因素,增長將在第四季度重新加速。特別是我們預計GenAI將推動更多的計算和存儲支出,并在數(shù)據(jù)平臺和相關(guān)工具方面產(chǎn)生附加支出。
這種情況存在一些風險,包括宏觀環(huán)境和大數(shù)定律的作用,以及競爭,但我們目前的想法是我們正在云優(yōu)化的尾聲階段,并轉(zhuǎn)向新的工作負載啟用。
GenAI的功耗分布
John Furrier經(jīng)常在theCUBE上談?wù)搩缏伞N覀儗⑼ㄟ^觀察對大型語言模型進行修改后的冪律分布來進行總結(jié)。
冪律分布是兩個數(shù)量之間的統(tǒng)計關(guān)系。簡單地說,冪律分布可以理解為80/20法則。例如,我們銷售額的80%來自我們產(chǎn)品組合中的20%。在下面的圖表中,我們對這個概念做了一些改進,認為只有少數(shù)公司會構(gòu)建大規(guī)模的語言模型。大多數(shù)LLM將位于X軸上較長的尾部,并且非常特定于行業(yè),并且它們的規(guī)模較小。
此外,邊緣部署將會非常豐富,并且高度敏感于延遲、經(jīng)濟性和功耗消耗。
在這里,我們想要提出幾點觀點:
首先,我們認為企業(yè)技術(shù)創(chuàng)新仍然受到消費者規(guī)模的推動。個人電腦芯片、來自搜索引擎和社交媒體的數(shù)據(jù)實力、閃存存儲以及最近的Nvidia游戲等等,所有這些都通過消費者渠道進入了企業(yè)。
我們相信,大型云計算和消費品牌將主導最大模型空間和模型的持續(xù)運行。
與Web不同的是,Web上的冪律曲線就像一堵筆直向下沒有軀干的墻(橙色線沿Y軸)。我們相信LLM領(lǐng)域?qū)⑾窦t色虛線所示一樣被拉升并向右上方移動。在這個領(lǐng)域,我們相信開源和第三方工具將填補空白,以及Snowflake和Databricks等云合作伙伴。
戴爾、HPE和IBM等本地市場占主導地位的企業(yè)將成功,當他們能夠利用LLM多樣性,并將其部署在他們的市場模型中...以一種與云計算一樣簡單、更受控制且對于他們特定用例而言更具成本效益的方式。重要的是,我們認為企業(yè)人工智能將需要明確的投資回報率和經(jīng)濟價值,否則項目將無法成功。
正如我們之前所說,我們相信主要價值將來自于減少人員數(shù)量。
與此同時,我們相信邊緣計算將由基于低成本、低功耗、高性能系統(tǒng)構(gòu)建的架構(gòu)主導 ——往往是基于Arm的設(shè)計,并且是大規(guī)模的。比如特斯拉和蘋果。我們相信邊緣計算的經(jīng)濟學最終將進入企業(yè)并成為一股破壞性力量。
這可能需要十年左右的時間,但自個人電腦打破大型機以來,企業(yè)IT的經(jīng)濟學一直受消費者規(guī)模的推動,我們認為這一浪潮也不例外。人工智能+數(shù)據(jù)+規(guī)模經(jīng)濟學將決定未來幾年內(nèi)行業(yè)的基本結(jié)構(gòu)。
無論您在哪個行業(yè)中,我們認為這是一值得做出投資的。然而,應(yīng)用它需要仔細和深入的思考...
網(wǎng)站欄目:云VS本地:誰是生成式人工智能主導的未來戰(zhàn)場?
網(wǎng)站路徑:http://www.fisionsoft.com.cn/article/dphcdhh.html


咨詢
建站咨詢
