來源:中信建投證券研究
GPT-4在理解能力、圖片和文本的綜合理解、定制個(gè)性等方面具有顯著提升。對(duì)于應(yīng)用領(lǐng)域而言,我們已經(jīng)可以看到多模態(tài)模型幫助應(yīng)用同時(shí)實(shí)現(xiàn)增收、降本增效的可能性。我們此前將現(xiàn)在類比為移動(dòng)互聯(lián)網(wǎng)爆發(fā)前夕,預(yù)計(jì)GPT-4將加速這一進(jìn)程。
其中我們認(rèn)為“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用發(fā)展的基座,“+游戲”將從改善需求看實(shí)現(xiàn)增收,同時(shí)為大型游戲減少研發(fā)費(fèi)用,為中小型游戲減少營(yíng)銷費(fèi)用,“+虛擬人”將解決行業(yè)發(fā)展受限于套皮等“偽需求”問題。
(資料圖片)
OpenAI在3月15日正式發(fā)布GPT-4。據(jù)OpenAI,GPT-4是多模態(tài)模型,可以理解文字和圖片,并反饋文字,其理解能力較GPT-3和ChatGPT更強(qiáng)。目前GPT-4的文字輸入和反饋功能已經(jīng)在ChatGPT更新,并開放了API接口,而圖片輸入功能將會(huì)和Be My Eyes合作。據(jù)Be My Eyes官網(wǎng),Virtual Volunteer功能將會(huì)結(jié)合GPT-4,iOS和安卓應(yīng)用已開放該功能的預(yù)約。
據(jù)OpenAI官網(wǎng),相較ChatGPT和GPT-3,GPT-4主要在一下6個(gè)方面有較大改進(jìn):
1)GPT-4的理解能力有重大優(yōu)化,我們預(yù)計(jì)將顯著改善辦公等生產(chǎn)力場(chǎng)景的用戶體驗(yàn)。據(jù)OpenAI官網(wǎng),在模擬AP、SAT、GRE和美國(guó)法考等大部分考試中,帶視覺能力的GPT-4可以獲得更好的成績(jī)。26門模擬考試中,GPT-4在17門獲得了更好的成績(jī),特別是在微積分、化學(xué)和物理等理科領(lǐng)域有近40%,甚至更高的排名提升。據(jù)The Verge報(bào)道,此前ChatGPT在數(shù)學(xué)推算過程中時(shí)常會(huì)出現(xiàn)錯(cuò)誤。而從此次OpenAI展示的結(jié)果看,數(shù)學(xué)邏輯的推理能力已明顯提升。此外排名提升最大的是美國(guó)司法考試,GPT-3.5排名僅列后10%,而GPT-4.0可以達(dá)到前10%的排名。
2)多模態(tài)模型可以綜合理解文本和圖片,從而優(yōu)化反饋,我們預(yù)計(jì)更有助提升教育領(lǐng)域的用戶體驗(yàn)。GPT-4的多模態(tài)模型可以提取圖片和文字中的標(biāo)簽,以統(tǒng)一的數(shù)據(jù)進(jìn)行處理,并給予文字反饋。因此在OpenAI的測(cè)試中,GPT-4可以理解搞笑圖片中iPhone的數(shù)據(jù)線不合常理得大的梗。我們認(rèn)為圖片和文本的綜合理解能力可以優(yōu)化交互場(chǎng)景體驗(yàn)。比如在教育場(chǎng)景中,從此前單純的文字/語(yǔ)言互動(dòng),發(fā)展成結(jié)合視覺和語(yǔ)言的理解,給予更好的反饋,預(yù)計(jì)豐富教育形式,從而提升教育質(zhì)量。
3)GPT-4在非英語(yǔ)場(chǎng)景下表現(xiàn)得更好。OpenAI使用Azure Translate將57門學(xué)科的14,000道選擇題翻譯成了26種語(yǔ)言,并給予GPT-4測(cè)試。結(jié)果顯示,GPT-4在其中24種語(yǔ)言的正確率高于GPT-3.5、Chinchilla、谷歌的PaLM等LLM的英文測(cè)試表現(xiàn),包括拉脫維亞語(yǔ)、威爾士語(yǔ)、斯瓦西里語(yǔ)等預(yù)料資源稀缺的小語(yǔ)種。從另一層面可見GPT-4對(duì)于語(yǔ)言的理解能力也要由于其他LLM。
4)GPT-4的“可操縱性”(Steerability)將賦予AI不同的個(gè)性,預(yù)計(jì)將進(jìn)一步推動(dòng)虛擬人成為“人”的可能。相比ChatGPT固定的語(yǔ)言風(fēng)格,GPT-4將允許接入API的用戶定制AI的“性格”。我們預(yù)計(jì)將進(jìn)一步優(yōu)化虛擬人的反饋機(jī)制,類似于國(guó)內(nèi)AI對(duì)話應(yīng)用Glow可以讓用戶與“鋼鐵俠”Tony Stark等不同背景、場(chǎng)景的虛擬人對(duì)話,將相關(guān)技術(shù)帶入虛擬人場(chǎng)景中,是虛擬人成為真正的“人”。
因此,我們認(rèn)為ChatGPT使虛擬人擺脫動(dòng)捕僅,獲得AI反饋機(jī)制,成為“人”是第一步,而GPT-4解鎖了虛擬人發(fā)展的第二部,使其成為個(gè)性迥異的“人”。這有助于解決虛擬人發(fā)展受限于套皮、性格等造成與虛擬人對(duì)話、互動(dòng)是“偽需求”的問題。
5)在體驗(yàn)方面,GPT-4在安全、道德、法律等方面的防范意識(shí)更好。OpenAI的研發(fā)人員基于在開放后,用戶不斷提出的有害信息、誘導(dǎo)性問題,對(duì)模型進(jìn)行了優(yōu)化,因此現(xiàn)在GPT-4在安全、道德、法律等方面的防范意識(shí)更強(qiáng)。
6)GPT-4允許用戶輸入更長(zhǎng)的內(nèi)容。相較GPT-3.5和ChatGPT約4,096 tokens/約8,000單詞的限制,GPT-4允許用戶最多輸入32,768 tokens/64,000單詞,是過去的8倍。因此,GPT-4可以更持續(xù)性地與用戶進(jìn)行更多輪的對(duì)話,而不會(huì)很快“忘記”之前的對(duì)話內(nèi)容。
以獲得Y Combinator支持的生成式AI初創(chuàng)公司為例,多數(shù)應(yīng)用主要是文本形式的輸入和輸出類應(yīng)用,包括客服、辦公輔助、科技金融等,其次為文本生成圖片的變相應(yīng)用,如生成不同藝術(shù)風(fēng)格的短視頻(無情節(jié)的藝術(shù)插畫拼接)、游戲3D模型和素材生成等。
此次多模態(tài)的GPT-4發(fā)布,我們認(rèn)為一方面,在生產(chǎn)力工具、教育和客服等交互應(yīng)用,這類目前更容易落地的場(chǎng)景內(nèi),我們可以看到GPT-4的輔助能力進(jìn)一步提升,優(yōu)化了現(xiàn)有落地場(chǎng)景的用戶體驗(yàn);另一方面,我們也看到了多模態(tài)模型的可能性,此次升級(jí)在輸入端,將文本理解,升級(jí)成文本和圖片的綜合理解,而未來我們也可以展望在輸出端,也可以有文本結(jié)合圖片、視頻等形式的產(chǎn)出,從而推動(dòng)圖片/視頻應(yīng)用、游戲、虛擬人等應(yīng)用場(chǎng)景有更豐富的功能落地。
我們認(rèn)為“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用領(lǐng)域的基座,提升生產(chǎn)效率、降低成本。目前已有的AIGC技術(shù)融合應(yīng)用的形式還較為單一,多數(shù)仍是文字生成圖片的變相應(yīng)用。而多模態(tài)模型使文本、圖片、視頻等多種內(nèi)容形式的綜合理解,以及多種內(nèi)容的結(jié)合輸出成為可能。最終不僅可以在C端的場(chǎng)景中,為日常生活提供娛樂和生產(chǎn)工具,同時(shí)也可以在游戲、虛擬人等內(nèi)容的生產(chǎn)中提供輔助工具。因此我們認(rèn)為,“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用領(lǐng)域落地的基礎(chǔ)。
“多模態(tài)+游戲”:1)提升行業(yè)需求:互動(dòng)感倍增,解決行業(yè)需求放緩的痛點(diǎn)。自疫情初期經(jīng)歷短暫需求增長(zhǎng)后,市場(chǎng)整體出現(xiàn)需求疲軟的情況。據(jù)游戲產(chǎn)業(yè)報(bào)告,22年中國(guó)游戲市場(chǎng)實(shí)際銷售收入2,658.8億元,同比下降10.3%,減少306.3億元。而多模態(tài)AIGC模型的應(yīng)用,預(yù)計(jì)可提升游戲的互動(dòng)體驗(yàn)。如網(wǎng)易已在《逆水寒》中將AIGC技術(shù)應(yīng)用于NPC,增加玩家互動(dòng)體驗(yàn)。未來,我們預(yù)計(jì)AIGC可以改變游戲固定的故事模式,提升游戲的內(nèi)容量,增強(qiáng)游戲的互動(dòng)體驗(yàn),最終通過技術(shù)改善游戲需求增長(zhǎng)放緩的問題。
2)降低成本:大型游戲降低研發(fā)成本,中小型游戲降低營(yíng)銷成本。除增收以外,多模態(tài)也可以通過更低的生產(chǎn)成本制作出內(nèi)容量更大的游戲,類似于TechCrunch報(bào)道的,哥本哈根大學(xué)的團(tuán)隊(duì)將AIGC技術(shù)應(yīng)用于《超級(jí)馬里奧》游戲中,生成無限關(guān)卡的MarioGPT,對(duì)于大型游戲而言可以降低研發(fā)成本。
中小型游戲的研發(fā)成本占比有限,而將本邏輯類似于廣告營(yíng)銷公司?;谟脩粼谖⒉?、抖音等平臺(tái)觀看的內(nèi)容,以及天氣、地理位置等外部信息,生成“千人千面”的廣告內(nèi)容,最終提升廣告的ROI。因此,多模態(tài)模型可以降低廣告素材生產(chǎn)成本,提升廣告效果,從而為中小型游戲?qū)⒈尽?/p>
“多模態(tài)+虛擬人”:成為真正的“人”,解決行業(yè)發(fā)展痛點(diǎn)。由于目前虛擬人存在套皮,或是AI生成的虛擬人性格單一等問題,導(dǎo)致虛擬人存在是否為“偽需求”的質(zhì)疑。而從此次GPT-4的發(fā)布中可以看到,AI已可以擁有個(gè)性,同時(shí)多模態(tài)可以結(jié)合文本/語(yǔ)言、圖片/視覺的理解,更好得讓虛擬人理解人類的真實(shí)感受,并給出反饋,提升互動(dòng)的體驗(yàn)感,解決行業(yè)發(fā)展痛點(diǎn)。
我們認(rèn)為多模態(tài)的GPT-4為圖片/視頻應(yīng)用、游戲和虛擬人在發(fā)展中落地 AIGC 技術(shù),提供了更多可能性,有助同時(shí)實(shí)現(xiàn)增收、降本增效,最終改善行業(yè)和個(gè)股的估值彈性。
風(fēng)險(xiǎn)提示:
生成式AI技術(shù)發(fā)展不及預(yù)期、各領(lǐng)域技術(shù)融合進(jìn)度不及預(yù)期的風(fēng)險(xiǎn)、算力支持程度不及預(yù)期、數(shù)據(jù)質(zhì)量及數(shù)量支持程度不及預(yù)期、用戶需求不及預(yù)期、技術(shù)壟斷風(fēng)險(xiǎn)、原始訓(xùn)練數(shù)據(jù)存在偏見風(fēng)險(xiǎn)、算法偏見與歧視風(fēng)險(xiǎn)、算法透明度風(fēng)險(xiǎn)、增加監(jiān)管難度風(fēng)險(xiǎn)、政策監(jiān)管風(fēng)險(xiǎn)、商業(yè)化能力不及預(yù)期、相關(guān)法律法規(guī)完善不及預(yù)期、版權(quán)歸屬風(fēng)險(xiǎn)、深度造假風(fēng)險(xiǎn)、人權(quán)道德風(fēng)險(xiǎn)、影響互聯(lián)網(wǎng)內(nèi)容生態(tài)健康安全風(fēng)險(xiǎn)、企業(yè)風(fēng)險(xiǎn)識(shí)別與治理能力不足風(fēng)險(xiǎn)、用戶審美取向發(fā)生變化的風(fēng)險(xiǎn)。
編輯/Somer