亚洲综合精品一区二区,久久精品国一区二区三区,中国国产一区二区

觀點(diǎn) | GPT-4震撼發(fā)布，圖片/視頻應(yīng)用、游戲和虛擬人有望加速融合|天天最新

來源：富途牛牛發(fā)布時(shí)間：2023-03-17 09:41:52

來源：中信建投證券研究

GPT-4在理解能力、圖片和文本的綜合理解、定制個(gè)性等方面具有顯著提升。對(duì)于應(yīng)用領(lǐng)域而言，我們已經(jīng)可以看到多模態(tài)模型幫助應(yīng)用同時(shí)實(shí)現(xiàn)增收、降本增效的可能性。我們此前將現(xiàn)在類比為移動(dòng)互聯(lián)網(wǎng)爆發(fā)前夕，預(yù)計(jì)GPT-4將加速這一進(jìn)程。

其中我們認(rèn)為“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用發(fā)展的基座，“+游戲”將從改善需求看實(shí)現(xiàn)增收，同時(shí)為大型游戲減少研發(fā)費(fèi)用，為中小型游戲減少營(yíng)銷費(fèi)用，“+虛擬人”將解決行業(yè)發(fā)展受限于套皮等“偽需求”問題。

(資料圖片)

OpenAI在3月15日正式發(fā)布GPT-4。據(jù)OpenAI，GPT-4是多模態(tài)模型，可以理解文字和圖片，并反饋文字，其理解能力較GPT-3和ChatGPT更強(qiáng)。目前GPT-4的文字輸入和反饋功能已經(jīng)在ChatGPT更新，并開放了API接口，而圖片輸入功能將會(huì)和Be My Eyes合作。據(jù)Be My Eyes官網(wǎng)，Virtual Volunteer功能將會(huì)結(jié)合GPT-4，iOS和安卓應(yīng)用已開放該功能的預(yù)約。

據(jù)OpenAI官網(wǎng)，相較ChatGPT和GPT-3，GPT-4主要在一下6個(gè)方面有較大改進(jìn)：

1）GPT-4的理解能力有重大優(yōu)化，我們預(yù)計(jì)將顯著改善辦公等生產(chǎn)力場(chǎng)景的用戶體驗(yàn)。據(jù)OpenAI官網(wǎng)，在模擬AP、SAT、GRE和美國(guó)法考等大部分考試中，帶視覺能力的GPT-4可以獲得更好的成績(jī)。26門模擬考試中，GPT-4在17門獲得了更好的成績(jī)，特別是在微積分、化學(xué)和物理等理科領(lǐng)域有近40%，甚至更高的排名提升。據(jù)The Verge報(bào)道，此前ChatGPT在數(shù)學(xué)推算過程中時(shí)常會(huì)出現(xiàn)錯(cuò)誤。而從此次OpenAI展示的結(jié)果看，數(shù)學(xué)邏輯的推理能力已明顯提升。此外排名提升最大的是美國(guó)司法考試，GPT-3.5排名僅列后10%，而GPT-4.0可以達(dá)到前10%的排名。

2）多模態(tài)模型可以綜合理解文本和圖片，從而優(yōu)化反饋，我們預(yù)計(jì)更有助提升教育領(lǐng)域的用戶體驗(yàn)。GPT-4的多模態(tài)模型可以提取圖片和文字中的標(biāo)簽，以統(tǒng)一的數(shù)據(jù)進(jìn)行處理，并給予文字反饋。因此在OpenAI的測(cè)試中，GPT-4可以理解搞笑圖片中iPhone的數(shù)據(jù)線不合常理得大的梗。我們認(rèn)為圖片和文本的綜合理解能力可以優(yōu)化交互場(chǎng)景體驗(yàn)。比如在教育場(chǎng)景中，從此前單純的文字/語(yǔ)言互動(dòng)，發(fā)展成結(jié)合視覺和語(yǔ)言的理解，給予更好的反饋，預(yù)計(jì)豐富教育形式，從而提升教育質(zhì)量。

3）GPT-4在非英語(yǔ)場(chǎng)景下表現(xiàn)得更好。OpenAI使用Azure Translate將57門學(xué)科的14,000道選擇題翻譯成了26種語(yǔ)言，并給予GPT-4測(cè)試。結(jié)果顯示，GPT-4在其中24種語(yǔ)言的正確率高于GPT-3.5、Chinchilla、谷歌的PaLM等LLM的英文測(cè)試表現(xiàn)，包括拉脫維亞語(yǔ)、威爾士語(yǔ)、斯瓦西里語(yǔ)等預(yù)料資源稀缺的小語(yǔ)種。從另一層面可見GPT-4對(duì)于語(yǔ)言的理解能力也要由于其他LLM。

4）GPT-4的“可操縱性”（Steerability）將賦予AI不同的個(gè)性，預(yù)計(jì)將進(jìn)一步推動(dòng)虛擬人成為“人”的可能。相比ChatGPT固定的語(yǔ)言風(fēng)格，GPT-4將允許接入API的用戶定制AI的“性格”。我們預(yù)計(jì)將進(jìn)一步優(yōu)化虛擬人的反饋機(jī)制，類似于國(guó)內(nèi)AI對(duì)話應(yīng)用Glow可以讓用戶與“鋼鐵俠”Tony Stark等不同背景、場(chǎng)景的虛擬人對(duì)話，將相關(guān)技術(shù)帶入虛擬人場(chǎng)景中，是虛擬人成為真正的“人”。

因此，我們認(rèn)為ChatGPT使虛擬人擺脫動(dòng)捕僅，獲得AI反饋機(jī)制，成為“人”是第一步，而GPT-4解鎖了虛擬人發(fā)展的第二部，使其成為個(gè)性迥異的“人”。這有助于解決虛擬人發(fā)展受限于套皮、性格等造成與虛擬人對(duì)話、互動(dòng)是“偽需求”的問題。

5）在體驗(yàn)方面，GPT-4在安全、道德、法律等方面的防范意識(shí)更好。OpenAI的研發(fā)人員基于在開放后，用戶不斷提出的有害信息、誘導(dǎo)性問題，對(duì)模型進(jìn)行了優(yōu)化，因此現(xiàn)在GPT-4在安全、道德、法律等方面的防范意識(shí)更強(qiáng)。

6）GPT-4允許用戶輸入更長(zhǎng)的內(nèi)容。相較GPT-3.5和ChatGPT約4,096 tokens/約8,000單詞的限制，GPT-4允許用戶最多輸入32,768 tokens/64,000單詞，是過去的8倍。因此，GPT-4可以更持續(xù)性地與用戶進(jìn)行更多輪的對(duì)話，而不會(huì)很快“忘記”之前的對(duì)話內(nèi)容。

以獲得Y Combinator支持的生成式AI初創(chuàng)公司為例，多數(shù)應(yīng)用主要是文本形式的輸入和輸出類應(yīng)用，包括客服、辦公輔助、科技金融等，其次為文本生成圖片的變相應(yīng)用，如生成不同藝術(shù)風(fēng)格的短視頻（無情節(jié)的藝術(shù)插畫拼接）、游戲3D模型和素材生成等。

此次多模態(tài)的GPT-4發(fā)布，我們認(rèn)為一方面，在生產(chǎn)力工具、教育和客服等交互應(yīng)用，這類目前更容易落地的場(chǎng)景內(nèi)，我們可以看到GPT-4的輔助能力進(jìn)一步提升，優(yōu)化了現(xiàn)有落地場(chǎng)景的用戶體驗(yàn)；另一方面，我們也看到了多模態(tài)模型的可能性，此次升級(jí)在輸入端，將文本理解，升級(jí)成文本和圖片的綜合理解，而未來我們也可以展望在輸出端，也可以有文本結(jié)合圖片、視頻等形式的產(chǎn)出，從而推動(dòng)圖片/視頻應(yīng)用、游戲、虛擬人等應(yīng)用場(chǎng)景有更豐富的功能落地。

我們認(rèn)為“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用領(lǐng)域的基座，提升生產(chǎn)效率、降低成本。目前已有的AIGC技術(shù)融合應(yīng)用的形式還較為單一，多數(shù)仍是文字生成圖片的變相應(yīng)用。而多模態(tài)模型使文本、圖片、視頻等多種內(nèi)容形式的綜合理解，以及多種內(nèi)容的結(jié)合輸出成為可能。最終不僅可以在C端的場(chǎng)景中，為日常生活提供娛樂和生產(chǎn)工具，同時(shí)也可以在游戲、虛擬人等內(nèi)容的生產(chǎn)中提供輔助工具。因此我們認(rèn)為，“多模態(tài)+圖片/視頻應(yīng)用”是應(yīng)用領(lǐng)域落地的基礎(chǔ)。

“多模態(tài)+游戲”：1）提升行業(yè)需求：互動(dòng)感倍增，解決行業(yè)需求放緩的痛點(diǎn)。自疫情初期經(jīng)歷短暫需求增長(zhǎng)后，市場(chǎng)整體出現(xiàn)需求疲軟的情況。據(jù)游戲產(chǎn)業(yè)報(bào)告，22年中國(guó)游戲市場(chǎng)實(shí)際銷售收入2,658.8億元，同比下降10.3%，減少306.3億元。而多模態(tài)AIGC模型的應(yīng)用，預(yù)計(jì)可提升游戲的互動(dòng)體驗(yàn)。如網(wǎng)易已在《逆水寒》中將AIGC技術(shù)應(yīng)用于NPC，增加玩家互動(dòng)體驗(yàn)。未來，我們預(yù)計(jì)AIGC可以改變游戲固定的故事模式，提升游戲的內(nèi)容量，增強(qiáng)游戲的互動(dòng)體驗(yàn)，最終通過技術(shù)改善游戲需求增長(zhǎng)放緩的問題。

2）降低成本：大型游戲降低研發(fā)成本，中小型游戲降低營(yíng)銷成本。除增收以外，多模態(tài)也可以通過更低的生產(chǎn)成本制作出內(nèi)容量更大的游戲，類似于TechCrunch報(bào)道的，哥本哈根大學(xué)的團(tuán)隊(duì)將AIGC技術(shù)應(yīng)用于《超級(jí)馬里奧》游戲中，生成無限關(guān)卡的MarioGPT，對(duì)于大型游戲而言可以降低研發(fā)成本。

中小型游戲的研發(fā)成本占比有限，而將本邏輯類似于廣告營(yíng)銷公司?；谟脩粼谖⒉?、抖音等平臺(tái)觀看的內(nèi)容，以及天氣、地理位置等外部信息，生成“千人千面”的廣告內(nèi)容，最終提升廣告的ROI。因此，多模態(tài)模型可以降低廣告素材生產(chǎn)成本，提升廣告效果，從而為中小型游戲?qū)⒈尽?/p>

“多模態(tài)+虛擬人”：成為真正的“人”，解決行業(yè)發(fā)展痛點(diǎn)。由于目前虛擬人存在套皮，或是AI生成的虛擬人性格單一等問題，導(dǎo)致虛擬人存在是否為“偽需求”的質(zhì)疑。而從此次GPT-4的發(fā)布中可以看到，AI已可以擁有個(gè)性，同時(shí)多模態(tài)可以結(jié)合文本/語(yǔ)言、圖片/視覺的理解，更好得讓虛擬人理解人類的真實(shí)感受，并給出反饋，提升互動(dòng)的體驗(yàn)感，解決行業(yè)發(fā)展痛點(diǎn)。

我們認(rèn)為多模態(tài)的GPT-4為圖片/視頻應(yīng)用、游戲和虛擬人在發(fā)展中落地 AIGC 技術(shù)，提供了更多可能性，有助同時(shí)實(shí)現(xiàn)增收、降本增效，最終改善行業(yè)和個(gè)股的估值彈性。

風(fēng)險(xiǎn)提示：

生成式AI技術(shù)發(fā)展不及預(yù)期、各領(lǐng)域技術(shù)融合進(jìn)度不及預(yù)期的風(fēng)險(xiǎn)、算力支持程度不及預(yù)期、數(shù)據(jù)質(zhì)量及數(shù)量支持程度不及預(yù)期、用戶需求不及預(yù)期、技術(shù)壟斷風(fēng)險(xiǎn)、原始訓(xùn)練數(shù)據(jù)存在偏見風(fēng)險(xiǎn)、算法偏見與歧視風(fēng)險(xiǎn)、算法透明度風(fēng)險(xiǎn)、增加監(jiān)管難度風(fēng)險(xiǎn)、政策監(jiān)管風(fēng)險(xiǎn)、商業(yè)化能力不及預(yù)期、相關(guān)法律法規(guī)完善不及預(yù)期、版權(quán)歸屬風(fēng)險(xiǎn)、深度造假風(fēng)險(xiǎn)、人權(quán)道德風(fēng)險(xiǎn)、影響互聯(lián)網(wǎng)內(nèi)容生態(tài)健康安全風(fēng)險(xiǎn)、企業(yè)風(fēng)險(xiǎn)識(shí)別與治理能力不足風(fēng)險(xiǎn)、用戶審美取向發(fā)生變化的風(fēng)險(xiǎn)。

編輯/Somer

標(biāo)簽：

分享到：QQ空間新浪微博騰訊微博人人網(wǎng)微信

上一篇：港股異動(dòng) | 百度拉升漲近9%，智能云已與5家企業(yè)完成首批簽約合作并與650家企業(yè)啟動(dòng)簽約觀察

下一篇：百度文心一言正式亮相！能否成為股價(jià)催化劑？機(jī)構(gòu)這樣看|每日頭條