中國(guó)網(wǎng)科技7月17日訊(記者 張潤(rùn)琪)在過(guò)去半年,隨著ChatGPT的火熱出圈,AI大模型在全球掀起一輪開發(fā)浪潮,國(guó)內(nèi)的各界大神相繼公開了自家的大模型產(chǎn)品。如今,人們的關(guān)注點(diǎn)也不再是“中國(guó)何時(shí)造出ChatGPT”、“國(guó)產(chǎn)大模型能否迎頭趕上”的初級(jí)階段,而是國(guó)內(nèi)大模型如何構(gòu)建自身優(yōu)勢(shì),未來(lái)的AI之路將走向何方?
公開報(bào)道顯示,據(jù)不完全統(tǒng)計(jì),截至7月初,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上的人工智能大模型已超80個(gè)。例如,百度的“文心”系列、阿里云的“通義”系列、華為云的“盤古大模型”、京東云的“言犀”、商湯的“日日新”、科大訊飛的“星火”、出門問(wèn)問(wèn)的“序列猴子”、第四范式的“式說(shuō)”等產(chǎn)品。AI 大模型興起和快速發(fā)展即將推動(dòng)我們進(jìn)入第四次工業(yè)革命,對(duì)互聯(lián)網(wǎng)的關(guān)鍵技術(shù)、架構(gòu)體系、產(chǎn)業(yè)發(fā)展、應(yīng)用模式產(chǎn)生變革性影響。
今年6月份,中國(guó)工業(yè)互聯(lián)網(wǎng)研究院發(fā)布了《通用人工智能大模型工業(yè)領(lǐng)域知識(shí)問(wèn)答性能評(píng)估報(bào)告》,報(bào)告聚焦評(píng)測(cè)人工智能大模型在中文工業(yè)領(lǐng)域的知識(shí)問(wèn)答能力,通過(guò)選取工業(yè)領(lǐng)域典型的八大行業(yè),構(gòu)建知識(shí)測(cè)試集,對(duì)國(guó)內(nèi)外具有代表性的若干大模型進(jìn)行評(píng)測(cè)。同時(shí),報(bào)告選取了性能前六名的模型進(jìn)行公布,分別是GPT4、GPT3.5、文心一言、ChatGLM、360智腦、天工大模型。
報(bào)告結(jié)論顯示,當(dāng)前,通用大模型在工業(yè)知識(shí)問(wèn)答領(lǐng)域探索處于初級(jí)階段,GPT4仍然是最高水平;國(guó)內(nèi)大模型整體水平與GPT3.5持平,頭部梯隊(duì)表現(xiàn)優(yōu)異,已在部分行業(yè)實(shí)現(xiàn)趕超。
不過(guò),中國(guó)工業(yè)互聯(lián)網(wǎng)研究院的報(bào)告也揭示出通用大模型落地垂直行業(yè)的痛點(diǎn),缺乏特定行業(yè)的專業(yè)知識(shí)。例如,報(bào)告提到大模型在處理不同工業(yè)知識(shí)問(wèn)答時(shí),表現(xiàn)出較大差異,行業(yè)間泛化能力有待加強(qiáng);互聯(lián)網(wǎng)信息量較小的行業(yè),大模型知識(shí)問(wèn)答能力較弱,缺乏該行業(yè)針對(duì)性訓(xùn)練和微調(diào)等。
這份評(píng)估報(bào)告通過(guò)數(shù)據(jù)直觀的指出了通用模型雖然像“百科全書”一樣,能夠適用不同的產(chǎn)業(yè)土壤,但在某個(gè)單項(xiàng)領(lǐng)域的專業(yè)性上會(huì)有所欠缺。那么,是不是垂直大模型才是未來(lái)的主戰(zhàn)場(chǎng)呢?還是做通用大模型和做垂類大模型的將走向融合道路?
“通用大模型和行業(yè)大模型并不是對(duì)立的。”騰訊云副總裁吳運(yùn)聲表示,通用大模型是解決一些通用的問(wèn)題,通用的問(wèn)題可能是在與行業(yè)的結(jié)合深度不太緊的情況下。如果需要解決在行業(yè)里面特別深入的問(wèn)題,還是需要專屬的行業(yè)模型。
科大訊飛在接受中國(guó)網(wǎng)記者采訪時(shí)提到,訊飛星火認(rèn)知大模型從攻關(guān)啟動(dòng)便已明確“1+N”的體系,其中1是指通用認(rèn)知大模型,N指的是大模型在教育、醫(yī)療、工業(yè)、汽車、辦公等各個(gè)領(lǐng)域的落地。之所以“1+N”同步進(jìn)行,一方面是此前訊飛在“N”的行業(yè)領(lǐng)域中有較好的業(yè)務(wù)和場(chǎng)景基礎(chǔ),第二也是因?yàn)?ldquo;N”會(huì)讓“1”的能力持續(xù)迭代進(jìn)化,所以雙方是互相促進(jìn)、共同進(jìn)步的。大模型和專業(yè)模型結(jié)合,能夠在專業(yè)領(lǐng)域和任務(wù)上發(fā)揮重要作用。
中關(guān)村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長(zhǎng)、專精特新企業(yè)高質(zhì)量發(fā)展促進(jìn)工程副主任袁帥告訴中國(guó)網(wǎng)記者,未來(lái)的發(fā)展趨勢(shì)可能是通用大模型和垂直大模型的融合,通過(guò)在通用模型基礎(chǔ)上增加特定領(lǐng)域的知識(shí)和能力來(lái)實(shí)現(xiàn)更廣泛的應(yīng)用和更高的性能。
7月13日,京東推出了言犀大模型,京東集團(tuán)CEO許冉認(rèn)為,“大模型真正實(shí)現(xiàn)自己的價(jià)值,一定是在產(chǎn)業(yè)應(yīng)用中。”于是,京東把大模型與產(chǎn)業(yè)相結(jié)合的使命押在了言犀上。據(jù)介紹,訓(xùn)練京東言犀大模型的數(shù)據(jù)庫(kù),由70%通用數(shù)據(jù)與30%數(shù)智供應(yīng)鏈原生數(shù)據(jù)組成。這些產(chǎn)業(yè)數(shù)據(jù)和行業(yè)know-how,使京東的大模型天然具備“產(chǎn)業(yè)基因”。此外,言犀大模型還具備行業(yè)泛化能力。
值得一提的是,在AI大模型帶來(lái)的智能時(shí)代,具身智能領(lǐng)域也加速發(fā)展。近日,斯坦福大學(xué)李飛飛團(tuán)隊(duì)公布了“具身智能”的最新成果:VoxPoser,即大模型接入機(jī)器人,把復(fù)雜指令轉(zhuǎn)化成具體行動(dòng)規(guī)劃,人類可以隨意地用自然語(yǔ)言給機(jī)器人下達(dá)指令,機(jī)器人也無(wú)需額外數(shù)據(jù)和訓(xùn)練。
對(duì)于具身智能領(lǐng)域的發(fā)展前景,360科技有限公司表示,大模型的發(fā)展要以人為本,應(yīng)該成為人類的朋友和助手,不是每個(gè)人都能成為指令專家,因此大模型簡(jiǎn)單易用、容易上手是一個(gè)重要課題。“具身智能”是一個(gè)很好的解決方案,為我們打開了思路。不過(guò)還有一個(gè)觀點(diǎn),不一定非要人形機(jī)器人,大模型驅(qū)動(dòng)的數(shù)字人也可以實(shí)現(xiàn)很好的效果,因此360認(rèn)為數(shù)字人是未來(lái)人工智能大模型的最重要的應(yīng)用入口,和“具身智能”有異曲同工之妙。