2023年無疑是人工智能的“爆發年”,各種基于AI的新技術如雨后春筍般拔地而出,其中AI大模型成為了全球科技公司的“角逐場”。簡單來說,AI大模型就是基于AI的Foundation Model(基礎模型),這是一種在大規模寬泛的數據上進行訓練后能適應一系列下游任務的模型。AI大模型兼具“大規模”和“預訓練”兩種屬性,面向實際任務建模前需要在海量通用數據上進行預先訓練,這樣才能大幅提升AI的通用性和泛化性。
但是,AI大模型需要的參數量和數據量非常龐大,以OpenAI基于深度學習的自然語言處理模型ChatGPT為例。它最初的GPT-1參數量只有1.17億,到了2020年GPT-3發布的時候,其參數規模就達到了驚人的1750億。如今,人工智能模型體量已躍升至“萬億級”參數規模,大算力、強算法共同筑起了一道“高不見頂”的技術壁壘,只有深耕AI賽道的大公司才有“入場”的資格。
根據小編整理的人工智能大事件日歷,二季度華為、商湯科技、阿里巴巴、科大訊飛等國內科技公司都發布AI大模型新產品,它們的技術路線各不相同,既有采用類ChatGPT模式的,也有采用多模態混合模式的。比如華為盤古大模型就包括NLP(自然語言處理)大模型、CV(機器視覺)大模型和科學計算大模型,其中CV大模型首次兼顧圖像判別與生成能力,可結合科學計算大模型對氣象進行預報,這是典型的多模態混合模式。
阿里巴巴即將發布與百度“文心一言”類似的“通義千問”,這是一款類似ChatGPT的大型預訓練語言模型,具有廣泛的知識儲備和普適性,在訓練過程中學習大量文本數據,從而具備跨領域知識和語言理解能力,適用于不同場景下的需求。
科大訊飛將于5月6日發布的“1+N認知智能大模型”,“1”是指1個通用認知智能大模型算法研發及高效訓練底座平臺,“N”是指應用多個行業領域的專用大模型版本,并且將有望帶來“N”個場景的示范性產品,或將推動AI認知大模型從“可用”階段邁入“常用”階段。同時據了解科大訊飛基于認知智能全國重點實驗室,已在核心算法、行業數據、算力支撐及團隊組建等方面建立了優勢保障。
目前,我國在AI認知智能領域已取得長足進展。根據第三方研究報告顯示,中國在認知智能領域論文發表量僅次于美國,相關專利數量2017年超過美日韓,產業應用也呈現出AI+教育、AI+醫療、AI+金融等領域的“多點開花”,技術應用探索位居世界前列。認知智能可以賦予機器理解和模擬人類行為的能力,使得機器“能說會道有情感”。因此認知大模型是“兵家必爭之賽道”,包括科大訊飛在內的巨頭率先布局,目前已進入成果產出期。
展望未來,隨著AI大模型在千行百業的深入應用,人工智能將在垂直領域有更多的落地機會。我國也將在“數字中國”戰略框架下,通過政策扶持助力AI技術創新和應用探索,推動整個AI產業加速駛入“深水區”。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。