騰訊云的大模型領域布局,再補齊一塊拼圖。
最新動向,騰訊云AI原生(AI Native)向量數據庫Tencent Cloud VectorDB以獨立產品形式對外發布,將在8月正式上架騰訊云。
這意味著,已經推出了行業大模型平臺的騰訊云,還要專門面向大模型巨大的數據需求,推出單點云服務產品。
(資料圖)
這在國內云市場中,還是首例。
今年大模型趨勢發生以來,向量數據庫因為自身屬性,備受行業關注。
作為給大模型長期記憶的“海馬體”,它能夠加速大模型知識的更新速度、降低訓練成本、保障數據隱私、減少大模型幻覺等,可以解決當下大模型發展中的諸多關鍵問題。
在騰訊云重磅發布的行業大模型平臺上,向量數據庫也是被重點強調的能力之一。
那么問題就來了——
為什么已經向外輸出能力的向量數據庫,還要再以單獨產品形式對外發布?騰訊云這么做的理由是?
還是從最新發布的內容看起。
實現3天接入大模型
先簡單介紹下向量數據庫。
它是通過把數據向量化,然后進行存儲和查詢。可以高速處理大規模復雜數據、高維數據(如圖像、音視頻等);同時支持復雜查詢操作,能輕松擴展到多個節點處理更大規模數據。
具體到大模型領域,向量數據庫能有效降低訓練成本、補充模型“長期記憶”、更快更新知識庫、解決提示詞工程復雜等問題。
如騰訊云向量數據庫,可最高支持10億級向量檢索規模,延遲控制在毫秒級,相比傳統插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
這是什么概念?
騰訊云數據庫副總經理羅云解釋說,假設想要在10億張圖片里找到1張有狗的圖片,騰訊云向量數據庫有可以同時支持100萬個類似的請求,在10億規模圖片里進行搜索,并且平均時延控制在百毫秒以內。
而為了能更加面向大模型領域需求,這次最新發布中,騰訊云重新定義了一個AI原生(AI Native)的開發范式。
將提供接入層、計算層、存儲層的全面AI化解決方案。
帶來的改變是,能讓用戶在使用向量數據庫的全生命周期內,都能應用到AI能力。
具體而言:
在接入層,騰訊云向量數據庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢方式,支持全內存索引,最高支持每秒百萬的查詢量(QPS);
在計算層,AI原生開發范式能實現全量數據AI計算,一站式解決企業在搭建私域知識庫時的文本切分(segment)、向量化(embedding)等難題;
在存儲層,騰訊云向量數據庫支持數據智能存儲分布,能將企業存儲成本降低50%。
帶來的直接好處是,原來企業接入一個大模型需要花1個月左右的時間,用騰訊云向量庫后,可以僅需3天,給企業使用降低了門檻。
而且將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現10倍效率提升,如果將向量數據庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數量級。
為什么以獨立產品形式推出?
自今年大模型趨勢發生以來,向量數據庫領域備受關注。
今年3月以后,多家向量數據庫廠商拿下最新融資,其中Pinecone更是獲得高達1億美元的B輪融資。
騰訊云當然也注意到了這一趨勢。
騰訊云數據庫副總經理羅云表示,當時內部已經開始討論,隨著AI趨勢演進是否需要有一個單獨workload的向量數據庫去對外提供服務?
要知道,向量檢索其實非常消耗CPU和內存資源。隨著使用向量數據庫的workload越來越大,插件式的數據庫會面臨一些挑戰。
如果能把LTP(語言技術平臺)流量擴增和向量流量擴增的資源分開,能讓企業更加精細化管理自己的資源,從而降低成本。
因此騰訊云認為這種Purpose-built(專用)向量數據庫會越來越重要。
而且在那個時間點,內部已經有了一個比較明確的判斷:
騰訊云在多年的積累下,對外提供一個更大規模的向量數據庫產品,是有優勢的。
為什么這么說?
有兩方面原因。
對內,騰訊云并非是從0到1開始做向量數據庫;對外,市場需求已經非常明顯,而且會越來越大。
內因方面,騰訊云向量數據庫從2019年開始在內部進行孵化,集成了業內以及騰訊自研的大量優秀算法,其能力已在內部多項業務中得到充分驗證,并且積累了比較豐富的實踐經驗。
騰訊云向量數據庫依托于騰訊內部的分布式向量數據庫引擎Olama(原名ElasticFaiss)。
騰訊PCG大數據平臺部搜索推薦Senior Tech Lead鄭偉介紹,Olama目前負責處理騰訊集團每日千億次檢索,在內部海量場景的實踐下,數據接入AI的效率也比傳統方案提升10倍,運行穩定性達99.99%。
其向量化能力(embedding)在2021年登頂MS MARCO 榜單第一,相關成果已發表在NLP頂會ACL。
而在Olama的最新升級中,還針對成本、穩定性、自動化等方面做出更大提升。
目前,Olama已經應用在了多個騰訊內部業務上,如騰訊視頻、QQ瀏覽器、QQ音樂等30款產品中。
數據顯示,使用騰訊云向量數據庫后,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%。
以騰訊視頻的應用為例,視頻庫中的圖片、音頻、標題文本等內容使用騰訊云向量數據庫,月均完成的檢索和計算量高達200億次,有效滿足了版權保護、原創識別、相似性檢索等場景需求。
而在外因方面,不僅是看到了向量數據庫領域的發展趨勢,騰訊云認為在這一方面云廠商也有一定自身優勢。
羅云表示,出于對數據的重視,國內企業在選擇數據類產品服務時,會希望能更加穩定、長久。
那么在國內的To B決策鏈條里,公有云廠商提供自己相應的技術服務,會很有競爭力。
據東北證券預測,到2030年,全球向量數據庫市場規模有望達到500億美元,國內向量數據庫市場規模有望超過600億人民幣。
騰訊云的動向,代表了云廠商在向量數據庫方面的發力。
而除此之外,我們也看到Zilliz在內的向量數據庫廠商,陸續面向大模型進行產品更新和升級。以及一些老牌數據庫廠商(如甲骨文)也在發布AI相關業務。
而目前行業尚處于一個比較早期的階段,未來趨勢如何發展,還要看各方廠商的具體動向了。
但總之,在大模型趨勢推動下,向量數據庫領域還在不斷升溫。
編輯/lambor