首頁 > 財經 > 國內 >

【天天聚看點】騰訊云大模型領域新動向！向量數據庫作為獨立產品推出，8月正式上架

來源：富途牛牛發布時間：2023-07-05 20:58:15

騰訊云的大模型領域布局，再補齊一塊拼圖。

最新動向，騰訊云AI原生（AI Native）向量數據庫Tencent Cloud VectorDB以獨立產品形式對外發布，將在8月正式上架騰訊云。

這意味著，已經推出了行業大模型平臺的騰訊云，還要專門面向大模型巨大的數據需求，推出單點云服務產品。

(資料圖)

這在國內云市場中，還是首例。

今年大模型趨勢發生以來，向量數據庫因為自身屬性，備受行業關注。

作為給大模型長期記憶的“海馬體”，它能夠加速大模型知識的更新速度、降低訓練成本、保障數據隱私、減少大模型幻覺等，可以解決當下大模型發展中的諸多關鍵問題。

在騰訊云重磅發布的行業大模型平臺上，向量數據庫也是被重點強調的能力之一。

那么問題就來了——

為什么已經向外輸出能力的向量數據庫，還要再以單獨產品形式對外發布？騰訊云這么做的理由是？

還是從最新發布的內容看起。

實現3天接入大模型

先簡單介紹下向量數據庫。

它是通過把數據向量化，然后進行存儲和查詢。可以高速處理大規模復雜數據、高維數據（如圖像、音視頻等）；同時支持復雜查詢操作，能輕松擴展到多個節點處理更大規模數據。

圖源：騰訊云

具體到大模型領域，向量數據庫能有效降低訓練成本、補充模型“長期記憶”、更快更新知識庫、解決提示詞工程復雜等問題。

如騰訊云向量數據庫，可最高支持10億級向量檢索規模，延遲控制在毫秒級，相比傳統插件式數據庫檢索規模提升10倍，同時具備百萬級每秒查詢（QPS）的峰值能力。

這是什么概念？

騰訊云數據庫副總經理羅云解釋說，假設想要在10億張圖片里找到1張有狗的圖片，騰訊云向量數據庫有可以同時支持100萬個類似的請求，在10億規模圖片里進行搜索，并且平均時延控制在百毫秒以內。

而為了能更加面向大模型領域需求，這次最新發布中，騰訊云重新定義了一個AI原生（AI Native）的開發范式。

將提供接入層、計算層、存儲層的全面AI化解決方案。

帶來的改變是，能讓用戶在使用向量數據庫的全生命周期內，都能應用到AI能力。

具體而言：

在接入層，騰訊云向量數據庫支持自然語言文本的輸入，同時采用“標量+向量”的查詢方式，支持全內存索引，最高支持每秒百萬的查詢量（QPS）；

在計算層，AI原生開發范式能實現全量數據AI計算，一站式解決企業在搭建私域知識庫時的文本切分（segment）、向量化（embedding）等難題；

在存儲層，騰訊云向量數據庫支持數據智能存儲分布，能將企業存儲成本降低50%。

帶來的直接好處是，原來企業接入一個大模型需要花1個月左右的時間，用騰訊云向量庫后，可以僅需3天，給企業使用降低了門檻。

而且將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現10倍效率提升，如果將向量數據庫作為外部知識庫用于模型推理，則可以將成本降低2-4個數量級。

為什么以獨立產品形式推出？

自今年大模型趨勢發生以來，向量數據庫領域備受關注。

今年3月以后，多家向量數據庫廠商拿下最新融資，其中Pinecone更是獲得高達1億美元的B輪融資。

騰訊云當然也注意到了這一趨勢。

騰訊云數據庫副總經理羅云表示，當時內部已經開始討論，隨著AI趨勢演進是否需要有一個單獨workload的向量數據庫去對外提供服務？

要知道，向量檢索其實非常消耗CPU和內存資源。隨著使用向量數據庫的workload越來越大，插件式的數據庫會面臨一些挑戰。

如果能把LTP（語言技術平臺）流量擴增和向量流量擴增的資源分開，能讓企業更加精細化管理自己的資源，從而降低成本。

因此騰訊云認為這種Purpose-built（專用）向量數據庫會越來越重要。

而且在那個時間點，內部已經有了一個比較明確的判斷：

騰訊云在多年的積累下，對外提供一個更大規模的向量數據庫產品，是有優勢的。

為什么這么說？

有兩方面原因。

對內，騰訊云并非是從0到1開始做向量數據庫；對外，市場需求已經非常明顯，而且會越來越大。

內因方面，騰訊云向量數據庫從2019年開始在內部進行孵化，集成了業內以及騰訊自研的大量優秀算法，其能力已在內部多項業務中得到充分驗證，并且積累了比較豐富的實踐經驗。

騰訊云向量數據庫依托于騰訊內部的分布式向量數據庫引擎Olama（原名ElasticFaiss）。

騰訊PCG大數據平臺部搜索推薦Senior Tech Lead鄭偉介紹，Olama目前負責處理騰訊集團每日千億次檢索，在內部海量場景的實踐下，數據接入AI的效率也比傳統方案提升10倍，運行穩定性達99.99%。

其向量化能力（embedding）在2021年登頂MS MARCO 榜單第一，相關成果已發表在NLP頂會ACL。

而在Olama的最新升級中，還針對成本、穩定性、自動化等方面做出更大提升。

目前，Olama已經應用在了多個騰訊內部業務上，如騰訊視頻、QQ瀏覽器、QQ音樂等30款產品中。

數據顯示，使用騰訊云向量數據庫后，QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%。

以騰訊視頻的應用為例，視頻庫中的圖片、音頻、標題文本等內容使用騰訊云向量數據庫，月均完成的檢索和計算量高達200億次，有效滿足了版權保護、原創識別、相似性檢索等場景需求。

而在外因方面，不僅是看到了向量數據庫領域的發展趨勢，騰訊云認為在這一方面云廠商也有一定自身優勢。

羅云表示，出于對數據的重視，國內企業在選擇數據類產品服務時，會希望能更加穩定、長久。

那么在國內的To B決策鏈條里，公有云廠商提供自己相應的技術服務，會很有競爭力。

據東北證券預測，到2030年，全球向量數據庫市場規模有望達到500億美元，國內向量數據庫市場規模有望超過600億人民幣。

騰訊云的動向，代表了云廠商在向量數據庫方面的發力。

而除此之外，我們也看到Zilliz在內的向量數據庫廠商，陸續面向大模型進行產品更新和升級。以及一些老牌數據庫廠商（如甲骨文）也在發布AI相關業務。

而目前行業尚處于一個比較早期的階段，未來趨勢如何發展，還要看各方廠商的具體動向了。

但總之，在大模型趨勢推動下，向量數據庫領域還在不斷升溫。

編輯/lambor

標簽：

分享到：QQ空間新浪微博騰訊微博人人網微信

上一篇：美股相關性接近歷史低點，專家警告：是危不是機！熱消息

下一篇：最后一頁

【天天聚看點】騰訊云大模型領域新動向！向量數據

騰訊云的大模型領域布局，再補齊一塊拼圖。最新動向，騰訊云AI原生（AI更多

2023-07-05 20:58:15

美股相關性接近歷史低點，專家警告：是危不是機！

本文來源：智通財經衡量美國股市同步走勢的指標接近歷史低點，這看起來更多

2023-07-05 20:52:23

特斯拉多頭：Cybertruck將推動明年整體銷量飆升50

本文來源：新浪財經特斯拉備受期待的Cybertruck預計將于第三季度面市，更多

2023-07-05 19:56:57

XR頭顯出貨量下降33%意味著什么，元宇宙坍塌？

香港萬得通訊社報道，滯銷、砍單！XR頭顯設備可能僅僅曇花一現，就湮沒更多

2023-07-05 18:53:15

iPhone的無線充電，特斯拉要用到車上了

無線充電要來了，無人駕駛還會遠嗎？2017年，蘋果公司推出的新一代手機更多

2023-07-05 18:58:04

浙江發布《關于促進平臺經濟高質量發展的實施意見

7月5日，浙江召開全省平臺經濟高質量發展大會。阿里巴巴、網易等100家更多

2023-07-05 18:55:39

大摩首席經濟學家：美聯儲有望實現夢寐以求的“軟

摩根士丹利首席經濟學家塞斯·卡朋特（SethCarpenter）認為，由于勞動更多

2023-07-05 17:55:07

【全球時快訊】2年和10年美債收益率倒掛創多年新

香港萬得通訊社報道，進入7月份，CME“美聯儲觀察”顯示7月份加息25個更多

2023-07-05 17:47:32

天天短訊！諾獎得主克魯格曼：美國有望避免衰退，

諾貝爾經濟學獎得主保羅·克魯格曼周一表示，“痛苦指數”的下降是另一更多

2023-07-05 17:56:07

北水單日凈流入超90億港元！大舉掃貨港股ETF，賣

7月5日（周三），南下資金今日凈買入港股92 41億港元，創年內次高。$盈更多

2023-07-05 17:49:36

【天天聚看點】騰訊云大模型

實現3天接入大模型

為什么以獨立產品形式推出？

猜你喜歡

【天天聚看點】騰訊云大模型領域新動向！向量數據

美股相關性接近歷史低點，專家警告：是危不是機！

特斯拉多頭：Cybertruck將推動明年整體銷量飆升50

XR頭顯出貨量下降33%意味著什么，元宇宙坍塌？

iPhone的無線充電，特斯拉要用到車上了

浙江發布《關于促進平臺經濟高質量發展的實施意見

大摩首席經濟學家：美聯儲有望實現夢寐以求的“軟

【全球時快訊】2年和10年美債收益率倒掛創多年新

天天短訊！諾獎得主克魯格曼：美國有望避免衰退，

北水單日凈流入超90億港元！大舉掃貨港股ETF，賣

美股相關性接近歷史低點，專家警告：是危不是機！熱消息

加拿大要求剝離在加鋰礦資產中礦資源等三家公司回應：影響不大

2023電信日|思特奇以科技創新為翼，攜手運營商數字生態共飛騰

北京市旅游行業協會：導游不帶病上團，備好防中暑藥品

業績快報信息披露不準確震有科技被出具警示函

深圳紡織服裝出口快速增長前三季度民營企業出口紡織服裝333.7億元

柏廚家居疏影和春日木語用自然回應自然

建設綠色未來！比亞迪參與巴西太陽能建設生產光伏組件超200萬塊

48小時點擊排行

圖片新聞

沒有穩定工作也可以進行貸款買車嗎具體規定你知道嗎？

安徽人民幣各項存款余額增速全國第三企業融資成本穩中有降

中信銀行上饒分行因員工行為管理不到位被罰50萬

多家銀行近期宣布暫停智能投顧業務申購投資者該怎么辦？

關于我們

聯系方式

供稿服務

版權聲明

廣告服務

實現3天接入大模型

為什么以獨立產品形式推出？

猜你喜歡

48小時點擊排行

圖片新聞

為什么以獨立產品形式推出？