久久精品免费看国产成人,四虎国产精品亚洲一区久久,伊人精品久久久7777,成人欧美一区二区三区在线,99精品国产福利一区二区,亚洲精品成人毛片久久久,久久精品99精品免费观看 ,99热久久这里只有精品免费,久久精品免费一区二区三区

【天天聚看點】騰訊云大模型領域新動向!向量數據庫作為獨立產品推出,8月正式上架
來源:富途牛牛 發布時間:2023-07-05 20:58:15

騰訊云的大模型領域布局,再補齊一塊拼圖。

最新動向,騰訊云AI原生(AI Native)向量數據庫Tencent Cloud VectorDB以獨立產品形式對外發布,將在8月正式上架騰訊云。

這意味著,已經推出了行業大模型平臺的騰訊云,還要專門面向大模型巨大的數據需求,推出單點云服務產品。


(資料圖)

這在國內云市場中,還是首例。

今年大模型趨勢發生以來,向量數據庫因為自身屬性,備受行業關注。

作為給大模型長期記憶的“海馬體”,它能夠加速大模型知識的更新速度、降低訓練成本、保障數據隱私、減少大模型幻覺等,可以解決當下大模型發展中的諸多關鍵問題。

在騰訊云重磅發布的行業大模型平臺上,向量數據庫也是被重點強調的能力之一。

那么問題就來了——

為什么已經向外輸出能力的向量數據庫,還要再以單獨產品形式對外發布?騰訊云這么做的理由是?

還是從最新發布的內容看起。

實現3天接入大模型

先簡單介紹下向量數據庫。

它是通過把數據向量化,然后進行存儲和查詢。可以高速處理大規模復雜數據、高維數據(如圖像、音視頻等);同時支持復雜查詢操作,能輕松擴展到多個節點處理更大規模數據。

圖源:騰訊云

具體到大模型領域,向量數據庫能有效降低訓練成本、補充模型“長期記憶”、更快更新知識庫、解決提示詞工程復雜等問題。

如騰訊云向量數據庫,可最高支持10億級向量檢索規模,延遲控制在毫秒級,相比傳統插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。

這是什么概念?

騰訊云數據庫副總經理羅云解釋說,假設想要在10億張圖片里找到1張有狗的圖片,騰訊云向量數據庫有可以同時支持100萬個類似的請求,在10億規模圖片里進行搜索,并且平均時延控制在百毫秒以內。

而為了能更加面向大模型領域需求,這次最新發布中,騰訊云重新定義了一個AI原生(AI Native)的開發范式。

將提供接入層、計算層、存儲層的全面AI化解決方案。

帶來的改變是,能讓用戶在使用向量數據庫的全生命周期內,都能應用到AI能力。

具體而言:

在接入層,騰訊云向量數據庫支持自然語言文本的輸入,同時采用“標量+向量”的查詢方式,支持全內存索引,最高支持每秒百萬的查詢量(QPS);

在計算層,AI原生開發范式能實現全量數據AI計算,一站式解決企業在搭建私域知識庫時的文本切分(segment)、向量化(embedding)等難題;

在存儲層,騰訊云向量數據庫支持數據智能存儲分布,能將企業存儲成本降低50%。

帶來的直接好處是,原來企業接入一個大模型需要花1個月左右的時間,用騰訊云向量庫后,可以僅需3天,給企業使用降低了門檻。

而且將騰訊云向量數據庫用于大模型預訓練數據的分類、去重和清洗相比傳統方式可以實現10倍效率提升,如果將向量數據庫作為外部知識庫用于模型推理,則可以將成本降低2-4個數量級。

為什么以獨立產品形式推出?

自今年大模型趨勢發生以來,向量數據庫領域備受關注。

今年3月以后,多家向量數據庫廠商拿下最新融資,其中Pinecone更是獲得高達1億美元的B輪融資。

騰訊云當然也注意到了這一趨勢。

騰訊云數據庫副總經理羅云表示,當時內部已經開始討論,隨著AI趨勢演進是否需要有一個單獨workload的向量數據庫去對外提供服務?

要知道,向量檢索其實非常消耗CPU和內存資源。隨著使用向量數據庫的workload越來越大,插件式的數據庫會面臨一些挑戰。

如果能把LTP(語言技術平臺)流量擴增和向量流量擴增的資源分開,能讓企業更加精細化管理自己的資源,從而降低成本。

因此騰訊云認為這種Purpose-built(專用)向量數據庫會越來越重要。

而且在那個時間點,內部已經有了一個比較明確的判斷:

騰訊云在多年的積累下,對外提供一個更大規模的向量數據庫產品,是有優勢的。

為什么這么說?

有兩方面原因。

對內,騰訊云并非是從0到1開始做向量數據庫;對外,市場需求已經非常明顯,而且會越來越大。

內因方面,騰訊云向量數據庫從2019年開始在內部進行孵化,集成了業內以及騰訊自研的大量優秀算法,其能力已在內部多項業務中得到充分驗證,并且積累了比較豐富的實踐經驗。

騰訊云向量數據庫依托于騰訊內部的分布式向量數據庫引擎Olama(原名ElasticFaiss)。

騰訊PCG大數據平臺部搜索推薦Senior Tech Lead鄭偉介紹,Olama目前負責處理騰訊集團每日千億次檢索,在內部海量場景的實踐下,數據接入AI的效率也比傳統方案提升10倍,運行穩定性達99.99%。

其向量化能力(embedding)在2021年登頂MS MARCO 榜單第一,相關成果已發表在NLP頂會ACL。

而在Olama的最新升級中,還針對成本、穩定性、自動化等方面做出更大提升。

目前,Olama已經應用在了多個騰訊內部業務上,如騰訊視頻、QQ瀏覽器、QQ音樂等30款產品中。

數據顯示,使用騰訊云向量數據庫后,QQ音樂人均聽歌時長提升3.2%、騰訊視頻有效曝光人均時長提升1.74%、QQ瀏覽器成本降低37.9%。

以騰訊視頻的應用為例,視頻庫中的圖片、音頻、標題文本等內容使用騰訊云向量數據庫,月均完成的檢索和計算量高達200億次,有效滿足了版權保護、原創識別、相似性檢索等場景需求。

而在外因方面,不僅是看到了向量數據庫領域的發展趨勢,騰訊云認為在這一方面云廠商也有一定自身優勢。

羅云表示,出于對數據的重視,國內企業在選擇數據類產品服務時,會希望能更加穩定、長久。

那么在國內的To B決策鏈條里,公有云廠商提供自己相應的技術服務,會很有競爭力。

據東北證券預測,到2030年,全球向量數據庫市場規模有望達到500億美元,國內向量數據庫市場規模有望超過600億人民幣。

騰訊云的動向,代表了云廠商在向量數據庫方面的發力。

而除此之外,我們也看到Zilliz在內的向量數據庫廠商,陸續面向大模型進行產品更新和升級。以及一些老牌數據庫廠商(如甲骨文)也在發布AI相關業務。

而目前行業尚處于一個比較早期的階段,未來趨勢如何發展,還要看各方廠商的具體動向了。

但總之,在大模型趨勢推動下,向量數據庫領域還在不斷升溫。

編輯/lambor

標簽:

猜你喜歡

【天天聚看點】騰訊云大模型領域新動向!向量數據

騰訊云的大模型領域布局,再補齊一塊拼圖。最新動向,騰訊云AI原生(AI更多

2023-07-05 20:58:15

美股相關性接近歷史低點,專家警告:是危不是機!

本文來源:智通財經衡量美國股市同步走勢的指標接近歷史低點,這看起來更多

2023-07-05 20:52:23

特斯拉多頭:Cybertruck將推動明年整體銷量飆升50

本文來源:新浪財經特斯拉備受期待的Cybertruck預計將于第三季度面市,更多

2023-07-05 19:56:57

XR頭顯出貨量下降33%意味著什么,元宇宙坍塌?

香港萬得通訊社報道,滯銷、砍單!XR頭顯設備可能僅僅曇花一現,就湮沒更多

2023-07-05 18:53:15

iPhone的無線充電,特斯拉要用到車上了

無線充電要來了,無人駕駛還會遠嗎?2017年,蘋果公司推出的新一代手機更多

2023-07-05 18:58:04

浙江發布《關于促進平臺經濟高質量發展的實施意見

7月5日,浙江召開全省平臺經濟高質量發展大會。阿里巴巴、網易等100家更多

2023-07-05 18:55:39

大摩首席經濟學家:美聯儲有望實現夢寐以求的“軟

摩根士丹利首席經濟學家塞斯·卡朋特(SethCarpenter)認為,由于勞動更多

2023-07-05 17:55:07

【全球時快訊】2年和10年美債收益率倒掛創多年新

香港萬得通訊社報道,進入7月份,CME“美聯儲觀察”顯示7月份加息25個更多

2023-07-05 17:47:32

天天短訊!諾獎得主克魯格曼:美國有望避免衰退,

諾貝爾經濟學獎得主保羅·克魯格曼周一表示,“痛苦指數”的下降是另一更多

2023-07-05 17:56:07

北水單日凈流入超90億港元!大舉掃貨港股ETF,賣

7月5日(周三),南下資金今日凈買入港股92 41億港元,創年內次高。$盈更多

2023-07-05 17:49:36