久久精品免费看国产成人,四虎国产精品亚洲一区久久,伊人精品久久久7777,成人欧美一区二区三区在线,99精品国产福利一区二区,亚洲精品成人毛片久久久,久久精品99精品免费观看 ,99热久久这里只有精品免费,久久精品免费一区二区三区

環(huán)球觀熱點:CV迎GPT-3時刻!萬物皆可一鍵摳圖,Meta新模型要掀起CV革命?
來源:Meta官方、路透社 發(fā)布時間:2023-04-07 17:48:47

來源:智東西

智東西4月6日消息,根據(jù)Meta官方博客,Meta在本周三推出了一個AI模型Segment Anything Model(SAM,分割一切模型),能夠根據(jù)文本指令等方式實現(xiàn)圖像分割,而且萬物皆可識別和一鍵摳圖。

Meta AI在推特宣布發(fā)布SAM模型

Meta在博客中稱,SAM的靈活性在圖像分割領域內屬首創(chuàng),SAM以交互式方式標注一個掩碼(mask)僅需約14秒。英偉達AI研究科學家Jim Fan稱,該模型的發(fā)布是計算機視覺領域的“GPT-3時刻”,因為該模型能對從未訓練過的圖片進行精準分割。在推出SAM的同時,Meta還發(fā)布了一個圖像注釋數(shù)據(jù)集Segment Anything 1-Billion mask(SA-1B),該數(shù)據(jù)集包含超11億個掩碼,據(jù)稱是同類數(shù)據(jù)集中最大的。


(資料圖)

目前,Meta內部已經在使用SAM技術來進行標記照片、審核內容以及向Facebook和Instagram用戶推薦內容等,同時更多在VR/AR、智慧農業(yè)等領域的顛覆性應用暢想也在官網展示了出來。

Meta研發(fā)團隊在官網上發(fā)布了關于Segment Anything的論文細節(jié)。

論文鏈接:https://ai.facebook.com/research/publications/segment-anything/

一、鼠標停留、手動框選、自動分割,三種方式實現(xiàn)圖像切割

SAM可以識別圖像和視頻中的任何物體,即使是在此前的訓練過程中從未遇到過的。Meta官網中提供了SAM的免費演示,并為用戶提供了三種分割圖像部分的方法:

一是“懸停和點擊(Hover&Click)”,當用戶把鼠標放在想要分割出的部分上并點擊時,SAM會自動提取出該部分。

二是“方框(Boxing)”,用戶將自己想要的部分框定出來,SAM會識別其中的物體并將其與背景進行分割。

三是“全選(Everything)”,在這種模式下SAM會自動識別圖像內的所有物體。

雖然還沒有發(fā)布產品,但Meta已展示了SAM的部分功能,目前官網介紹的功能包括:用交互點式和手動框定來選擇物體;

SAM自動分割圖像中的所有內容;

自動給不明確的提示生成多個valid mask(有效掩碼),讓用戶能精準選中圖像;

此外,SAM還可與其它系統(tǒng)靈活集成,從其它系統(tǒng)中獲取輸入提示,比如,從AR/VR頭顯中獲取用戶的視線范圍來選擇對象,甚至還能將看到的物體轉換成為3D對象。

SAM還能啟用文本框輸入來檢測界定對象,當用戶在文本框中輸入“cat(貓)”這個單詞時,SAM會框定住圖像中所有的貓,并在框中精確選取貓的整個圖像輪廓。

SAM的有效輸出掩碼(valid mask)還可以用作其他AI系統(tǒng)的輸入,如當用戶選中一張椅子的圖片后,SAM可以精確選中,并在視頻中跟蹤物體遮罩,自動啟用圖像編輯應用程序,把靜態(tài)物體轉化為3D或是碎片拼貼等狀態(tài)。

二、領域內首創(chuàng):由1000萬張圖片訓練,可提取11億+掩碼

在自然語言處理和計算機視覺領域,基礎模型是其發(fā)展的重要基礎,基礎模型可以使用“prompting(促進)”技術對新數(shù)據(jù)集和任務執(zhí)行零樣本和少樣本學習。Meta從中汲取了靈感,并對SAM模型進行訓練。

在Meta發(fā)布一篇論文中,研發(fā)團隊人員詳細介紹了SAM的相關細節(jié)。

基礎分割模型的三個關聯(lián)組件

常見的圖像分割方式包括兩種,一是交互式分割,二是自動分割。前者需要工程師通過迭代完善一個遮罩來指導模型,后者是模型在經過數(shù)百或數(shù)千個注釋對象的訓練后自行完成,但同樣需要訓練者手動標注分割對象。

這兩種方法都無法實現(xiàn)全自動的圖像分割,而SAM將二者的功能進行融合。在模型的提示界面上,用戶只需要為模型提供正確的提示,比如點擊、框選或是文本指令,模型就可以完成全自動的圖像分割任務。這就意味著,用戶不再需要收集自己的細分數(shù)據(jù)來微調模型。

在Web瀏覽器中,SAM有效映射圖像特征和一組提示嵌入來生成分割掩碼

在引擎蓋下,輕量級編碼器將任何提示實時轉換為嵌入向量(embedding vector),然后將信息源組合在一個預測分割掩碼的輕量級解碼器中。在計算圖像嵌入后,SAM 50毫秒內就能根據(jù)網絡瀏覽器中的任何提示生成一個切割好的圖像。

論文中稱,SAM能根據(jù)輸入提示為圖像中所有對象生成高質量的對象掩碼(mask),用于訓練SAM的SA-1B圖像數(shù)據(jù)集目前包含超過11億個掩碼,這些掩碼是從1100萬張已經獲得許可、并且保護隱私的高分辨率圖像中收集的,這些圖像的分辨率達到了1500×2250 pixels,平均每張圖像約有100個掩碼。

原始圖片和SAM提取的圖像進行對比

Meta在論文中指出,有了SAM模型,收集新分割掩碼的速度遠超以往,交互式標注一個掩碼現(xiàn)在只需要約14秒。其數(shù)據(jù)集數(shù)量也是現(xiàn)在任何一個數(shù)據(jù)集的400倍。這種高自動化、高靈活性的圖像分割技術為領域內首創(chuàng)。

三、CV領域的“GPT-3時刻”,或變革VR/AR

Meta官方稱,通過在業(yè)內共享這項研究和數(shù)據(jù)集,公司希望進一步加速對分割圖像視頻的研究。這款可提示分割模型可以作為更大系統(tǒng)中的組件來執(zhí)行分割任務。Meta預計,SAM或將成為AR/VR、內容創(chuàng)作等領域的強大組件之一,有望創(chuàng)造出更為通用的AI系統(tǒng)。

英偉達AI研究科學家Jim Fan稱“今天是計算機視覺領域的‘GPT-3 時刻’之一”,SAM已經了解了“對象”的概念,甚至對于不熟悉乃至未知的場景和那些模棱兩可的情況,它都能進行切割。Jim稱難以想象它的模型和數(shù)據(jù)居然都是開源的。

他指出了SAM的秘訣:

1、一個非常簡單但可擴展的架構,采用文本、關鍵點、邊框等多種提示模式;

2、與模型設計密切相關的人工操作渠道;

3、一個數(shù)據(jù)飛輪,允許模型自主學習那些未標記的圖像。

扎克伯格稱,將這種生成式AI作為“創(chuàng)意輔助工具”納入到Meta的應用程序中是今年工作目標的重中之重。

目前,SAM模型和數(shù)據(jù)集僅在非商用許可下提供下載,用戶在將自己的圖片上傳到原型上時,必須承諾不將其用作研究。

未來,SAM可用于通過AR眼鏡識別日常物品,向用戶發(fā)出提醒和指示。

SAM也將對其他領域產生影響,比如指導農民進行糧食生產或協(xié)助生物學家進行研究等。

結語:圖像分割再進化,Meta掀起CV革命?

圖像分割技術并非是新鮮事,但SAM能識別出訓練數(shù)據(jù)集中不存在的物體,或許將會引發(fā)新一輪AI視覺應用潮。未來,Meta通過分享他們的研究和數(shù)據(jù)集,將會使這類組合系統(tǒng)設計在多個領域得到廣泛應用。SAM將會是內容創(chuàng)作、圖像生成等更為普遍的AI領域的一個強大組件,讓圖像識別和視覺內容的語義理解之間更好耦合,釋放出更強大的AI潛力。

編輯/hoten

標簽:

猜你喜歡

微軟Bing市場份額不增反降,谷歌搜索“一哥”位置

微軟將ChatGPT集成進Bing,并在GPT-4的推動下?lián)碛凶约旱纳伤阉黧w驗,可謂搶盡“搜索一哥”谷歌的...更多

2023-05-15 18:27:36

一圖讀懂 | 美股期權隱含波動率排行榜 (5.15)

隱含波動率(IV)是對一支股票年內價格變動的預估,反映投資者對未來價格波動程度的預期,是期權定...更多

2023-05-15 18:44:03

財報前夕,騰訊股價一度漲超4%,這次業(yè)績將會有怎

在財報發(fā)布的前夕,騰訊結束了連續(xù)一個月的股價下行趨勢,在5月15日一度漲超4%,說明市場對本次騰訊...更多

2023-05-15 18:28:01

【環(huán)球新視野】北水搶籌科網股!加倉騰訊近12億港

2023年5月15日,南向資金凈買入16 53億港元。$騰訊控股(00700 HK)$、$美團-W(03690 HK)$、$中國海洋石油(00883 HK)$分更多

2023-05-15 17:40:54

巴菲特看好的日本股市,要創(chuàng)33年新高了 環(huán)球精選

堅實基本面推動日股上漲,同時外資流入和回購潮支撐日本股市情緒。“股神”又押對了?5月15日周一,...更多

2023-05-15 17:32:45

財報前瞻 | 獲多名分析師看好,沃爾瑪Q1業(yè)績有

隨著最新一輪財報季繼續(xù)如火如荼地進行,本周零售行業(yè)成為了關注焦點。其中,$沃爾瑪(WMT US)$將于5月18日更多

2023-05-15 16:35:32

環(huán)球要聞:每日期權追蹤 | 罕見認錯!特斯拉召

編者按:《每日期權跟蹤》緊跟期權市場,關注博弈動向,為牛友提供多維度機會參考,助力牛友掌握投...更多

2023-05-15 16:36:38

港市速睇 | 港股午后強勁拉升!三大指數(shù)齊漲超1

富途資訊5月15日消息,港股三大指數(shù)午后強勢拉升,恒指一度收復2萬點關口。最終,恒指、國指漲1 75%,科指更多

2023-05-15 16:44:40

易點云(02416.HK)今起招股,發(fā)售價每股10-12港元

在數(shù)字經濟浪潮下,中小企業(yè)數(shù)字化轉型大勢所趨!今年兩會政府工作報告亦提出「加快傳統(tǒng)產業(yè)和中小...更多

2023-05-15 16:43:09

每日快看:又一里程碑!港交所:“互換通”正式啟

5月15日,港交所正式舉行互換通上線儀式,香港政、經兩界大佬齊聚金融大會堂,包括香港特區(qū)行政長官...更多

2023-05-15 15:30:17