▓成人丝瓜视频▓无码免费,99精品国产一区二区三区不卡 ,大长腿白丝被c到爽哭视频 ,高清无码内谢

澎湃Logo
下載客戶端

登錄

  • +1

北京智源推出通用視覺分割模型SegGPT,具備上下文推理能力

澎湃新聞記者 張靜
2023-05-29 09:47
來源:澎湃新聞
? 未來2% >
字號

·SegGPT是一個利用視覺提示完成任意分割任務的通用視覺模型,具備上下文推理能力,訓練完成后無需微調,只需提供示例即可自動推理并完成對應分割任務,包括圖像和視頻中的實例、類別、零部件、輪廓、文本、人臉、醫學圖像等。

·Meta AI圖像分割基礎模型SAM的精細標注能力與SegGPT的通用分割標注能力相結合,能把任意圖像從像素陣列解析為視覺結構單元,像生物視覺那樣理解任意場景。

ChatGPT引發語言大模型狂潮,AI另一個重大領域視覺的GPT時刻何時到來?

5月28日,北京智源人工智能研究院在2023中關村論壇平行論壇之一的人工智能大模型發展論壇上推出通用分割模型SegGPT(Segment Everything In Contex),這是一個利用視覺提示(prompt)完成任意分割任務的通用視覺模型。

論文地址:https://arxiv.org/abs/2304.03284

標注出一個畫面中的彩虹,可批量化分割其他畫面中的彩虹。

SegGPT是智源通用視覺模型Painter的衍生模型,針對分割一切物體的目標做出優化。SegGPT具備上下文推理能力,訓練完成后無需微調,只需提供示例即可自動推理并完成對應分割任務,包括圖像和視頻中的實例、類別、零部件、輪廓、文本、人臉、醫學圖像等。它的靈活推理能力支持任意數量的視覺提示。自動視頻分割和追蹤能力以第一幀圖像和對應的物體掩碼作為上下文示例,SegGPT能夠自動對后續視頻幀進行分割,并且可以用掩碼的顏色作為物體的ID,實現自動追蹤。

用畫筆大致圈出行星環帶(上圖),在預測圖中準確輸出目標圖像中的行星環帶(下圖)。

此前,Meta公司發布了AI圖像分割基礎模型SAM,SegGPT與SAM的差異在于,SAM“一觸即通”,通過一個點或邊界框,在待預測圖片上給出交互提示,識別分割畫面上的指定物體。SegGPT“一通百通”,給出一個或幾個示例圖像和意圖掩碼,模型就能知道用戶意圖,“有樣學樣”地完成類似分割任務。用戶在畫面上標注識別一類物體,即可批量化識別分割同類物體,無論是在當前畫面還是其他畫面或視頻環境中。

SegGPT能夠根據用戶提供的宇航員頭盔掩碼這一上下文(上圖),在新的圖片中預測出對應的宇航員頭盔區域(下圖)。

無論是“一觸即通”還是“一通百通”,都意味著視覺模型已經“理解”了圖像結構。SAM精細標注能力與SegGPT的通用分割標注能力相結合,能把任意圖像從像素陣列解析為視覺結構單元,像生物視覺那樣理解任意場景。

    責任編輯:鄭潔
    校對:丁曉
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            主站蜘蛛池模板: 栾城县| 鄂托克前旗| 连南| 沅江市| 清远市| 广丰县| 麻江县| 油尖旺区| 安福县| 定结县| 茶陵县| 诸暨市| 奇台县| 太仆寺旗| 承德县| 玉环县| 婺源县| 商河县| 乡城县| 岢岚县| 兴安县| 呼图壁县| 大厂| 娄烦县| 三河市| 休宁县| 永济市| 伊春市| 马公市| 长宁县| 诏安县| 大城县| 彭山县| 杭州市| 金山区| 五家渠市| 宝鸡市| 文昌市| 金湖县| 淳安县| 云霄县|