- +1
Bing搶先ChatGPT發布識圖功能
微軟悄悄上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的入口。根據用戶上傳的圖片,Bing Chat就能識圖回答問題。
早在3月份,OpenAI在發布GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是圖像輸入功能,即GPT-4支持圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不過當時,該多模態功能尚處于研究預覽階段,還不能公開。
如今,微軟似乎要搶先ChatGPT一步發布識圖功能。在上個月Bing的大更新日志中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支持。
那么,“長了眼睛”的Bing Chat到底是怎么樣的呢?
首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關于機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能準確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂斗》游戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了一一辨認后,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步提升。再者,在根據手繪圖編程網頁方面,Bing Chat對于網友給出的手畫“試題”,基本能夠搭出網頁的雛形。
在大語言模型升級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別后的Bing Chat將具有更多的功能,給人類的使用帶來更大的方便。而曾經一些難以用語言表達的內容,現在都可以通過圖片進行解決。甚至,具備了圖像識別功能的AI還可以在教育、醫療等領域發揮更大的作用和價值。比如,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,幫助學生解答復雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,用戶還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會生活中的價值將由此得到最大化的實現。
由Bing Chat帶來的前景功能,無疑令人興奮的。但是,從目前的小范圍測試功能到完全向公眾開放識圖功能,確保公眾不會因為誤信Bing Chat的回答而出現安全問題,微軟還需要做大量的限制和調試,可謂任重道遠。
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司