- +1
說起來你可能不信,大伙可能都被驗證碼白嫖過了
只要上網沖過浪的人,基本上就沒有不知道驗證碼這玩意的。這些年來,驗證碼的形式也被玩得越來越花。有不少的網友吐槽,沒有一些知識儲備,連驗證碼都要看不懂了。



其實啊,驗證碼的用處可以用簡單的一句來解釋清楚:區分計算機和真正的人。
而這一切要從驗證碼的歷史講起。
驗證碼英文叫做 “ CAPTCHA ”,這七個大寫的字母是 “ Completely Automated Public Turing test to tell Computers and Humans Apart ” 這個超長詞組的縮寫,直譯就是 “ 全自動區分計算機和人類的圖靈測試 ”。


在 2000 年初,互聯網的浪潮剛剛在全世界掀起,當時最讓大伙苦惱的一件事就是垃圾郵件太多了。甚至有一群家伙還特意制作了程序,可以終日無休地大量注冊新郵箱賬號,然后用來發送垃圾推廣郵件。
公司封號刪除的速度遠遠趕不上他們注冊的速度,用戶郵箱中的重要郵件也常常被一大波的垃圾郵件所淹沒。
互聯網公司和用戶都深受其苦。
一位名叫 Luis 的天才程序員就想到了法子,他發現計算機程序很難認清手寫的文本,而人類可以輕松地看懂。可以在注冊賬號的時候設一道門檻,必須輸入 “ 歪曲 ” 的文本才能完成注冊,用來識別計算機和真人。

如今,國內外就有許多公司專門為網站提供驗證碼服務,例如為 12306 提供驗證碼的微觸科技、為斗魚和 B 站提供服務的極驗科技,甚至身為互聯網巨頭的谷歌,也同時是世界最大的驗證碼服務提供商。

到目前為止,輸驗證碼還是區別人和計算機最有效率的方法。

或許有差友會脫口而出:浪費時間就是浪費生命!驗證碼浪費了人類大量的生命!
球都嘛得,說起來你可能不信,實際上輸入驗證碼的時間并沒有全被浪費,反而每一次輸入驗證碼,你都可能是在為人類的文化事業,或者是為人工智能貢獻著一份力。

書籍的內容大部分是文本、驗證碼也是文本,把掃描版的書籍文本對接到驗證碼上,讓用戶來識別不就行了?于是乎一個叫做 reCAPTCHA 的新式驗證碼系統誕生了。
reCAPTCHA 會提供兩個單詞給用戶來識別。這兩個單詞都是書籍掃描版的一部分。

不過第二個單詞計算機暫時還沒能力認出來。面對這第二個單詞,一旦有 10 個人輸入了同樣的答案,那么這答案就會被當作是正確答案。靠這種方法,reCAPTCHA 每年能成功數字化 230 多萬本舊書。
仔細看 reCAPTCHA 驗證碼的右下角,你還能看到正能量滿滿的話語:Stop spam.Read books.
別發垃圾郵件了,去讀些書吧!

大伙們肯定遇到過這類街景驗證碼,讓我們選中小轎車、路牌或是自行車等等圖片。在你費眼又費腦地輸入它們的時候,你其實是在為谷歌的人工智能免費打工。

和之前的書籍電子化一樣的套路,其中還夾雜了幾張 AI 難以識別的街景,用來白嫖你的勞動力。而這些數據,最后會被用于培訓人工智能。
對于這種空手套白狼的行為,谷歌官方也不藏著掖著,就直接叫告訴大家:你們的免費勞動力,我拿走了!


但即使是你鼠標的這么輕輕一點,驗證碼還是能從你身上吸點油水。

而且目前國外有超過 65 萬個網站用 reCAPCHA v3,每點擊一次驗證按鈕,就等于打卡告訴谷歌你來過這兒,谷歌就會根據你去過的網站來給你推送定制的廣告。。。
而點擊驗證碼的用戶,只不過是在無償地為谷歌提供數據罷了。。。

但無論驗證碼怎么進化,只要你是真真切切的人,驗證碼這關都不可能真正擋住你。就像 reCAPCHA 一直所倡導的那樣:Tough on bots,Easy on humans ( 對機器人困難,對人類簡單 )。

這么一想,是不是感覺自己的鍵鼠都在散發著無私的榮光呢?
圖片、資料來源:
36 氪,《 41 歲的天才數學教授,創造了 “ 驗證碼 ” 和 “ 多鄰國 ” ,身家 7 億美元 》
維基百科, reCAPCHA
搜狐科技,《 你以為自己在填驗證碼,其實你是在給 Google 義務勞動 》

原標題:《說起來你可能不信,大伙可能都被驗證碼白嫖過了。》
本文為澎湃號作者或機構在澎湃新聞上傳并發布,僅代表該作者或機構觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司