- +1
隔屏有耳調查|亞馬遜智能音箱有千人監聽團隊,曾聽到性侵案
遭遇“隔屏有耳”質疑的,不止中國流行的手機App,還有國內外近年興起的智能音箱。最新的一例是亞馬遜智能音箱Echo植入的智能語音助手Alexa,被曝有人類人工參與“監聽”。
4月11日,彭博社發布調查報道,揭秘了亞馬遜Alexa“監聽”團隊中,這些一直被隱藏的人類員工的工作內容。報道稱,有時候,參與其中的工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調的歌聲,或者一個孩子尖叫著尋求幫助。還有兩名員工甚至稱,他們聽到過他們認為是性侵案的聲音。
亞馬遜此前從未公開過它會人工聽取用戶和Alexa的私人聊天,也沒有披露過Alexa的語音技術中,部分包括人類參與。7位為該項目工作的員工向彭博社透露了亞馬遜Alexa的這項人工聲音檢查流程。
亞馬遜的Echo是世界上最流行的智能音箱,它于2014年上市;Echo音箱之后,谷歌也推出了植入谷歌語音助手的Google Home智能音箱,蘋果隨后推出了采用Siri的智能音箱HomePod。在中國,天貓精靈、小度智能音箱、小米AI音箱等設備也紛紛走進了更多用戶家庭。
如今,很多用戶已經習慣于通過喚醒詞將音箱中的語音助手激活,進而向它提出問題或下達指令,有的智能音箱甚至還能與用戶簡單地聊兩句天。但彭博社的報道提出,智能助手如此“懂你”的背后,可能并不僅僅是人工智能和機器學習,而是有人類員工團隊人工聽取用戶與設備的對話錄音,并幫忙改進算法的結果。

亞馬遜千人監聽團隊
彭博社報道介紹,亞馬遜在全球有數千名工作人員,他們人工聽取和檢查用戶和智能語音助手Alexa的私人對話,目的是幫助Alexa改進語音識別技術。

該團隊專門收聽用戶在家中和辦公室里被Echo音箱抓取的錄音。這些錄音會被轉錄、加上注釋,然后反饋到軟件中,以消除Alexa對理解人類語言的差距,幫助它更好地響應指令。
亞馬遜在廣告詞中介紹,“Alexa生活在云端,并且一直越來越聰明”,實際上,和許多需要從經驗中學習的軟件工具一樣,人類也為機器做了不少教學。
執行這一工作的團隊包括全職亞馬遜員工和合約工,工作地點遍布世界不同地區,包括波士頓、哥斯達黎加、印度、羅馬尼亞。員工簽署了保密協議禁止公開談論這一項目。
羅馬尼亞首都布加勒斯特的兩位員工透露,他們一天工作9小時,每班解析多達1000條音頻片段。
波士頓的一名員工則表示,他為特定的話語,如Taylor Swift,挖掘了累積的語音數據,并對其進行了注釋,以表明這個搜索是指那位歌手。
私人聲音片段也會被抓取
智能音箱需要時刻開啟麥克風,以監聽用戶是否說出了喚醒詞、是否在向自己下命令。亞馬遜語音助手Alexa的軟件就被設計為持續記錄音頻片段,聆聽喚醒詞。默認的喚醒詞即為“Alexa”。
目前的工作流程下,私人的聲音片段也會被設備抓取。
有時候,工作人員會聽到用戶私人的聲音片段,如一個女人洗澡時嚴重走調的歌聲,或者一個孩子尖叫著尋求幫助。工作人員利用內部聊天室共享文件,解析含糊的單詞,或者是分享搞笑的錄音。
有時員工還會聽到不安甚至有可能是犯罪的錄音。兩名員工稱,他們聽到過他們認為是性侵案的聲音,當這種事情發生時,他們會在內部聊天室說出來解壓。
亞馬遜對此表示,員工聽到令人痛苦的事情時,他們有標準流程處理。但是這兩位羅馬尼亞員工表示,他們要求對這類案件進行處理時,被公司告知干預此類事件不是亞馬遜的工作。
“我們認真對待用戶的個人信息和隱私安全。”亞馬遜發言人在一份電子郵件聲明中稱,“我們只會注釋極小一部分的Alexa錄音樣本,為了改善用戶體驗。如幫助我們訓練語音識別和自然語言理解系統的信息,這樣Alexa可以更好地理解用戶要求,并保證對每個人都能提供好的服務。”
“我們有嚴格的技術和操作保障,對濫用我們系統的行為采取零容忍政策。員工在工作流程中無法直接訪問能辨別用戶和賬號的信息。我們使用多重驗證來限制訪問,對服務加密,審計我們的工作環境,以對所有信息高度保密。”
語焉不詳的隱私政策
亞馬遜在其宣傳和隱私政策的材料中,沒有明確表明Alexa獲取的一些對話錄音是人工來聽,只是在常見問題解答列表中提到了一句“我們使用您對Alexa的命令來訓練我們的語音識別和自然語言理解系統”。
Alexa的隱私設置中,公司給用戶提供了禁用錄音開發新功能的選項。彭博社看到的截圖顯示,發送給工作人員的Alexa錄音沒有提供用戶的全名和地址,但與用戶的賬戶號、名稱和設備序列號相關聯。
依賴人類員工填補算法空白的,還有谷歌、Siri
亞馬遜圓柱形的智能音箱Echo于2014年上市后,很快就因其可以在家中使用智能語音軟件快速流行開來。不久之后,谷歌母公司Alphabet推出了自己的版本Google Home,隨后是蘋果公司的HomePod,在中國也有很多品牌的智能音箱產品。
據研究機構Canalys的報告,2018年,全球消費者購買了7800萬臺智能音箱,其中數百萬臺通過語音軟件與智能手機上的智能助手進行交互。
大多數現代語音識別系統依賴于模仿人腦的神經網絡,軟件會通過海量數據進行機器學習,為Echo等其他智能音箱的算法提供可能性的模型。如果用戶問Alexa附近有沒有名叫“希臘某某”的地方,算法會自動知道用戶在尋找希臘餐廳,而不是教堂或社區中心。
但Alexa也經常犯錯,尤其是俚語、口語、方言和非英語的語言。因此亞馬遜需要雇傭人類員工,幫助填補算法的空白。
除了亞馬遜之外,實際上,其他品牌的語音助手也都是在人類的幫助下訓練出來的。
蘋果的Siri也有人類員工的幫助,他們負責評估語音助手對請求的解釋是否與用戶說的相符。根據蘋果安全白皮書,員工檢查的Siri錄音是沒有個人身份信息的,錄音會與一個隨機標識符關聯,存儲六個月,之后這些數據就會被移除隨機標識符,但它們也有可能存儲更長時間以改善Siri的語音識別。
在谷歌,一些人類員工也可以獲取谷歌助手的音頻片段幫助訓練和改善產品,這些音頻也沒有個人身份信息,并且經過音頻失真處理。





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司