首頁 > 娛樂

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

由 新智元 發表于 娛樂2023-01-09

簡介根據爆料,這些圖片全部由iRobot開發的Roomba J7系列掃地機器人拍攝,之後則會被髮給Scale AI進行處理,也就是那個大名鼎鼎的人工智慧資料標註公司

怎麼識別金毛

編輯:好睏 David

【新智元導讀】

在家裡美美上個廁所,結果時隔兩年,偷拍照竟然流到了網上……這麼離譜的事是怎麼發生的?

你絕對想不到,自己在家上廁所的「實時動態」,不僅被拿去給AI做了訓練資料,而且還被髮到了網上!

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

最近,《麻省理工科技評論》在一篇萬字長文調查中,就曝光了這樣觸目驚心的一幕——

圖中,一位女士穿著淡紫色T恤的年輕女子正坐在自家的馬桶上,而她的短褲已經脫到了大腿中部。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

萌萌的TA竟然是個偷窺狂?

時間回到2020年秋天,一系列從低角度拍攝的照片突然出現在了網路論壇上。

其內容全是家庭生活中場景——傢俱的陳列,電視播放的節目內容,甚至連家庭成員的臉都看得一清二楚。

比如在下面這張圖中,一個八九歲的男孩,正趴在走廊的地板上,並很高興地注視著面前的這個物體。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

根據爆料,這些圖片全部由iRobot開發的Roomba J7系列掃地機器人拍攝,之後則會被髮給Scale AI進行處理,也就是那個大名鼎鼎的人工智慧資料標註公司。

Scale AI成立於2016年,在其專有的眾包平臺Remotasks上,公司會以十分低廉廉的費用與較不富裕國家的遠端工人簽訂合同,並由此建立了一個非常成功商業模式。

而這家公司的創始人Alexandr Wang,曾經從MIT輟學並白手起家,並在今年也就是25歲時,成為了全球最年輕億萬富翁。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

值得注意的是,人臉資訊在原圖中其實是清晰可見的。

我們看到的灰框框,是《麻省理工科技評論》為了保護隱私特地手動打上去的。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

那麼問題來了,這些資訊理論上應該是在嚴格的儲存和訪問控制之下的。然而,實際情況卻是,它們被負責標註的工人分享到了網上。

這些由機器人拍攝的畫面展示了世界各地的家庭房間,有些是人住的,有些是狗住的。傢俱、裝飾品和位於牆壁和天花板上的物體被矩形框勾勒出來,並附有「電視」、「植物或花」和「天花板燈」等標註。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

對此,世界上最大的掃地機器人供應商iRobot證實,這些影象是由自家的Roombas在2020年拍攝的。

公司在一份宣告中表示,所有這些影象都來自 「經過硬體和軟體修改的特殊開發機器人,這些機器人現在和將來都不會出現在iRobot的消費者產品上」。

此外,iRobot還表示,他們已經與Scale AI分享了超過200萬張圖片,並與其他資料標註平臺分享了數量不詳的圖片。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

機器學習革命帶來了什麼?

今天,越來越多的掃地機器人已經轉向計算機視覺,透過訓練演算法從影象和影片中提取資訊來接近人類的視覺,甚至配備鐳射雷達,該技術被廣泛認為是當今市場上最精確但最昂貴的導航技術。

計算機視覺依賴於高畫質攝像頭,越來越多的公司在其機器人真空吸塵器中安裝了前置攝像頭,用於導航和物體識別,以及越來越多的家庭監控。

為了使掃地機器人中的計算機視覺真正按預期工作,需要在高質量、多樣化的資料集上對其進行訓練,以反映它們可能看到的巨大範圍。與自動駕駛汽車相比,掃地機器人面臨的家庭環境更難以標準化,訓練難度可想而知。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

這時候,訓練資料往往需要是更加個性化、私密化的,而且需要以大量的使用者基數為支撐,收集這樣的資料,需要使用者的同意。

以本文iRobot為例,其95%以上的影象資料集來自真實的家庭,這些家庭成員要麼是iRobot的員工,要麼是由第三方資料供應商招募的志願者。

根據iRobot的一份宣告,使用開發裝置的人同意讓iRobot在裝置執行時收集資料,包括影片流,並可由此換取「獎勵」。

但公司拒絕說明這些激勵措施是什麼,只說它們「根據資料收集的長度和複雜性」而有所不同。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

《麻省理工科技評論》採訪的大多數掃地機器人公司明確表示,他們不使用客戶資料來訓練他們的機器學習演算法。

然而,在東北大學研究物聯網裝置安全漏洞的博士生Dennis Giese在對這些機器人進行逆向工程之後發現,它們的管理軟體中有一個名為「AI伺服器」的資料夾,並有影象上傳功能。

這麼看來,這些公司所謂的「攝像頭資料永遠不會被髮送到雲端」,其實很難成立。

但即便如此,如果這些公司自己不說,或者沒有遭到駭客攻擊的話,沒有人能夠驗證他們以「訓練模型」為由從客戶那裡具體收集了什麼。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

我們的資料是怎麼洩露的?

眾所周知,機器學習演算法的訓練,需要投餵大量的資料。過程中所依賴的標註資料,則需要消耗非常多的人力資源才能完成。

作為一個新興但不斷增長的行業,資料標註預計到2030年將達到133億美元的市場價值。

目前來說,負責對資料進行標註的,通常是發展中國家的低薪合同工。

他們透過轉錄低質量的音訊改善語音識別軟體,並透過標記照片和影片幫助掃地機器人識別環境中的物體。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

2020年,Scale AI釋出了一項全新的任務——Project IO。

其特點是,視角從地面以大約45度向上,影象內容為世界各地的牆壁、天花板和地板,以及上面的各種東西,當然也包括人。

通常來說,這些負責標註的工人會在Facebook、Discord和其他社交平臺上建群,然後在其中討論和工作有關的各種問題,比如分享處理延遲付款的建議,談論報酬最好的任務,或請其他人幫忙等等。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

對此,iRobot表示,在社交媒體群組中分享圖片違反了Scale與它的協議;Scale AI也表示,合同工分享這些圖片違反了他們自己的協議。

但現實情況是,這種行為在眾包平臺上是幾乎不可能被監管到的。

驚喜:你可能已經同意了!

掃地機器人制造商自己也認識到裝置上的攝像頭帶來的更大的隱私風險。

對於攝像頭帶來的隱私風險,iRobot表示,公司已經對此採取很多保護措施,包括使用加密,定期修補安全漏洞,限制和監控內部員工對資訊的訪問,並向客戶提供有關其收集的資料的詳細資訊。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

但是,公司談論隱私的方式和消費者理解隱私的方式之間存在很大差距。

Mozilla的隱私安全專案的研究員Jen Caltrider表示,在企業看來,資料安全指的是產品的物理和網路安全,或者它對駭客或入侵的脆弱性。而資料隱私是關於透明度:知道並能夠控制公司擁有的資料,如何使用,為什麼分享,是否保留、以及保留多久等等。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

他們有時會使用微妙的措辭差異,比如使用「共享」資料,而不是出售資料,這使得如何處理隱私對於非專業人士來說特別難以解析。

只不過,當一家公司說它永遠不會出售你的資料時,它很可能會使用或與他人分享這些資料。

根據公司措辭含糊的隱私政策,這些廣泛的資料收集定義往往是合乎規定的,幾乎所有的隱私政策都包含一些條款,允許將資料用於「改善產品和服務」,用語非常廣泛,基本上拿來幹什麼都行。

事實上,《麻省理工科技評論》審查了12個掃地機器人的隱私政策,所有這些政策,包括iRobot的,都包含類似的表述。

此外,大部分公司也都沒有迴應關於所謂「產品改進」是否包括機器學習演算法的問題。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

在隱私條款中列明的「不公平」或「欺騙性」的做法,基本上都是狹義的,也就是說,除非隱私政策明確規定 「嘿,我們不會讓承包商看你的資料」,然後還是分享了資料,否則公司方面在法律上就是沒問題的。

掃地機器人,只是個開始

對資料的渴求在未來幾年只會增加。掃地機器人只是在我們生活中大量出現的聯網裝置中的一小部分,而掃地機器人領域的大公司,包括iRobot、三星、Roborock和戴森等,都表示出了比「掃地」更宏大的野心。

機器人技術,包括家用機器人技術,長期以來一直是真正的香餑餑。而且,真正的重點不在於掃地,而在於機器人。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

2018年,時任iRobot技術高階副總裁的Mario Munich就在一次演講中解釋過這個問題。

在關於該公司第一臺計算機視覺掃地機器人Roomba 980的演示中,他展示了來自該裝置有利位置的影象:包括一個有桌子、椅子和凳子的廚房,旁邊是機器人演算法對它們的標記和感知。

實際上的挑戰不在於吸塵,而在於機器人,他解釋說。

如果我們能夠更充分了解環境,就能夠改變機器人的操作。

萌萌的掃地機器人,竟是隱私洩露的罪魁禍首?

製造掃地機器人的公司已經在投資其他功能和裝置,使我們更接近機器人的未來。

可想而知的是,這樣的業務多樣化大潮,帶來的是對資料標註在深度和廣度上巨大需求的雙重增長,一旦這種需求沒有有效監督,或者超出了監管的能力,對隱私的侵犯就變得幾乎不可避免。

而很多時候,這種侵犯是以一種便捷、易用、智慧的方式進行的。

參考資料:

https://www。technologyreview。com/2022/12/19/1065306/roomba-irobot-robot-vacuums-artificial-intelligence-training-data-privacy/

Tags:機器人iRobot掃地資料隱私