在當(dāng)今數(shù)字化時(shí)代,驗(yàn)證碼(CAPTCHA)已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠郑貏e是在登錄各類網(wǎng)站時(shí)。這些驗(yàn)證碼通常以扭曲的數(shù)字和字母形式出現(xiàn),要求我們輸入以驗(yàn)證人類身份,有效防止了機(jī)器人攻擊和垃圾郵件的泛濫。CAPTCHA,即全自動(dòng)區(qū)分計(jì)算機(jī)和人類的圖靈測試,已經(jīng)成為網(wǎng)站安全的重要防線。
然而,CAPTCHA的用途并不僅限于此。早在2007年,路易斯·馮·安提出了一個(gè)創(chuàng)新的想法:將CAPTCHA應(yīng)用于書籍和報(bào)紙掃描文本的數(shù)字化。這一想法催生了reCAPTCHA的誕生,它不僅能夠有效區(qū)分人機(jī),還能幫助計(jì)算機(jī)難以識(shí)別的文本實(shí)現(xiàn)數(shù)字化。例如,《紐約時(shí)報(bào)》利用reCAPTCHA成功數(shù)字化了其自1851年以來1300萬篇文章的檔案,展現(xiàn)了其巨大的潛力。
2009年,谷歌收購了reCAPTCHA,并將其廣泛應(yīng)用于谷歌圖書的數(shù)字化以及改進(jìn)谷歌街景服務(wù)。通過處理街景標(biāo)志和門牌號(hào)照片,reCAPTCHA為谷歌街景服務(wù)的提升做出了重要貢獻(xiàn)。然而,隨著時(shí)間的推移,到了2025年,reCAPTCHA系統(tǒng)已經(jīng)逐漸被機(jī)器人攻破,其在防止機(jī)器人攻擊方面的效果大打折扣。
盡管如此,谷歌仍然繼續(xù)提供reCAPTCHA服務(wù)。然而,據(jù)相關(guān)報(bào)道,reCAPTCHA已經(jīng)演變?yōu)橐环N強(qiáng)大的追蹤工具,用于收集用戶數(shù)據(jù)并為谷歌創(chuàng)造巨額收入。前加州大學(xué)歐文分校計(jì)算機(jī)安全研究員安德魯·西爾斯博士指出,reCAPTCHA會(huì)對(duì)用戶的瀏覽器進(jìn)行逐像素指紋識(shí)別,實(shí)時(shí)記錄用戶在互聯(lián)網(wǎng)上的行為。實(shí)質(zhì)上,它可以獲取用戶在該網(wǎng)頁上的任何交互數(shù)據(jù),包括cookie、瀏覽歷史和瀏覽器環(huán)境等。
西爾斯博士的研究論文《迷惘與困惑:一項(xiàng)針對(duì)reCAPTCHA v2的大規(guī)模現(xiàn)實(shí)世界用戶研究》詳細(xì)揭示了reCAPTCHA的追蹤和數(shù)據(jù)收集行為。研究發(fā)現(xiàn),與基于圖像的驗(yàn)證挑戰(zhàn)相比,復(fù)選框驗(yàn)證所需的時(shí)間要短得多,而基于圖像的驗(yàn)證則浪費(fèi)了大量的人力時(shí)間。據(jù)估計(jì),reCAPTCHA已經(jīng)浪費(fèi)了社會(huì)約8.19億小時(shí)的人力時(shí)間,按工資計(jì)算價(jià)值高達(dá)61億美元(當(dāng)前約444.94億元人民幣)。同時(shí),通過其追蹤能力和數(shù)據(jù)收集,谷歌創(chuàng)造了巨額利潤,僅追蹤cookie的價(jià)值就估計(jì)高達(dá)8880億美元(當(dāng)前約6.48萬億元人民幣)。
遺憾的是,對(duì)于用戶而言,目前尚無有效的方法可以完全避開reCAPTCHA系統(tǒng)。這一發(fā)現(xiàn)引發(fā)了對(duì)于個(gè)人隱私和數(shù)據(jù)安全的廣泛擔(dān)憂,也促使人們開始重新審視驗(yàn)證碼在現(xiàn)代互聯(lián)網(wǎng)環(huán)境中的作用和局限性。