史丹福大學科學家麥克‧科辛斯基(Michal Kosinski)建立了一套機器學習系統,宣稱可以用臉部辨識技術看出一個人的政治傾向。早在2017年,科辛斯基就曾宣稱能用臉部辨識技術看出「性取向」,他強調研究刻意避免落入「現代顱相學」的陷阱,並得出一個可怕的結論:我們的外表可能透漏出更多的個人資訊。
這項研究之所以受到批評,不是因為它的方法,而是因為它似乎能透過這種方式檢測出非物理性的概念。科辛斯基解釋,他所做的研究專門在挑戰這些假設,而不是想發明「人工智慧同志雷達」之類的東西,他認為有必要發表論文警告所有人,因為這些東西很可能被應用在非學術用途上:
「我們對結果感到很不安,花了很長時間思考是否要公開,因為我們不想讓這件事情成真。何時向誰表明性取向的控制權不僅對一個人至關重要,而且對他的安危也很重要。我們認為迫切需要讓決策者和LGBTQ群體意識到這種風險,我們並不是在創造侵犯隱私的工具,而是提醒人們這種基本而被廣泛使用的方法很可能構成嚴重的隱私威脅。」
儘管在大多數國家(至少在目前)政治立場不像性取向那麼敏感或個人化,但它仍屬於隱私範圍。幾乎每週都能看到一些政治或宗教「異議者」被逮捕或遭到謀殺的報導,未來專制政權或許會用「演算法認為你是極端分子」為理由清算政敵和反對者,而不再需要實質證據。此外,與許多其他生物辨識系統不同的是,臉部辨識技術可以在不經對方同意或知情的情況下被使用。
演算法本身並不是先進科技,科辛斯基的論文描述了一個相當普通的過程,也就是對機器學習系統輸入100多萬張人臉照片,這些照片分別來自美國、加拿大和英國的交友網站,以及美國的Facebook用戶。
這套演算法基於開源的臉部辨識軟體,在對臉部進行基本處理後(除去背景干擾等因素),臉部被減少到代表各種特徵的2048分,跟其他臉部辨識演算法一樣,這些特徵不一定是直觀的「眉毛顏色」和「鼻形」,而是更為電腦計算的層面。演算法先獲取人們的政治傾向資料,並根據資料認真學習保守派與自由派的臉部資料差異。事實證明,它們很可能有所區別。
當然,這並非「保守派的眉毛更濃密」或「自由派更常皺眉」那樣簡單,也不取決於人口統計資料,因為人口統計資料會讓事情變得太容易。畢竟,如果把政治傾向跟年齡和膚色相關,那就是一套簡單的預測演算法。但是,儘管科辛斯基使用的軟體機制相當標準,他還是小心翼翼地進行修正,以確保這項研究(就像上次一樣)不會被視為偽科學。
解決這些疑慮最簡單的方法是讓系統猜測年齡、性別和種族相同的人的政治傾向。測試中他讓參與者觀看兩張臉(每組各有一張保守派與自由派),然後猜出照片裡的人的政治傾向,猜對的機率顯然是50%。人類在這方面做得沒有很好,準確率僅略高於機率,約為55%。
演算法在猜測兩個相似個體的政治傾向時準確率達71%,而如果顯示兩個不同年齡、種族或性別的個體,準確率可達73%(但依然是猜測保守派或自由派的二選一)。以現代的人工智慧來說,四次猜中三次沒有很厲害,但由於人類的準確率跟擲硬幣差不多,確實有些值得思考的東西。
政治傾向很可能寫在臉上,這是一個恐怖的結論,因為儘管政治傾向並不是最隱私的資訊,但它通常被認為是無形的。人們選擇以帽子、胸針或衣服來表達個人的政治立場,而且以為自己的外表是無黨無派的。
那可以從哪些臉部特徵辨識呢?不幸的是,這套系統無法給出答案。在一項輔助研究中,科辛斯基分離了幾十種臉部特徵(臉部毛髮、目光和各種情緒),測試這些特徵是否能預測政治傾向,但沒有一項能讓準確率提高。
科辛斯基在論文的作者筆記中寫道:「頭部朝向和情緒表達比較明顯:自由派傾向於更直接面對鏡頭,也更有可能表現出驚訝,而不太會表達厭惡。」但他們增加的資料都沒有提升超過10%準確率,他寫道:「這表明臉部辨識演算法發現了許多其他透漏政治傾向的特徵。」
跟性取向研究一樣,這項研究的重點並不是打造一個完美的檢測器,而是警告和提醒人們思考的相關風險。舉例來說,如果一個專制政體想鎮壓非異性戀或某個政治傾向的群體,這賦予他們「客觀」的方式達成目的。更重要的是,這不用太多力氣、不需要接觸目標,也不必挖掘人們在社交媒體的過去或分析購物習慣就能做到。只需要幾個科學家用開源軟體和中等規模的人臉數據庫(對政府來說這是微不足道的小事,而且他們不太可能沒有建立這類數據庫),就能在全世界任何地方因任何目的執行,這令人不寒而慄。
科辛斯基說:「研究目的是為了針對廣泛使用的臉部辨識演算法提出警告。值得擔憂的是,這些人工智慧臉部辨識專家現在正被用來判斷人們的內在特徵——學者、決策者和公民都應該清楚這點。」
研究出處:Nature