1.
當(dāng)?shù)貢r(shí)間 3 月15日下午 1 點(diǎn) 40 分左右,新西蘭基督城發(fā)生恐怖襲擊。已確認(rèn)有 50 人遇難,另有 50 人嚴(yán)重受傷。遇難者不乏兒童,婦女和老人。
相信這個(gè)新聞,大多數(shù)人都已經(jīng)知曉了。在這里再簡(jiǎn)述一下大致經(jīng)過(guò)。3 月 15 日下午,新西蘭的兩座著名清真寺,先后遭到槍手襲擊。槍手對(duì)手無(wú)寸鐵的民眾進(jìn)行掃射,包括對(duì)街道的來(lái)往車輛進(jìn)行掃射。隨后,基督城醫(yī)院也發(fā)生了槍擊。同時(shí),警察在嫌犯的兩輛汽車上發(fā)現(xiàn)了大量汽車炸彈,所幸沒(méi)有引爆。奧克蘭火車站和商場(chǎng)附近也發(fā)現(xiàn)了疑似爆炸包裹,但沒(méi)有相關(guān)傷亡報(bào)告。至今,警察已經(jīng)抓捕了 4 名嫌犯。
或許是新西蘭這個(gè)國(guó)家本身離國(guó)際政治的漩渦較遠(yuǎn);或許是中國(guó)民眾對(duì)新西蘭的熟悉程度遠(yuǎn)沒(méi)有美國(guó)強(qiáng)烈。不管怎樣,我發(fā)現(xiàn)這個(gè)事件在中文媒體上,并沒(méi)有引發(fā)太大的討論。但是,目測(cè),站在國(guó)際歷史的角度,這個(gè)事件將產(chǎn)生深遠(yuǎn)影響。事件本身已經(jīng)再次帶動(dòng)很多國(guó)家對(duì)“白人優(yōu)越主義”這一極端思想的討論和控制??忠u后,新西蘭的槍支賣到脫銷,但與此同時(shí),就在當(dāng)?shù)貢r(shí)間 3 月 21 日,新西蘭政府改寫了法律,實(shí)施了“禁槍令”。這些事情不僅對(duì)新西蘭產(chǎn)生了巨大影響,更進(jìn)一步將對(duì)世界范圍對(duì)槍支控制問(wèn)題的態(tài)度產(chǎn)生影響。另外,由于一名嫌犯已確認(rèn)是澳洲國(guó)籍,這也使得新西蘭和澳洲這兩個(gè)看似不太介入國(guó)際事務(wù),在一般民眾看來(lái)是 super safe 的國(guó)家,產(chǎn)生了微妙的變化。
但是,作為一個(gè)技術(shù)向的專欄,這些政治,經(jīng)濟(jì),世界格局變化相關(guān)的問(wèn)題,不是我想討論的重點(diǎn)。整個(gè)事件有一個(gè)更加與眾不同的地方,和技術(shù)息息相關(guān),甚至,在我看來(lái),有可能引發(fā)技術(shù)世界的震蕩。
2.
在這次恐襲事件中,一名嫌犯,頭戴一個(gè)配備了 go pro 的頭盔,在 Facebook 上直播了槍擊過(guò)程,畫面極其血腥殘酷。待 Facebook 發(fā)現(xiàn)事態(tài)異常,做出反應(yīng),封禁了兇手的賬號(hào),整個(gè)視頻已經(jīng)在網(wǎng)上直播了 17 分鐘。
對(duì)于整個(gè)硅谷,這一切還只是一個(gè)開(kāi)始。
很多同學(xué)可能并不了解,即使是 Facebook、Google 這些國(guó)外平臺(tái),也是擁有著一個(gè)龐大(或者說(shuō)是相對(duì)龐大)的審核隊(duì)伍的。這些審核人員,每天處理的,就是對(duì)違反平臺(tái)規(guī)范的內(nèi)容進(jìn)行“刪帖”處理。通常,這些規(guī)范包括:色情內(nèi)容;盜版內(nèi)容;宣傳仇恨或者極端思想的內(nèi)容;極度反人性的內(nèi)容,等等等等。
我在這里列舉的這些內(nèi)容規(guī)范,看似很容易。實(shí)際上,每一個(gè)標(biāo)準(zhǔn)都蘊(yùn)含著巨大的灰色空間。比如:什么是色情內(nèi)容?露點(diǎn)就是色情內(nèi)容?那斷臂的維納斯怎么算?而另一方面,很多不露點(diǎn)的視頻,反而更具色情意味,對(duì)青少年擁有更強(qiáng)大的誘惑力和破壞力。這個(gè)問(wèn)題本身就是一個(gè)很深刻的問(wèn)題,甚至可以專門做成學(xué)術(shù)研究了。但在實(shí)踐中,色情和非色情的分界線到底在哪兒?在這些審核人員的主觀判斷中。
其實(shí),在 Google 離開(kāi)中國(guó)之前,由于中國(guó)的法律原因,Google 中國(guó)就擁有一支龐大的“鑒黃師”團(tuán)隊(duì)。我曾經(jīng)認(rèn)識(shí)一個(gè)同學(xué),本科時(shí)期在這個(gè)團(tuán)隊(duì)里實(shí)習(xí)過(guò)。嗯,是的,這個(gè)團(tuán)隊(duì)不做技術(shù)工作,天天觀摩不良信息內(nèi)容。有興趣的同學(xué),可以在網(wǎng)上搜索“鑒黃師”這個(gè)職位,這個(gè)職位現(xiàn)在依然存在。甚至,很多這些大企業(yè)大平臺(tái)的工作人員,了解到了其中巨大的需求,辭職創(chuàng)業(yè),提供這種“審查”服務(wù)。畢竟,這種“審查”工作所需要的人員素質(zhì),和這些IT巨頭整體需要的人員素質(zhì),擁有著巨大的差異。外包,或許是最劃算的。
說(shuō)回新西蘭恐襲,在兇手在 Facebook 上直播了 17 分鐘之后。這段視頻在互聯(lián)網(wǎng)上真真正正地火了。從某一個(gè)角度看,這近乎是人類歷史上第一次從兇手的角度進(jìn)行相對(duì)完整的殺人視頻直播。在 Facebook 這一個(gè)平臺(tái)上,這段視頻的上傳量,在 24 小時(shí)內(nèi),就達(dá)到了 150 萬(wàn)次。注意,是上傳量,不是播放量!同時(shí),被 Facebook 攔截的這段視頻的上傳數(shù),達(dá) 120 萬(wàn)次。這還僅僅是 Facebook 這一個(gè)平臺(tái)。
而實(shí)際上,這段視頻傳播最廣的平臺(tái),是宇宙第一視頻網(wǎng)站—— Youtube。但是,Youtube 官方至今都拒絕透露,他們究竟刪除了多少相關(guān)視頻。可以肯定的是,這段視頻上傳的頻率,是以毫秒為單位計(jì)算的。
3.
很多同學(xué)一定會(huì)想,難道不能使用人工智能技術(shù)自動(dòng)鑒別這段視頻嗎?
事實(shí)上,如果大家上傳的視頻都是原始版視頻,使用自動(dòng)化技術(shù)鑒別它是極其容易的,根本不需要?jiǎng)佑萌斯ぶ悄?。?duì)視頻文件計(jì)算一個(gè)哈希值,直接匹配就好。但問(wèn)題的關(guān)鍵是,up 主們知道這段原始視頻一定被禁止上傳,所以想出各種各樣的方法“改編”視頻。
這其中的方法包括:或者改變視頻的分辨率;或者對(duì)視頻進(jìn)行剪輯,截取部分內(nèi)容;或者為視頻添加水印;或者在其中插放其他過(guò)場(chǎng)動(dòng)面或者解說(shuō)?!叭说馈币恍┑?up 主,會(huì)給視頻中的部分內(nèi)容打上馬賽克 —— 但是,這無(wú)法改變這段視頻宣揚(yáng)暴力的實(shí)質(zhì),反而為視頻的自動(dòng)化審查添加了巨大的麻煩。甚至,有的 up 主,動(dòng)用更加現(xiàn)代化的工具,將視頻中的人物頭像,都修改成了動(dòng)物頭像。整個(gè)視頻看起來(lái)就是在打電子游戲。呵呵,是的,我們的人臉識(shí)別技術(shù)可以輕易做到這一點(diǎn),但是,鑒別技術(shù)卻無(wú)法識(shí)別,這到底是一段“宣揚(yáng)暴力的真實(shí)殺人直播”,還是一個(gè) 16 歲小孩臥室中的電子游戲直播。
由于這段視頻上傳量太大,Youtube 團(tuán)隊(duì)還是采取了史無(wú)前例的措施。過(guò)早的啟動(dòng)了自動(dòng)化人工智能工具,來(lái)自動(dòng)識(shí)別這段視頻。如果有機(jī)器學(xué)習(xí)背景的同學(xué)都明白,使用機(jī)器學(xué)習(xí)解決這個(gè)問(wèn)題,是一個(gè)典型的分類任務(wù),更進(jìn)一步,是一個(gè)二分類任務(wù)。機(jī)器只需要識(shí)別每段視頻,是或者不是新西蘭槍擊案直播,就好了。但是,這個(gè)識(shí)別過(guò)程并不容易。一方面,視頻數(shù)據(jù)本身,相比圖像數(shù)據(jù),數(shù)據(jù)量高出了太多,整體數(shù)據(jù)處理規(guī)模上升了好幾個(gè)臺(tái)階;另一方面,要想訓(xùn)練出一個(gè)性能優(yōu)良、識(shí)別率高的模型,不是寫一兩行代碼就能搞定的事情,需要算法工程師們夜以繼日地調(diào)參和測(cè)試。這絕不是一個(gè)在 24 小時(shí)內(nèi)可以搞定的任務(wù)。但 Youtube 團(tuán)隊(duì)在 24 小時(shí)內(nèi),決定使用機(jī)器接手。
這么短的時(shí)間,上線的“智能”,一定有巨大的錯(cuò)誤率。這個(gè)錯(cuò)誤,或者是漏判,即本來(lái)是槍擊視頻,但是機(jī)器沒(méi)有識(shí)別出來(lái);或者是誤判,即本來(lái)不是槍擊視頻,機(jī)器卻誤以為是槍擊視頻。了解機(jī)器學(xué)習(xí)的同學(xué)應(yīng)該了解,這兩類錯(cuò)誤是互相牽制,此消彼長(zhǎng)的。通過(guò)調(diào)節(jié)參數(shù),減少了一方錯(cuò)誤,就會(huì)增加另一方錯(cuò)誤。在這個(gè)事件中,明智的選擇,顯然是要盡量降低漏判的幾率,所以,得到的結(jié)果,就是產(chǎn)生了大量的誤判。在一段時(shí)間中,Youtube 很多無(wú)辜的 up 主受到了牽連,無(wú)法上傳正常的視頻。
4.
這樣的危機(jī),在 Youtube 內(nèi)部,也不是第一次發(fā)生了。近乎就在幾個(gè)月前,就有很多家長(zhǎng)投訴 Youtube,有 up 主上傳小豬佩奇的動(dòng)畫片,但看到一半的時(shí)候,會(huì)突然播放恐怖的,慫恿兒童自殘甚至自殺的片段。這些片段可能只會(huì)持續(xù)幾秒鐘?,F(xiàn)代的人工智能技術(shù)還完全無(wú)法檢測(cè)到一段正常視頻中間,是否夾雜了這樣的片段。要想識(shí)別出含有這種片段的視頻,近乎只能靠舉報(bào),之后刪除??墒?,這樣的事后彌補(bǔ),傷害顯然已經(jīng)造成了。更可悲的是,即使我們知道了有這樣的行為,我們依然無(wú)法自動(dòng)化的事前預(yù)防。因?yàn)檫@種“極端思想的宣揚(yáng)”,可以以任何一種畫面形式表達(dá)出來(lái)。相較而言,大吹大擂的人工智能,真的是人工智障。
要想事前預(yù)防,近乎只能進(jìn)行人工事前審查。但對(duì)于 Youtube 這種規(guī)模的視頻網(wǎng)站而言,這幾乎是不可能的。2017 年的數(shù)據(jù),Youtube 每分鐘就有 400 小時(shí)的視頻上傳,這個(gè)數(shù)據(jù)還在逐年,甚至是逐日攀升。
人工智能完全無(wú)法應(yīng)付這項(xiàng)工作,至少現(xiàn)在不能,在短時(shí)間內(nèi),也很難完成。這是一個(gè)明顯的“強(qiáng)人工智能”才能解決的例子。雖然機(jī)器只需要回答 yes 或 no,但是為了能夠理想地回答好這個(gè)問(wèn)題,機(jī)器需要擁有和人類一樣的經(jīng)驗(yàn)力、推導(dǎo)力、主觀判斷力、甚至是直覺(jué)。事實(shí)上,不要說(shuō)視頻了,即使是圖片,現(xiàn)在我們還只是在為機(jī)器可以更好地識(shí)別圖片中到底是什么動(dòng)物,什么場(chǎng)景而慶祝。但這些任務(wù),幼兒園的小朋友都能分分鐘完勝那些上億美元投資的項(xiàng)目。
在新西蘭槍擊案發(fā)生三天之后,新西蘭總理更是直接把矛頭對(duì)準(zhǔn)了 Facebook,為什么槍手直播了長(zhǎng)達(dá) 17 分鐘之久之后,F(xiàn)acebook 才做出反應(yīng)?
Facebook 為此已經(jīng)忙作一團(tuán)。甚至,已經(jīng)開(kāi)始探討是否要停止“直播”業(yè)務(wù)。畢竟,開(kāi)展直播這樣一個(gè)服務(wù)容易。但要能即時(shí),準(zhǔn)確地辨別直播內(nèi)容是否合法,是否在宣揚(yáng)極端思想,這已經(jīng)不是技術(shù)水平上難了幾個(gè)數(shù)量級(jí)的問(wèn)題了。而是,人類現(xiàn)代的科技,根本做不到。
5.
讓整件事情朝著更壞的方向發(fā)展的,則是所謂的推薦系統(tǒng)。事件發(fā)生初始,這段直播視頻只是產(chǎn)生了一定的熱度。畢竟,這是一個(gè)國(guó)際關(guān)注的事件,與此同時(shí),人總會(huì)有一定的獵奇心理。但是,推薦系統(tǒng)則直接起到了推波助瀾的作用。
如果你去學(xué)習(xí)專業(yè)的推薦系統(tǒng)知識(shí),你會(huì)遭遇大量宛如天書一般的公式。但是,如果用人話把推薦系統(tǒng)的原理說(shuō)出來(lái),那么非常簡(jiǎn)單 —— 別人喜歡的東西,特別是你的朋友,你的親戚,或者和你相似的人喜歡的東西,那么八成也就是你喜歡的東西,推薦系統(tǒng)就推薦給你。在整個(gè)事件中,推薦系統(tǒng)收集到了越來(lái)越多的人對(duì)于這件事情關(guān)注的熱度,之后推波助瀾地又將這些視頻推薦給了更多的人。推薦系統(tǒng)忠實(shí)地履行著自己的算法。但是,很多人開(kāi)始指責(zé)系統(tǒng)為什么會(huì)被設(shè)計(jì)成推薦這樣的視頻?算法工程師們莫名奇妙地背了一口大鍋。
可是,推薦系統(tǒng)在運(yùn)行過(guò)程中有一個(gè)基本假設(shè),就是內(nèi)容本身,應(yīng)該是安全的。這就好比在我們討論吃什么的時(shí)候,不會(huì)思考我們所選擇的食材,可能有一部分有毒一樣。然而,在互聯(lián)網(wǎng)的世界中,這個(gè)假設(shè)其實(shí)根本就不成立。之前文章已經(jīng)分析了,實(shí)時(shí)準(zhǔn)確地辨別視頻內(nèi)容是否安全,還不是人類在當(dāng)下這個(gè)時(shí)代所掌握的科技。
如今,很多媒體在報(bào)道新西蘭事件中,需要小心地使用關(guān)鍵詞,才能不被推薦系統(tǒng)帶歪,把自己的新聞和有可能再次卷土重來(lái),或者本身就沒(méi)處理干凈的槍擊案直播視頻聯(lián)系起來(lái)。雖然有些夸張,但我已經(jīng)隱隱看到了人類無(wú)法控制機(jī)器,畏懼機(jī)器,小心翼翼地在機(jī)器指定的規(guī)則下茍活的影子了。
從另外一個(gè)角度看,整個(gè)社交網(wǎng)絡(luò),突然變得和“核彈”一樣。人類制造了它,卻無(wú)法駕馭它??植乐髁x正在以一種新的方式,將社交網(wǎng)絡(luò)武器化。這種武器的傷害,直指人類的精神世界。但是,貌似現(xiàn)如今我們還不能控制這種武器帶來(lái)的傷害;而關(guān)閉所有的社交網(wǎng)絡(luò),顯然也不可行。社交網(wǎng)絡(luò)好像另一個(gè)“潘多拉的魔盒”,已經(jīng)被打開(kāi)了,卻再也關(guān)不上。
6.
實(shí)際上,在技術(shù)的世界中,早就有一派人士,一直在大聲疾呼:很多技術(shù)并沒(méi)有經(jīng)過(guò)有效的“安全”驗(yàn)證,就已經(jīng)被極大規(guī)模地運(yùn)用在了各個(gè)領(lǐng)域。誠(chéng)然,這些技術(shù)一定極大地方便了我們的生活,但是這樣的方便背后,究竟?fàn)奚耸裁?,我們還不知道。或者我們知道,但暫時(shí)選擇了無(wú)視。
對(duì)于很多“傳統(tǒng)”行業(yè),比如實(shí)施一個(gè)建筑工程,或者設(shè)計(jì)一款新的車型,或者對(duì)一片新的礦區(qū)進(jìn)行勘探,我們所需要付出的事前準(zhǔn)備工作和安全驗(yàn)證工作,都是巨大的,繁瑣的。連帶一系列安全問(wèn)責(zé)機(jī)制,已經(jīng)在事前被建立明確了。相較而言,上馬一個(gè)互聯(lián)網(wǎng)項(xiàng)目,事前的安全準(zhǔn)備工作近乎為 0。我們甚至完全沒(méi)有與之匹配的標(biāo)準(zhǔn)、流程、心理準(zhǔn)備。與此同時(shí),公認(rèn)的,大多數(shù)已有的互聯(lián)網(wǎng)項(xiàng)目中,對(duì)安全的控制,都是遠(yuǎn)遠(yuǎn)不足以承載這個(gè)項(xiàng)目本身的重要程度。這是一個(gè)很殘酷的事實(shí)。
人類發(fā)展技術(shù),卻忽視技術(shù)本身在人類社會(huì)中應(yīng)用可能產(chǎn)生的安全風(fēng)險(xiǎn),我將之稱為“技術(shù)優(yōu)越主義”。新西蘭槍擊案的兇手大力鼓吹“白人優(yōu)越主義”,是在宣揚(yáng)白色人種族裔優(yōu)于其他人種;那么我們當(dāng)今世界很多人所追求的技術(shù)發(fā)展,如果稍微深思一下,的確是隱含著技術(shù)優(yōu)于人類的思想。
我熱愛(ài)技術(shù),并一直關(guān)注著技術(shù)的發(fā)展。但我不希望,技術(shù),在我,和我們的關(guān)注下,一步一步變成魔鬼。