JN江南·(中國)體育官方網(wǎng)站-JN SPORTS_外灘大會(huì )首次舉辦全球Deepfake挑戰賽 聚焦應用與安全問(wèn)題 被AI迅速改變的世界
JN江南官方JN江南官方相關(guān)新聞沖上網(wǎng)絡(luò )熱搜:外灘大會(huì )全球Deepfake(深度偽造技術(shù))挑戰賽的參賽選手之一,中國科學(xué)院的“95后”女性算法工程師張欣怡宣布,其團隊已將近期參加挑戰賽的AI模型向全球開(kāi)源,希望以此降低Deefake對抗的使用門(mén)檻,援助Deepfake受害者,守護真實(shí)世界。
結合近期韓國互聯(lián)網(wǎng)爆出的Deepfake女性受害事件,張欣怡團隊的做法在網(wǎng)絡(luò )上刷屏。的應用與安全再次成為廣受關(guān)注的公共性事件。
探尋2024外灘大會(huì ),AI等未來(lái)技術(shù)不再是空想,大量的落地應用已經(jīng)成為展會(huì )主流。向外界展示如何用好AI、管好AI是本屆外灘大會(huì )和過(guò)去最大的不同。無(wú)論想還是不想,都在迅速改變現實(shí)世界。
多年前,金庸先生在接受采訪(fǎng)時(shí)透露其文學(xué)創(chuàng )作門(mén)道:先構思好人物性格,然后再按設定好的人物性格去編情節。這可能代表了許多作家的文學(xué)創(chuàng )作思路。
金庸先生肯定不會(huì )想到,如今機器也在循著(zhù)同樣的路徑創(chuàng )作作品。在本屆外灘大會(huì )的現場(chǎng),有關(guān)輔助創(chuàng )作的大模型產(chǎn)品層出不窮,有的定位于幫寫(xiě)作者梳理寫(xiě)作線(xiàn)索和思路,生成思維導圖;有的定位于幫寫(xiě)作者完成擴寫(xiě),豐富文章內容;甚至還有工具可以幫助創(chuàng )作者將剛剛寫(xiě)好的故事生成視頻,頃刻之間,想法已經(jīng)轉化成多種形態(tài)的作品。
不僅能模仿人、替代人完成一部分工作,人工智能甚至可以超越人類(lèi),完成一些過(guò)去很難實(shí)現的任務(wù)。2020年,麻省理工學(xué)院的研究人員宣布發(fā)現了一種新型抗生素,能夠消滅此前對所有已知抗生素都有耐藥性的細菌菌株。傳統上,一種新藥的研發(fā)需要研究人員從上千種潛在分子著(zhù)手,通過(guò)不斷試錯,篩選出少量候選分子。麻省理工學(xué)院則另辟蹊徑,讓人工智能參與篩選分子數據庫,最終在6.1萬(wàn)個(gè)分子中找到一個(gè)符合標準的,研究人員把它命名為海利霉素(Halicin)。
近兩三年,人工智能快速發(fā)展,人們大膽預測:它正在“接管藥物研發(fā)”,也在“改變好萊塢講故事的方式”,并可能“改變科學(xué)本身”。它的一些能力甚至已經(jīng)超越了人類(lèi)的理解。
雖說(shuō)預期有無(wú)限可能,但人工智能究竟能做什么、不能做什么,我們依然沒(méi)有完全確定。只是業(yè)界發(fā)現,越大的模型、越多的數據,就越有可能讓人工智能更加智能。業(yè)界把它稱(chēng)作“規模法則”(scaling laws)。
我們也還沒(méi)有完全確定,現有的千行百業(yè)應如何嫁接人工智能的魔力。到目前為止,人工智能只在一些特定領(lǐng)域顯示了超凡的能力,比如人臉識別、文字翻譯、內容生成。但是人工智能模型不擅長(cháng)邏輯和推理,因而也不清楚自己的輸出是否符合人類(lèi)需求,它依賴(lài)人類(lèi)來(lái)界定它所解決的問(wèn)題。就像發(fā)現海利霉素,人工智能需要人類(lèi)為目標分子設立標準:能夠殺死致病菌、與現有抗生素不同、無(wú)毒。
也許更多模型參數、更大數據量能改善人工智能的邏輯和推理,使它涌現出更高智能。但“規模法則”是否有邊界?起碼現在看來(lái),人工智能只是精心制作的代碼,沒(méi)有生命或自主能力。人工智能的革命性能力仍然依賴(lài)于人類(lèi)的判斷。
人類(lèi)是如何學(xué)習的?這個(gè)問(wèn)題很難有一個(gè)簡(jiǎn)單的回答。我們耳濡目染,我們歸納推理,我們做科學(xué)實(shí)驗,我們甚至去天馬行空地冥想。人類(lèi)的學(xué)習不依賴(lài)于某種單一途徑。
人工智能的學(xué)習方法和人類(lèi)迥異。當前人工智能普遍運用一種叫作“深度學(xué)習”的方法。在這種學(xué)習方法中,人工智能依據數學(xué)和統計學(xué)方法處理大量數據,從中獲得某種規律。數據是人工智能的食糧,數量越多、質(zhì)量越高,人工智能就越有可能表現得優(yōu)良。谷歌和Meta的人工智能模型已經(jīng)接受了超過(guò)1萬(wàn)億個(gè)單詞的訓練。要知道,的總單詞量只有約40億個(gè)。
在外灘大會(huì )的提前探訪(fǎng)中,不少AI企業(yè)界人士都提到了數據的問(wèn)題:高質(zhì)量數據的生成速度遠低于人工智能大模型的需求,數據短缺問(wèn)題已初現端倪。研究機構Epoch AI預計,可用于訓練的高質(zhì)量文本可能在2028年前耗盡。在中文世界,數據問(wèn)題更加棘手。阿里研究院5月發(fā)布的《大模型訓練數據白皮書(shū)》顯示,互聯(lián)網(wǎng)上中文語(yǔ)料和英文語(yǔ)料占比存在顯著(zhù)差異:在全球網(wǎng)站中,英文占比高達59.8%,而中文僅占1.3%。在業(yè)界,數據短缺問(wèn)題也被稱(chēng)為“數據墻”。如何處理這堵墻迫在眉睫。
一種方法是注重數據質(zhì)量而非數量。人工智能企業(yè)對數據進(jìn)行過(guò)濾和排序,以最大限度地提高模型的學(xué)習效率。關(guān)于世界的真實(shí)信息顯然很重要,邏輯推理也很重要。因此,學(xué)術(shù)教科書(shū)(而不是未經(jīng)篩選的互聯(lián)網(wǎng)數據)就顯得尤為珍貴。
另一種方法是使用合成數據,這些數據由機器創(chuàng )建,因此是無(wú)限的。谷歌子公司DeepMind制作的圍棋模型AlphaGo Zero就是一個(gè)很好的例子。AlphaGo Zero沒(méi)有使用任何已有棋譜數據,而是通過(guò)自我對弈490萬(wàn)次來(lái)學(xué)習圍棋,并記錄下獲勝的策略。這種“強化學(xué)習”通過(guò)模擬大量可能的應對方法,并選擇勝算最大的,教會(huì )模型如何應對對手的棋步。
就像深藏地底的石油驅動(dòng)了工業(yè)進(jìn)步,散布在互聯(lián)網(wǎng)和人類(lèi)文本中的數據驅動(dòng)了人工智能不斷升級。但在不久的未來(lái),石油、數據終將枯竭,我們需要尋找新的、可再生的替代品。
8月底,一場(chǎng)對Deepfake濫用的聲討席卷韓國互聯(lián)網(wǎng)。事件的起因是有部分韓國網(wǎng)民在社交媒體上傳播用Deepfake技術(shù)制造的“換頭”色情圖片、影像,被涉及對象有女明星、女學(xué)生,甚至有未成年女孩。
Deepfake“換頭”,通俗來(lái)說(shuō)就是使用人工智能生成技術(shù),將不同個(gè)人的聲音、面部特征和身體動(dòng)作拼接起來(lái),合成虛構的圖像或視頻。
這起事件中用AI技術(shù)合成的影像、視頻幾乎以假亂真,不僅嚴重侵犯了個(gè)人隱私權和名譽(yù)權,更對所涉及的女性心理造成了深刻的負面影響。
人們不得不承認,客觀(guān)上,AI技術(shù)的快速發(fā)展加劇了犯罪手段的更新。今年年初,國外“文生視頻”應用軟件Sora曾刷屏互聯(lián)網(wǎng)。當時(shí)即有人提出,人工智能生成技術(shù)發(fā)展太快,內容很容易不受控制而被應用于黃色、犯罪產(chǎn)業(yè)。
考慮到內容生產(chǎn)的風(fēng)險和成本控制,截至目前,Sora模型尚未正式向公眾免費開(kāi)放。OpenAI選擇向一組精選的“紅隊成員”開(kāi)放Sora,這些成員是專(zhuān)門(mén)評估AI模型風(fēng)險和識別潛在問(wèn)題的專(zhuān)家,他們將從各個(gè)角度“對抗性”地測試這個(gè)模型。
為了解決這些AI內容生成的安全問(wèn)題,業(yè)界已經(jīng)開(kāi)始了探索。在本次外灘大會(huì )的前沿科技展區,專(zhuān)門(mén)設立了一所未來(lái)安全實(shí)驗室,囊括了多個(gè)國內互聯(lián)網(wǎng)安全、AI安全和檢測的前沿產(chǎn)品,其中就包括了螞蟻集團蟻天鑒推出的“AI鑒真”解決方案。參觀(guān)者可以現場(chǎng)對AI生產(chǎn)的圖片、視頻、音頻進(jìn)行鑒定。
螞蟻大安全的一位工作人員告訴記者,目前大部分利用AI生成技術(shù)進(jìn)行的違法活動(dòng)都是批量化生產(chǎn),單個(gè)目標的偽造成本不會(huì )很高,通過(guò)對抗模型的構建,一般都可以JN江南甄別其真偽。尤其在圖像識別領(lǐng)域,準確率甚至可達99.99%。
此外,本次外灘大會(huì )首次舉辦的AI創(chuàng )新賽還專(zhuān)門(mén)設立了全球Deepfake挑戰賽,邀請來(lái)自海外高校的技術(shù)團隊,聚焦國際最熱的安全、欺詐風(fēng)險問(wèn)題,探索更多Deep fake對抗技術(shù)。
可能在不知不覺(jué)中,普通人的生活就已被AI產(chǎn)品包圍。除了前文提到的兒童手表,AI大模型可以嵌入一切智能設備,例如智能手機、智能音箱、智能家電等。再大一點(diǎn),內置了AI大模型的智能汽車(chē)也已經(jīng)問(wèn)世多時(shí)。
就拿AI上車(chē)來(lái)說(shuō),目前已有蔚來(lái)、理想、小米、智己等多家車(chē)企宣布將AI大模型嵌入汽車(chē)的智能座艙,以實(shí)現用戶(hù)和車(chē)機的智能語(yǔ)音互動(dòng)。更重要的是,AI技術(shù)的突破正在幫助全球智能駕駛研發(fā)提速,無(wú)人車(chē)離人類(lèi)越來(lái)越近。
近期武漢的“無(wú)人出租車(chē)”爆火后,其“無(wú)人駕駛”技術(shù)曾受到多方質(zhì)疑。很多人猜測,“無(wú)人出租車(chē)”之所以能夠,是有駕駛員在線(xiàn)上遠程控制,全靠真人遠程代駕。實(shí)際上,“蘿卜快跑”出租車(chē)雖然配備了遠程操控員,但操控員并不會(huì )直接干預汽JN江南車(chē)的駕駛,只會(huì )在極端情況發(fā)生時(shí)對車(chē)輛進(jìn)行接管,而且一人負責監測多臺汽車(chē)。商業(yè)出租車(chē)能夠實(shí)現,正是因為AI技術(shù)的賦能,讓車(chē)機能夠實(shí)時(shí)處理來(lái)自傳感器的數據,識別道路狀況,做出駕駛決策,如加速、減速、轉向等。
這就是一則AI影響人類(lèi)生活的直觀(guān)案例。技術(shù)的突飛猛進(jìn)正在改變車(chē)主的生活,甚至司機的生活。不少人可能會(huì )因此失業(yè),但新的就業(yè)機會(huì )也在A(yíng)I產(chǎn)業(yè)浪潮中涌現。
在上海臨港,一批過(guò)去從事網(wǎng)約車(chē)行當的司機已經(jīng)上崗無(wú)人車(chē)安全員。賽可智能測試車(chē)隊的一名安全測試員告訴記者,在測試車(chē)隊上班,一天8到10個(gè)小時(shí),工資和過(guò)去開(kāi)網(wǎng)約車(chē)差不多,都能過(guò)萬(wàn)元,但是工作量確實(shí)小了不少。這種新的生活方式正在逐漸被大眾所接受。