郭毅可 歐洲科學院院士、英國皇家工程院院士、香港浸會大學副校長。1985年本科畢業于清華大學計算機系,1986年碩士畢業于清華大學計算機系,1993年博士畢業于倫敦大學帝國理工學院計算機系。倫敦大學帝國理工學院計算機系計算機科學教授,上海生物信息技術研究中心客座教授、首席科學家,帝國理工學院并行計算中心技術總監,倫敦E- Science研究中心首席科學家,英國InforSense有限公司董事會主席兼首席執行官。是國際知名的數據科學研究先驅,領導開發數據分析和機器學習的創新科技。他近年集中研究數據科學和數據挖掘在生命科學、醫療保健、環境科學和創意設計等方面的應用。
2020年8月22日,郭毅可院士在第三屆上海人工智能大會發表主旨演講。演講題目為:人工智能的熱望與冷思考。從倫理道德領域解釋了對人工智能的冷靜思考。(以下是演講實錄)
郭毅可院士視頻演講現場
大家都知道這幾年人工智能的發展,大家都抱有很大的希望,在這個希望中間我們也看到人工智能的發展剛剛開始,有許多重要的問題需要研究,從這個意義上來說,我們需要用冷靜的頭腦思考它的發展方向,來考慮一些根本性的問題。
添加微信好友, 獲取更多信息
復制微信號
一人工智能的發展要素
1、高質量的數據資源、大數據
2、處理數據非常好的學習算法
3、支撐算法的算力
我們怎么樣獲得這些大數據?這需要有一個很好的基礎架構,也就是需要有一個很好的數據生態環境,數據資產化技術,也就是今天發展很快的區塊鏈技術。
如何把人工智能利用到實際過程當中去,用到生活中?這中間需要一個非常重要的能力――交互能力。在人和機器在一起的時候,我們的形式變化,也是支撐人工智能發展的一個重要的因素。如果我們不重視這個因素的話,那么人工智能的發展也不可能健康,也很難取得進步。
二人工智能的發展方向
1、機器學習的內涵
所謂的機器學習就是我們機器獲得知識的能力,談到演變,剛才講了三個方向,數據量、算法越來越豐富,還有就是算力越來越強大。這三個方向同時作用,導致了今天獲取知識,從手工獲取不需要數據量,到了我們可以向機器描述一些邏輯規則,我們把知識直接告訴他們,還有一個就是中數據量,來進行機器學習,建立一些中等數據量的模型,最后是數據挖掘,一直到今天的深度學習,主要是大數據量,一個比較復雜的算法,超強的計算能力來支撐的。這里面很重要的一點,就是知識獲取的自動化程度越來越高。
郭毅可院士視頻演講現場
2、從認知學角度看機器學習
機器學習有很多說法,也有很多數學模型,但是我們講到底,機器學習和人腦學習的基本邏輯和基本過程是類似的。我們首先通過一個觀察,來獲得信息,也就是觀察結果數據,知識是通過模型來表達的,腦里的知識也是一種模型,對世界的看法,通過觀察獲得的抽象看法。在這樣的模型當中,我們做什么事情呢?對這個世界要做學習判斷,如果說我們觀察,我看到了和我腦子中得出的判斷或者說某種預測相一致的話,這個時候我們就認為模型是正確的模型,我們不會做什么太多的動作,只是得到一些驗證,但是如果說這個模型和觀察不準,就會出現所謂的預測誤差,這個預測誤差會導致人做幾件事情,之一件事情,我們要改變模型,我們相信觀察是正確的,于是就要對模型做一些變化。還有一種可能,就是我們認為模型是怎么樣的,我們要做什么,這個不一致就導致了我們對這個世界要做一些改變,改變認知是學習,改變世界是行動,這就是認知學簡單來講對機器學習的理解。
3、機器學習的表達形式
● 找到效用函數 我們在大腦當中有表達形式,在現在的機器學習上,表達模型的形式基本上就是一個函數,也就是說我們學習的目的是找到這樣的一種函數,這個函數使得結果和我們的觀察比較一致,這就表達為上面的公式,誤差最小化。學習的目的一個是找到函數的形式,一個是找到函數的參數,不管學習是什么樣的,工作的目標都是一致的,就是找到這樣一個模型,這個模型能夠和學習目標有一致性,來達到這樣的目的。所以學習是一種過程,有一段話,是關于現在學習的一種抽象的概括,圖靈獎獲得者講的一句話,需要對現在的人工智能在一個大樣本上進行描述,這個觀點還是比較客觀的。
現在我們就要問幾個問題,在這樣的學習框架下,我們怎么樣向機器表達,反過來講就是剛才所說的一個很重要的前提,我們要用機器表達我們學習的目的,一個模型和觀察之間的隱私性,這樣的一個說法,總是以這樣一個效用函數來表達,要么更大化要么最小化,不管怎么說,這個時候我們要求一個函數A可能是一個參數,或者說是一種行為,或者說是強化學習,如果是一般性就是一個參數,在這個參數取得的情況下,取得一個X概率,要求平均的損失是更大和最小,如果說收益的話更大,就是這樣一個模式,首先要確定一些參數,找到參數,然后參數的目標是要求平均的損失和平均收益,是更大還是最小,損失最小,收益更大。這個時候我們做的時候要求求出來的函數和觀察級之間的誤差最小,強化學習就要求更大,強度更高,對于不同的行為要求平均的獎勵是更高的。這就是效率。
我們人告訴機器做什么,如果說要求機器做的更多的話,要求不僅要達到更好的結果,同時要滿足一定的倫理要求,這樣的話用這樣的效率函數來表達是非常不容易的。
● 效用函數求優 找到更大或者最小的參數,先不講求優的過程,未必能找到更優的結果,我們用算法來保證。第二個問題在于我們這樣的模型,因為數據觀察的弊端改變,實際上這種模型需要遷移,也就是說模型本身需要不斷變化,這個時候我們就有一個很大的問題,就是模型的進化,數據變化之后能不能優化。還有一個很大的問題,求優的過程是學習的過程,這樣的過程往往是很難理解的,求優的時候的含義我們并不清晰,所以怎么辦,為了求優,我們必須要調整參數,這些調參,我們怎么樣改變,這個有點像一個煉金術,我們并不知道,這些都是會導致很大的問題,首先之一個模型是不是可以進化,第二個這個學習過程,是不是能夠被解釋,這些都是很重要的問題。
郭毅可院士視頻演講現場
4、機器行為
這個行為是指人對機器的感知,這個時候就有很多問題,比如說機器和人一起診斷看病,這是對行為的一個很大的要求,要行為能夠解釋,我們能夠驗證正確性,這個行為這個決斷是不是正確,憑什么我要相信你,還有一個很重要的就是右邊的圖,一個軍事行為的應用,怎么樣保證整個操作,什么時候可以開槍,什么時候必須考慮到平民傷亡等等,這些都是非常重要的行為準則。
講到機器行為,我們可以稍微做一個抽象的解釋。(行為四要素)
● 行為的目的 是不是能夠按照人的意圖去改變周圍的環境,這個非常重要。也就是說你的目的是好的還是壞的,是合理的還是不合理的。
● 行為的原則 做事情的基本原則,你知道什么是錯的,什么是不能做的,是不違背人類的倫理和規范。
● 行為的結果 結果是不是你應該做的事情。
● 行為的依據 你得出來的結果是為什么得出這樣的結果,根據是什么。
5、機器學習應用的倫理思考
● 政治 撰寫一個新聞,原則是不是可以被理解,這個原則是不是合理的,怎么對新聞的生成算法有可靠性。比如說現在的深度構架,這里面有一張照片,蔡英文背后的一張照片,背后是毛主席長征,這樣的照片,當然還有很有意思的新聞效果,但是這是真的還是假的,還有就是法律,如果機器人對一些案例做一些機器判斷,有沒有偏見,是否有不可預測的后果,也就是說實際上這樣的投放會導致什么問題,原來犯罪率很低的問題犯罪率高起來了。
● 營銷 推薦系統,我們要考慮對消費者的損害。有一個說法是過于泡沫,一個推薦我喜歡什么,一直向我推薦我喜歡的,于是乎就形成了一個泡沫,我只喜歡原來喜歡的東西,我自己給自己構造了一個局限,這種事情是不是合理的。
● 金融 算法定價,算法定價的原則是什么,是價格公平嗎?還是說競爭,是否會造成惡性競爭或者價格戰。我們都知道我們買飛機票都有一個算法定價問題,因為算法定價常常會造成一個很大的矛盾,看到下雨了需要打車,這個某種程度上來講,更大化商業利益,倫理是不是正確的,這些都是很重要的要考慮的問題。
● 智能汽車 真正要投入使用,倒不是技術難點,加上自動駕駛更大的問題是路權選,誰有權用這個路,如果兩個車一起開,必須保證對人的傷害最小,如果說人和機器在同一個路上的話,如果人知道有這樣一個基本原理,可以惡性和機器進行較量,這樣的話車永遠開不了,這種情況下怎么解決路權選擇的問題,人開的車和機器開的車怎么做路權選擇。做城市管理的時候有一個道路交通管理,這些方面的平衡,人工智能怎么來做,也是一個非常重要的話題。
● 機器診斷 診斷是否可以驗證,健康監護,各種錯誤的代價,對于緊急情況如何做應對的,這些都是很大的問題。
● 社會信用體系與社會交流 信用低的人剝奪權利,是不是在一個的管理當中是真正合法的,和我剛才說的是一樣的,如果說真的做交流的話,未必改變社會關系的組成架構,家庭也有,聊天及其對聊天者的心理影響, *** 機器人是否會改變人類的自然感情,這些問題都是在我們理解機器行為上是非常重要的一些例子。
郭毅可院士視頻演講現場
三人工智能研究的重要問題
1、如何向機器表達對的目的,也是未來的重要問題。未來的人工智能,我們不求讓機器做的多,而是要求機器做的對。做的多應該是相對容易的,但是要機器做的對,就不是那么容易了,我們這里面考慮的是什么是對,這個行為原則,如何向機器表達對的目的,告訴你怎么做什么事情,怎么告訴是準確,怎么樣告訴是有效,怎么樣告訴是真正的能夠表達的清晰一點,這又是一個問題。
2、如何判斷機器做的對不對,假定說我已經表達的很清楚了,以前的結果和現在的結果有一個驗證。還有一種理解機器做的對的緣由,機器行為的解釋和驗證,這些都是需要論證的。
● 什么是對 這就是最難的,這就是人工智能的倫理問題,這是一個哲學問題,這里面有很多的原則,這三大原則非常重要,對于什么是對的,在不同的社會環境和價值體系當中都是不一樣的,有些我覺得是對的,比如說我們舉個例子,首先是要有利他主義,什么意思呢?不是利己,是幫助人類,而不是利益自己。第二個是謙遜法則,我需要把人類價值更大化,但是不知道人類價值到底是什么,不能夠凌駕我們之上。第三個是學習能力,不僅是自身學習,也可以觀察我們來進行學習,或者說用機器語言來間接學習,從這些方面來學習知識和數據。當然這只是一種,很多人都有不同的理解。
● 怎么表達對 什么樣的效用函數可以表達我們的目的,這是模型形態,而不是說控制行為方式。效用函數是合理的或者說有效的方式嗎?拿這個效率函數來做人工智能,怎么樣來衡量一個行為,怎么樣定義這個行為,人工智能是怎樣理解的。更大自由化是好現象嗎?每個個體的更大自由化就是無 *** 主義了。驗證這個函數的證據是什么,這個機器行為可以用效用函數來完全確定嗎?經濟學有兩個重要的研究, *** 人原則,機器人 *** 了我們的事情,找任何 *** 人的時候都碰到一個矛盾,要確定這個 *** 人是以你的利益更大化為原則,還是以自己的利益更大化為原則。比如說我們找律師,這個律師到底是為我找官司,還是說想把這個問題搞的更復雜一點。還有一個不可預知原則,你表達的事情是好事情,但是往往找到不想要的結果。這兩個原則都使得我們要認真思考,如何向機器表達我們的目標。
● 如何判斷機器做的對不對 之一個驗證 *** 就是和目標是否一致,另一個是求得更優。這里面有兩個場景,如果說這兩條曲線,一個是更精確,還有一個是敏感度要求更高,這兩個不是一個事情,有一個就是假定模型,這個模型很有意思,有哮喘的肺炎患者,死于肺炎的可能性較小,這合理嗎?不合理,如果有哮喘應該死亡率高,為什么反而低了。因為有哮喘很快就會受到正常的照顧,這樣的話反而容易生存,所以數據不足,所以說90%的AI結構都是沒有驗證的。
● 如何理解機器做的對的緣由 現有的深度學習模型不能向用戶解釋其行為,設計者也無法理解其行為過程。這當中有很多研究,有一些早期的工作,比如說現在要拿一個深度神經 *** ,判斷這是什么動物,但是有一個很大問題,我學了一個模型,我給出一個斑馬的圖形,你可能就判斷出行分布了。這個時候怎么樣來學習,把一些圖片特征編碼,每一段編碼或者數字代表了什么含義,這樣可以通過一個學習辦法,把人的特征一起進行學習,這就有一個很大的好處,等于說你做了人的標注,如果說這些過程最重要的原則是用空間來解釋,我們現在做的工作把這個概念再擴大一些。
四人工智能的今天和明天
人機共生世界,在人機共生的社會中,人和機器的互相交流是最重要的,人要理解機器的行為,機器要理解人的意圖。對機器行為的解釋,理解和驗證,以及機器行為的倫理性是人工智能研究的核心課題。學習的可解釋性是一個方向,還有一個方向就是向機器表達,作為對機器行為的解釋和驗證,以及機器行為的倫理是核心的問題,在沒有解決這些問題之前,或者說這些問題沒有被深入理解之前,我們奢談人工智能將來什么樣,人工智能會不會導致機器統治人類來為時過早。
我們不要神話它:它是實實在在的算法。
我們不要害怕它:它是不可避免的未來。
我們不要輕視它:它會改變我們的社會。
我們不要忽悠它:它不是靠錢可以堆出來的。
我們要以我們東方文明特有的包容來研究和應用它,把它作為我們社會新的存在,想如何和它共處。
這是我理解的發展方向。謝謝大家!