原標題:那些青史留名的 AI和AI學家
電影《人工智能》海報圖片
在幾代人工智能學者的帶領下,我們已經(jīng)擁有了蘋果的Siri這樣真實可感的人工智能。下一步驚人的成就會從哪里突破?很可能不在學院,而是商業(yè)公司,或許不在美國,而在中國、英國或日本。無論如何,離人工智能交一份滿分答卷還早。
圖靈預言,20世紀末會有電腦通過“圖靈測試”。他的預言在IBM的深藍身上部分實現(xiàn)。不過,卡斯帕羅夫和深藍是通過棋局切磋,而不是言語交流。能夠跟人長時間無限制地交流而不被辨認出來的電腦,仍然未有,這一點上圖靈太樂觀了。
由于4∶1大勝人類圍棋冠軍,一個名叫“阿爾法狗”的AI(人工智能)紅了。在阿爾法狗之前,它的許多前輩也曾紅極一時,深藍、尤金……每一次AI的進步都會同時引發(fā)一輪熱潮,我們應該記住它們和它們的締造者——
隨著阿爾法狗(AlphaGo)戰(zhàn)勝李世石,人工智能的發(fā)展又引起了全世界的興趣。其實,人們自古就幻想著智慧的機器。中國古籍記載,周穆王去西邊的昆侖山旅游,碰到一個工匠叫偃師的,能造出跟人一模一樣的假人,能跳舞唱歌,還對周穆王的愛妃暗送秋波。惹得穆王大怒,要處死偃師。偃師急忙扯掉假人的頭,原來里面是機器。
如今大家對人工智能的印象,跟周穆王差不多:有時幾乎被它蒙騙,但下一個時刻它又現(xiàn)出原形。即使許多最聰明的頭腦投入這項事業(yè),人工智能的“奇點”仍未到來。
不能不說的圖靈測試
1945年,技術史上劃時代的天才,阿蘭·圖靈提出了所謂的“仿真系統(tǒng)”,他寫了一份詳細的文件,想制造一種沒有固定的指令系統(tǒng)的計算機。它能模擬各種不同指令系統(tǒng)的計算機的函數(shù)。
這份文件公布于1972年,此時大家才知道:圖靈在二戰(zhàn)結(jié)束時就開啟了后來被稱為“人工智能”領域的研究,而且他已經(jīng)開始注意人的神經(jīng)網(wǎng)絡和計算機器可能的聯(lián)系。
1950年,圖靈來到曼徹斯特大學任教,并負責曼大的自動計算機項目。就在1950年10月,他發(fā)表了另一篇題為《機器能思考嗎?》 的論文,成為劃時代之作。也正是這篇文章,為圖靈贏得了“人工智能之父”的不朽名譽。
這篇論文里,圖靈第一次提出了“機器思維”。他有條理地反駁機器不能思維的看法。他還把對機器智能的判斷變成一個行為主義范疇的問題。
圖靈給出了后來人工智能領域的金標準——一個人如果不是面對面地交流,而是隔著一道帷幕,和對方進行問答,而且在相當長時間內(nèi),無法根據(jù)這些問題判斷對方是人還是計算機,那么就可以認為這個計算機具有同人相當?shù)闹橇Α_@就是著名的“圖靈測試”(Turing Testing)。圖靈說,只要有30%的人類測試者在5分鐘內(nèi)無法分辨出被測試對象,就可以認為機器通過了圖靈測試。
雖然計算機當時剛剛發(fā)明,還遠達不到能跟人對話的程度,但圖靈預言,20世紀末會有電腦通過“圖靈測試”。他的預言在IBM的深藍身上部分實現(xiàn)。不過,卡斯帕羅夫和深藍是通過棋局切磋,而不是言語交流。能夠跟人長時間無限制地交流而不被辨認出來的電腦,仍然未有,這一點上圖靈太樂觀了。
2014年6月12日,一個名為“尤金·古斯特曼”的聊天程序成功地在5分鐘內(nèi)蒙騙了30%的人類測試者,被認為通過了圖靈測試。但也有人反駁說,這個聊天機器人自稱只有13歲,并使用第二語言來回答問題,因此它模仿的不應該是圖靈所想的那種正常智人。
群星輩出的短暫黃金期
1956年8月,在美國漢諾斯小鎮(zhèn)的達特茅斯學院,約翰·麥卡錫、馬文·閔斯基、克勞德·香農(nóng)、艾倫·紐厄爾、赫伯特·西蒙等人發(fā)起了第一次用機器模擬人的智力的大討論。這些名字后來在學界都是響當當?shù)摹?/p>
會議開了兩個月,沒有共識,但會議討論的內(nèi)容有了一個名字:人工智能。所以也有人把1956年看作是人工智能元年。之后,隨著大批智者撲向這一新領域,人工智能像噴氣式飛機一樣驟然升空。
一開始,有人用計算機程序代替人類進行自動推理來證明了數(shù)學定理。在達特茅斯會議上,紐厄爾和西蒙展示了他們的程序:“邏輯理論家”可以獨立證明出《數(shù)學原理》第二章的38條定理;1963年,它已證明該章的全部52條定理。
1958年,美籍華人王浩在IBM704計算機上,5分鐘之內(nèi)就證明了《數(shù)學原理》中有關命題演算部分的全部220條定理。IBM公司還研制出了平面幾何的定理證明程序。
1976年,凱尼斯·阿佩爾和沃夫?qū)す系热死萌斯ず陀嬎銠C混合的方式證明了一個著名的數(shù)學猜想:四色定理——“任意一張區(qū)域劃分的地圖,僅用四種顏色就可以染色該地圖,使任意兩個相鄰的國家不會撞色;這個定理之前被經(jīng)驗肯定,但人們不知如何從公理上證明。兩位研究者把這個定理化作幾千種不同的特例,然后用計算機的窮舉能力,一個一個證明了。但這種借助計算機蠻力的辦法,至今被許多數(shù)學家認為不算是真正的證明。
機器學習也突飛猛進;達特茅斯會議上,阿瑟·薩繆爾公開了一個跳棋程序,它具有自學習函數(shù),可以不斷總結(jié)經(jīng)驗提高水平。1959年,該跳棋程序打敗了設計者薩繆爾本人,3年后,它已經(jīng)可以擊敗美國一個州的跳棋冠軍。
1956年,奧利弗·薩爾夫瑞德研制出首個字符識別程序,開辟了模式識別這一新的領域。1957年,紐厄爾和西蒙等開始研究一種不依賴于具體領域的“通用問題求解器”。1963年,詹姆斯·斯拉格發(fā)表了符號積分程序SAINT,輸入一個函數(shù)的表達式,該程序就能自動輸出這個函數(shù)的積分表達式。過了4年后,他們研制出了升級版SIN,已可表現(xiàn)出專家水準。
挫折后轉(zhuǎn)向機器學習
一開始人工智能就顯現(xiàn)出光明前景,學者們沒有理由不樂觀。1958年,紐厄爾和西蒙自信地說,不出10年,計算機將會成為世界象棋冠軍,證明重要的數(shù)學定理,譜出優(yōu)美的音樂。照這樣的速度發(fā)展下去,2000年人工智能就能超過人類。
可事實沒那么簡單。1965年,機器定理證明遇到瓶頸:計算機推了數(shù)十萬步也無法證明兩個連續(xù)函數(shù)之和仍是連續(xù)函數(shù)。薩繆爾的跳棋程序也無法進一步戰(zhàn)勝世界冠軍。
1960年代計算機技術爆發(fā)時,大家估計人工智能不超過十年就能實現(xiàn)。但后來人工智能技術的發(fā)展之難,讓很多科學家放棄了這個領域。后來學界也將人工智能分為兩種:難以實現(xiàn)的強人工智能和可以嘗試的弱人工智能。
強人工智能是科幻電影里常見的那種,可以認為它就是人,可執(zhí)行“通用任務”。弱人工智能則處理單一問題。我們迄今仍處于弱人工智能時代。
1970年代,愛德華·費根鮑姆的思路被學界接受:人工智能不光要研究解法,還得引入知識。專家系統(tǒng)就誕生了。它利用數(shù)字化的知識去推理,以模仿領域?qū)<医鉀Q問題。第一個成功的專家系統(tǒng)DENDRAL1968年問世,可根據(jù)質(zhì)譜儀的數(shù)據(jù)推知分子結(jié)構(gòu)。
在1977年世界人工智能大會提出的“知識工程”的啟發(fā)下,日本的第五代計算機計劃、英國的阿爾維計劃、歐洲的尤里卡計劃和美國的星計劃相機出臺,人工智能都是這些計劃的重要組成部分。
于是,在1980年代,機器學習成為了人工智能的焦點。而且學者也提出了讓機器不靠人類灌輸知識,而是模擬小孩子自己去學的方法。其中,有學者模擬大腦結(jié)構(gòu)(神經(jīng)網(wǎng)絡)實現(xiàn),也有學者模擬與環(huán)境互動的簡單生物體。他們與傳統(tǒng)的人工智能流派鼎足而立。
但是,直到1990年代,人工智能的研究仍未走出低潮,日本在機器人領域大量投資,但當時效益不明顯。
IBM“三兄弟”唱主角
1988年,人工智能系統(tǒng)深思闖入國際象棋界。它是IBM研發(fā)的,每秒考慮70萬步棋。1991年,深思II戰(zhàn)平了澳大利亞國際象棋冠軍。
1996年,深思的升級版深藍挑戰(zhàn)人類國際象棋世界冠軍,如日中天的加里·卡斯帕羅夫,2∶4落敗。一年后的5月11日,深藍以3.5∶2.5的成績戰(zhàn)勝了卡斯帕羅夫。這兩次比賽都引發(fā)了全球關注,最終讓人工智能重新贏得世界的注意力。
2011年2月,在美國一個著名的電視問答節(jié)目《危險》中,IBM公司的沃森(Watson)系統(tǒng)戰(zhàn)勝了人類選手,成為深藍后另一個里程碑。這個節(jié)目是各種知識的問答,主持人給出一些線索,選手則要猜出主持人所講的東西。自然語言理解對機器是很難的,因為涉及到語言的隱含意思,各種比喻和歧義。沃森能夠搞明白人類的語言是一大進步。
IBM巨額投入在各種表演性質(zhì)的人工智能上,樹立了AI領袖的形象,也拉升了自己的股票。目前,沃森和同類系統(tǒng)已經(jīng)被用在幫助律師處理案卷,或者幫助醫(yī)生根據(jù)病例做初步診斷上。
隨著Google在近十年大量投資人工智能,桂冠似乎正要從IBM頭頂摘下。谷歌公司的工程總監(jiān)是未來學家雷·庫茲韋爾,他由于普及了奇點概念而名震業(yè)界。庫茲韋爾認為:人工智能遲早要發(fā)展到一個轉(zhuǎn)折點,由于所有信息被人工智能吸納,它將生產(chǎn)出人類再也無法消化的海量信息從而超越人類。
從神經(jīng)網(wǎng)絡到阿爾法狗
前幾天結(jié)束的阿爾法狗對抗李世石,最終電腦笑到了最后,為什么人工智能這么厲害?靠的是神經(jīng)網(wǎng)絡進行深度學習。
所謂神經(jīng)網(wǎng)絡研究,可追溯到1943年。當時,沃倫·麥卡洛克和沃爾特·匹茲提出了單個神經(jīng)元的計算模型。1957年,弗蘭克·羅森布拉特擴充了麥卡洛克-匹茲模型,在神經(jīng)元上加入了學習算法,并稱之為“感知機”。它根據(jù)模型的輸出,與人們希望模型的輸出之間的誤差,調(diào)整權重來學習。
感知機根據(jù)輸出效果的好壞來調(diào)整自己的神經(jīng)網(wǎng)絡,這跟人的大腦是相同的原理。神經(jīng)網(wǎng)絡學派給機器學習指出了一條路。1974年,杰夫·辛頓提出,用多個感知機連接成一個網(wǎng)絡,它就能解決任何問題;配合以反向傳播算法,就能訓練神經(jīng)網(wǎng)絡。
“阿爾法圍棋”復制了小孩子的學習過程,成功了就調(diào)高相關通路強度,失敗了就調(diào)低,使神經(jīng)網(wǎng)絡在自我對弈百萬盤(用不同風格)后調(diào)整到最優(yōu)。
除了模擬大腦的“神經(jīng)網(wǎng)絡派”,還有模擬昆蟲的“行為智能派”。他們從螞蟻這樣單個智力有限但群體表現(xiàn)優(yōu)異的動物獲得啟發(fā),讓機器在與環(huán)境互動中獲得知識。不久前,美國波士頓動力公司研發(fā)的“大狗”四足機器人,就是這個學派的產(chǎn)物。
在幾代人工智能學者的帶領下,我們已經(jīng)擁有了蘋果的Siri這樣真實可感的人工智能。下一步驚人的成就會從哪里突破?很可能不在學院,而是商業(yè)公司,或許不在美國,而在中國、英國或日本。無論如何,離人工智能交一份滿分答卷還早。(記者 高博 綜合報道)