近日,美國谷歌公司人工智能“阿爾法圍棋(AlphaGo)”三連勝世界圍棋冠軍李世石,“人機大戰(zhàn)”引全社會熱烈關(guān)注,科技又一次展示了爆炸性的發(fā)展速度和力量,對此有人驚奇,有人恐慌,更有人忿忿不平?!叭藱C大戰(zhàn)”到底說明了什么?帶給我們怎樣的啟示?剛剛在天府腦科學(xué)論壇——腦信息科學(xué)發(fā)展研討會上做了“基于視覺認知模擬的數(shù)據(jù)建?!眻蟾娴奈靼步煌ù髮W(xué)徐宗本院士,3月14日接受《中國科學(xué)報》記者采訪,為我們“冷靜”揭秘“人機大戰(zhàn)”的神秘面紗。
AlphaGo的勝出是“大數(shù)據(jù)”的勝利
“人機對決實際上是一個人與歷史的對決,也是一個人與群體的對決,一個生物人與“人與機器混合生物”之間的對決。所以我認為AlphaGo的勝利本質(zhì)上是當代信息技術(shù)綜合運用的勝利,是大數(shù)據(jù)的勝利、也是機器學(xué)習(xí)的勝利?!毙熳诒驹菏恳徽Z道破AlphaGo勝利的“秘訣”。
他從人和機器的下棋原理從策略上進行了分析對比,“人下棋是從當前的局部出發(fā),通過思考此后少數(shù)幾步的可能性,并憑直覺判斷對全局的影響來行棋?!倍鳤lphaGo與人采用了完全不同的兩種策略解決問題,他說:“AlphaGo是從整體出發(fā),棋法是整體性的步驟,它追求全局而不是局部優(yōu),所以容忍局部走法上的似乎“幼稚”的舉棋,因此人機大戰(zhàn)的任何一方都有輸嬴的可能性?!痹谒磥?,機器的輸贏決定于程序設(shè)計的缺陷程度以及所使用算法中隨機性的作用,人則取決于臨場發(fā)揮水平及心理因素等。
由此可見,AlphaGo程序設(shè)計的精密度和使用算法先進性是其致勝關(guān)鍵。從其工作原理可見“大數(shù)據(jù)”的關(guān)鍵作用。因為AlphaGo是一個由高級搜索樹與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合的程序。神經(jīng)網(wǎng)絡(luò)包含12個處理層,用以描述棋盤及棋法,每一層則包含數(shù)百萬個人工神經(jīng)元,各層神經(jīng)元之間的聯(lián)結(jié)通過訓(xùn)練確定。其中的“決策網(wǎng)絡(luò)”負責(zé)選擇走棋策略,“價值網(wǎng)絡(luò)”部分負責(zé)評估態(tài)勢并預(yù)測環(huán)境。谷歌方面用收集的人類圍棋高手的3000萬步圍棋走法,并用這些經(jīng)驗數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。與此同時,AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運行了數(shù)千局對局,生成新的經(jīng)驗數(shù)據(jù)以對所訓(xùn)練的神經(jīng)網(wǎng)絡(luò)進行強化學(xué)習(xí)。由于它可以利用Google云平臺不停地練習(xí)、練習(xí)、再練習(xí),每一秒都在進步,永不停歇,由此所生成的訓(xùn)練數(shù)據(jù)無窮無盡,一個典型呈現(xiàn)“流”特征的大數(shù)據(jù)。所有算法訓(xùn)練通過Google云平臺完成。
因此,AlphaGo的算法與架構(gòu)的創(chuàng)新并不是最突出的,至于它為什么還會贏?徐宗本從技術(shù)上分析到:“AlphaGo的勝利,一靠強大的計算機,尤其云平臺與超算的結(jié)合支持大數(shù)據(jù)的學(xué)習(xí),二靠有大數(shù)據(jù),有收集到的和不間斷自對局產(chǎn)生的用于訓(xùn)練機器性能的數(shù)據(jù),三靠能夠指導(dǎo)機器學(xué)懂大數(shù)據(jù)的機器學(xué)習(xí)算法?!贝送?,他認為與人相比,機器的穩(wěn)定性相對人類的心態(tài)來說,具有無可比擬的最大優(yōu)勢。
AlphaGo的“技術(shù)勝利”具有可借鑒性
對于大多數(shù)人來說“人機大戰(zhàn)”更多關(guān)注的是輸贏,然而在徐宗本院士看來,這只是一個表象。我們應(yīng)該透過輸贏的表象,理性認識AlphaGo的勝利說明了什么和沒有說明什么,不必過于興奮或恐懼。
徐宗本認為,AlphaGo的勝利并不能說明人工智能就比人更聰明,更不說明機器智能已超越或能超越人類,AlphaGo程序并不能直接用于解決其它搜索問題,但有很強的可借鑒性,所以它的勝利并沒有說明什么,不必為人機大戰(zhàn)興奮或恐懼。
他說:“人的智能與人工智能是是整體呈現(xiàn)與單項突出的關(guān)系。人的智能承載感知、想像、分析、學(xué)習(xí)、記憶、推理、直覺、幻覺、靈感、頓悟、情感等多種多樣的特質(zhì),這其中可被模擬的難易程度、廣深度都是完全不一樣的,人的智能是受意識支配的整體功能相互配合的整體呈現(xiàn)。而機器通常只能模擬人智能的某一、二個方面,只能實現(xiàn)人之智能的一部分。雖然在單項的模擬結(jié)果會導(dǎo)致機器某方面能力對人類的超越,如在計算機的記憶、計算能力、機器人對惡劣環(huán)境的忍耐能力、計算機對圖像的檢測與識別能力等方面都遠超過人類,但正如曼徹斯特大學(xué)計算機科學(xué)教授凱文·柯倫所認為的:人類能夠辨認并區(qū)分現(xiàn)實世界中的事物、明確理解對話內(nèi)容,但最優(yōu)秀的人工智能也只能在理想的應(yīng)用情境中實現(xiàn)以上功能的一部分。”因此人的一些智能難能被模擬,人工智能在可預(yù)期的時間內(nèi)不可能全方位超越人的智能。
他進一步分析認為,AlphaGo既使看成是模擬人的學(xué)習(xí)、推理能力的一個人工智能產(chǎn)品,它是在“有大數(shù)據(jù),有好初值、有導(dǎo)師”的“三有”環(huán)境下完成學(xué)習(xí)任務(wù)的。既使AlphaGo的學(xué)習(xí)能力在特定場景下超過了人,但并不說明它的學(xué)習(xí)能力超過了人。比如人可通過很少的實例來學(xué)習(xí)識別,但是機器就不行,而AlphaGo只能在“大數(shù)據(jù)、有監(jiān)督”下學(xué)習(xí)能力超過人,不可能在“小樣本、無監(jiān)督”下學(xué)習(xí)能力超越人。
說到AlphaGo實際上是一個數(shù)學(xué)的組合優(yōu)化問題時,他說:“下圍棋任務(wù)是可建模、結(jié)構(gòu)化的信息處理問題,這只是一個困難的數(shù)學(xué)問題,并不是一個嚴格意義上的人工智能問題。該問題的解能用數(shù)學(xué)表達式表示,最優(yōu)解還能用數(shù)學(xué)的組合優(yōu)化問題嚴格刻畫。從數(shù)學(xué)角度和從信息處理的角度看,一個組合優(yōu)化問題,求解的難度只在于搜索規(guī)模的巨大,而搜索規(guī)模問題多年來已為計算機計算能力的提升而獲得一步步突破,所以AlphaGo的勝利只能說是溶入學(xué)習(xí)機制解決組合優(yōu)化問題的成功,而不能成為機器智能就超越人類智能的例證?!?/p>
以“人機大戰(zhàn)”正確審視人類智慧壁壘
透過硝煙彌漫的“人機大戰(zhàn)”,我們更應(yīng)該看到AlphaGo現(xiàn)實存在的意義和價值,它帶給人類未來發(fā)展的怎樣的深刻啟示。
談到“人機大戰(zhàn)”將帶給我們怎樣的啟示,就得從AlphaGo的勝利說明了什么談起。徐宗本說:“AlphaGo的勝利首先說明人工智能中的機器學(xué)習(xí)取得了重大進展,展示了機器學(xué)習(xí)和大數(shù)據(jù)的價值與力量,再次展示了學(xué)習(xí)是可模擬的,而且可達到令人難以置信的程度,由此人們可期望一個陪護機器人會在人的培養(yǎng)下,可以變得‘越來越像人樣’;其次,說明人工智能技術(shù)的核心是算法,更加凸現(xiàn)算法的核心作用和理論的巨大價值,展現(xiàn)了人工智能技術(shù)的性態(tài)特征;最后由于圍棋一直被認為是人工智能領(lǐng)域一個非常具有標志性的大挑戰(zhàn),AlphaGo的勝利點燃和將推動人工智能領(lǐng)域?qū)崿F(xiàn)人類級別能力任務(wù)的希望和進步?!闭劦紸lphaGo勝利的意義,徐宗本院士如是說。
在他看來,AlphaGo勝利背后的最大價值在于,它激勵人們持續(xù)不斷地探索過去人工智能領(lǐng)域一直看似難以實現(xiàn)的人類智能級別的任務(wù),特別對于像優(yōu)化布局、合成設(shè)計、管理決策等能夠被抽象為“圍繞一個整體目標,須從當前很多的可能中做出選擇來實施決策”這類組合選擇問題。其次啟示人類探索解決組合選擇問題的新方法論,如使得在選擇中溶入學(xué)習(xí)機制并利用已有數(shù)據(jù)指導(dǎo)選擇、利用計算機的分布式并行方式處理、利用大數(shù)據(jù)思維簡化近似算法設(shè)計等。再次啟發(fā)人類更深入地思考人工智能發(fā)展的一些關(guān)鍵問題,推動該領(lǐng)域的科學(xué)快速發(fā)展。
“人機大戰(zhàn)”帶給我們的啟示是人工智能研究只有結(jié)合問題才能取得突破。他認為,類腦技術(shù)是實現(xiàn)人工智能的重要途徑,但應(yīng)更加強調(diào)“腦啟發(fā)”技術(shù),不應(yīng)“類”而類,應(yīng)堅持“應(yīng)用驅(qū)動”導(dǎo)向。人工智能的本質(zhì)性突破會來自人們對大腦自身和智能本質(zhì)理解的突破。類腦技術(shù)是從這一觀點出發(fā)的實現(xiàn)人工智能方式的總稱。如果接受“人和機器名自有各自特長方面”的話,人工智能的發(fā)展就不必拘泥于其技術(shù)與真實人類智能對等相同的程度,否則人工智能和人類都不會彼此超越。
其次,徐宗本認為腦科學(xué)與認知科學(xué)是人工智能發(fā)展的源動力,應(yīng)從戰(zhàn)略高度認識,人工智能應(yīng)朝著“擴充和延伸人的功能來完成人很難完成的任務(wù)”之方向發(fā)展。人工智能的目標應(yīng)該是:綜合運用最新技術(shù),在某一或更多方面超越人類智能。腦科學(xué)研究應(yīng)關(guān)注“機器還沒有達到人類水平但應(yīng)該能夠達到甚至超過的認知機理的揭示上”,也應(yīng)關(guān)注人之“弱項致因”的研究上;而人工智能研究,要強化先進技術(shù)的綜合運用,任何人工智技術(shù)的成功一定是當代最新技術(shù)綜合運用的成功,片面說成是“誰戰(zhàn)勝誰”是不公平的,也是無意義的,說人類智慧的最后壁壘被攻破,這都是無稽之談。
徐宗本認為,“人機大戰(zhàn)”后我們更應(yīng)該清晰地認識到人工智能的發(fā)展應(yīng)是堅持應(yīng)用驅(qū)動的導(dǎo)向,類腦應(yīng)更加強調(diào)“腦啟發(fā)”技術(shù), 而不應(yīng)為“類”而“類”,人工智能要立志超越人類,并走為人類服務(wù)的發(fā)展線路。(謝霞宇 張行勇)
來源:《中國科學(xué)報》