作者:韋青
來源:北大縱橫
今天非常高興跟大家交流一下關于《深度學習》這本書的體會。我看完這本書之后非常喜歡,希望借這個機會和大家介紹一下這是一本什么樣的書,我們該以什么角度看待這樣一本書,在這個大時代背景下我們怎么理解這本書出版的意義,這本書背后的知識將為我們帶來的新的看法。
這本書是業界大拿出的書,作者本人經歷非常豐富。他是學物理的,同時還學生物科學,研究神經網絡。他的背景像業界知名的人工智能專家學者,他們的研究都是覆蓋多個領域。一方面以數學為主的,以數理化為主的科學領域,另外一方面以醫學、生物學、神經學為主的領域,兩者結合恰恰反應了這個時代的潮流。
以史為鑒,重新認識科技進步
在全球范圍內由于技術的進步引發的新話題層出不窮,我們不斷接收到新的理念。越來越多的公司和人發現,人類開始進入“無人區”,沒有一個大思想家或者大哲學家能夠告訴我們未來會怎么樣。所以人們產生了很多爭論,關于人工智能的爭論,關于機器智能的爭論,關于機器人的爭論,關于技術和人類關系的爭論等等。
去年10月份微軟公司CEO薩提亞的一場非常有名的演講上說,未來沒有人引導我們,那么我們可以以史為鑒,看看歷史上發生過什么。最有代表性的就是第一次工業革命到第二次工業革命之間,由蒸汽時代進入電氣化時代。我把這個階段總結為四種態度和四種結局。當時有很多有影響力的全球性的公司,他們用蒸汽力量代替人的四肢。但當電氣出現的時候,絕大多數公司態度是看不起電,因為開始的階段電的效率并不夠高。
第一類公司的想法是電力不行,效率低,沒有未來,蒸汽力量足夠了,一百年之后他們被淘汰了。
第二類公司放下一些包袱,認為電是新生生物,也有潛在發展的可能性,但是仍然堅信蒸汽機的力量,堅信只要對蒸汽機進行改良一樣可以保持競爭力,這些公司也被淘汰掉了。
最可惜是第三類公司,他們已經放下舊的生產力,開始擁抱新的生產力和形成新的生產關系,但是思維方式沒有改變。他們認為自己全面擁抱電氣化時代,已經產生比蒸汽機時代超高的效率,更低的成本,但是他們還在跟蒸汽機相比,這些公司最終也被淘汰掉了。薩提亞在會上提到,我們做了一些粗略的分析,只有不到5%的公司在那個時代完成了轉型和飛躍,真正進入了電氣化時代。
當時大部分企業對于電氣化的觀念只是能點多少盞燈,或者生產線能夠提高多少效率。只有5%的公司選擇徹底放下包袱,忘記什么是電氣,什么是蒸汽,而是把它們都當成是工具。這些公司要的就是進入新的時代。這代表更高的效率,更低的成本和更優秀的用戶體驗和產品品質。
通過歷史上的事件可以發現,我們現在對未來的任何預估都是不足夠的,都可能沒有完全估計到未來的沖擊力。
在五六十年前,全中國人民都有一種對未來社會的憧憬——樓上樓下電燈電話,這在當時來說是非常具有前瞻性了。當時的人們認為已經看到了最終最理想的社會,但是幾十年之后再看,當時的憧憬并沒有那么遠大。從人類從開始考慮到用電到電的普及,已經有一百多年的歷史。我們發現電不僅僅可以點燈,不僅僅可以驅動電器,不僅僅可以驅動電機,甚至還可以有計算機,還可以驅動一輛汽車,電力比原來的內燃機要更加高效、更加可靠和更加優秀。
我們跟客戶的交流中也有思考,是否需要做思維的轉變,才有可能真正理解這一輪技術變革是怎么回事。如果我們還抱著老的觀念,抱著產生問題時候的觀念,我們真能夠理解這個偉大的時代將帶給我們的輝煌未來嗎?我們是否需要先把我們認為的所有成見都放掉,然后再來看現在的技術到底怎么回事?我們也知道深度學習只是機器學習、人工智能的一部分,我們要把深度學習的包袱也放下,擴展到我們進入的這個時代來思考。
不管從1956年的達特茅斯會議,還是更早的圖靈時代、馮?諾依曼時代、香農時代,他們都有對于人工智能的理解,都有對于計算機到底能做什么事情的理解。我們并不是直接進入了機器學習的時代,中間還有一個階段是希望通過邏輯的關系。我們知道都有一種服務If This Then That,也就是IFTTT。這種服務充能夠理解人的邏輯思維。比如說If我餓了,Then我要去吃飯。If我是北方人,我餓了,Then我愿意吃的是面而不是米飯,用這種方式試圖解讀人類決策機制。后來發現比較困難,一些專家認為這條路走不通,所以選擇用模仿腦神經的機制來做決策,通過這種思路才有了今天這本《深度學習》的誕生。
現在很流行說云時代要結束了,未來幾年都是邊緣智能時代,為什么?其實這和學習能力也是相關的。在某種意義上可以把人類看做是一個發電機,我們之所以要吃碳水化合物,還要呼吸氧氣,是因為我們在以氧化的形式進行燃燒,產生能量、產生電力。我們之所以看到東西其實不是真的看到,而是把光子變成電子,大腦去分析電子產生視覺,聽覺也是一樣。
由此開始,一批科學家開始探究人如何學習,怎么高效學習。雖然作者是深度學習和機器學習的專家,同時他也是人類學習的專家。這本書也是教人類怎么學習。我們業界很多專家學者始終想和廣大受眾強調,不要把機器能力神話,機器自始至終都在充當代替人的某種機能的角色,目的是減輕人的某種負擔。
在歷史上的某個階段,古人類開始發現和使用工具,比如用骨頭或者石片可以敲東西,完成手完成不了的能力。著名的科幻電影《2001太空漫游》中有一個非常著名畫面,猿人忽然有一天發現可以拿骨頭去敲另外一個骨頭,可以把別的骨頭敲碎,這就是人類歷史上大的進步。他就發現這個骨頭不僅可以敲骨頭,也可以敲肉,可以敲瓜果,敲野獸,也可以用來防身。那時候人類發現,原來可以拓展四肢的能力,利用外部工具去提高自己的能力。
工業革命之后,人類發現不僅靠傳統的工具,還可以靠各種機械的力量代替人類的四肢。我們現在不會無聊到說在肌肉能力方面還可以跟機器一拼,比如去和一輛汽車比賽跑步,應該沒有人會這樣做了。其實不僅是肌肉的機能,我們連計算的機能都都已經被淘汰掉了。有沒有人可以馬上開7的3次方?應該沒有。我們可以十幾塊錢買一個計算器,計算器就可以做到。我們為什么對這種現象不會抱恐懼心理,而對人工智能抱有莫名其妙的恐懼心理?
我們能不能抱著這樣一種態度,不是僅僅了解深度學習,而是通過深度學習了解機器學習的原理,通過機器學習原理了解人類學習的機制,進而了解人類智能的運作機制,然后才能夠深刻理解人和機器智能特點分別是什么。
取代我們的不是AI,而是被AI賦能的人
最近也有媒體報道提到,經過14年努力,微軟回到了市值第一,幾星期之后可能亞馬遜又變成了市值第一。這恰恰反映了薩提亞說的特點,這個時代只尊重創新。你昨天是專家,如果你不趕上時代潮流,明天肯定就不是專家了。現在是一個末日感比較強的時代,大家總擔心錯過機會機會輸在起跑線上。巨變的時代,沒有起跑線的概念,每天都是起跑線,稍微一放松腳步就會被人超過去,這個時代是壓力很大的時代,同時也是機會很大的時代。
理解時代特點,我們要了解深度學習,了解機器學習,進而了解人類學習特點,但是更重要是什么?我們要號準時代的脈搏,要知道在這個時代要采取什么樣的態度和策略,才能夠跟上時代的腳步。我們既不要成為時代的棄兒,也不希望成為烈士,我們最希望成為一個先行者。這個時代最大特征就是機器從代替人的四肢開始,已經于無聲處開始代替人的大腦,甚至會慢慢代替所有能夠出現模型的人類能力。明白這一點我們才可以理解所處的時代。
面對深度學習和人工智能的發展,一種人選擇放棄自己,一種人會產生絕對的抗拒心理,不去主動擁抱這種能力,這都是有問題的。因為這種能力確實很強大,你不去擁抱的話,有可能被去擁抱這種能力的人類所淘汰掉了,被他們產生降維打擊的能力了,這個其實很危險的。與其說是機器或者人工智能,或者機器智能會代替人,倒不如說掌握了機器智能人類變成一種超人類,他們會把不具備這種能力的人類所代替掉,或者所降維打擊掉。作者特倫斯的良苦用心是希望我們做一個合格的地球人。為什么不是說作為一個美國人或者中國人?因為地球上的人類都面臨這樣的挑戰,都面臨我們如何跟機器智能相處,如何提高我們能力,才能使我們具備更高的能力來應變這個時代的挑戰。人工智能帶來的這種降維打擊還是很強大的,如果我們不認真的應對,去努力學習,并且去積極擁抱這種能力,有可能就真的被降維打擊了。
技術是拿來用的,而不是拿來吹和炒的
很多業界專家都有這樣的感受,現在媒體對人工智能的炒作過熱,反而讓廣大讀者,甚至是決策者失去了去這件事的核心把握。人工智能的核心實際上就是機器學習的能力,就是一種機器智能。現在主要表現方式是深度學習,但并不意味著我們曾經嘗試的符號學,用邏輯推理的方式其實并沒有過時,只不過還無法實現。現階段深度學習取得了巨大突破,引領大家進入到新的未來。新的未來里面會不會是深度學習和其他人工智能、機器學習的方式共存的方式?我們并不知道,所以我們不要排斥這種觀點,尤其不要認為現在就是深度學習這一種學習方式。未來應該是人類的學習能力、機器學習能力、深度學習能力和邏輯推理能力是共融共生的階段,這可能是更加客觀描述未來時代特征的一個方面。
智能時代之前的深度學習要靠數據的堆積去學習和驅動。但是現在的數據既不夠大,也不夠好。雖然我們有很多數據,但是并不算真正的大和好。大數據的概念并不是多,我們數據結構和數據來源沒有形成萬物互聯的社會,物聯網沒有布設到,5G沒有到位,可能數據不夠那么多,不夠那么好。支撐萬物互聯的基礎架構恰恰是一個云計算的架構。所以倒著講是智、大、物、云,正著去演繹是云、物、大、智。
如何理解人工智能
如何理解人工智能我總結了四點:首先,一定要應用。如果我們去學了“學會如何學習”的課程就會發現,現在最流行的方式是Problem-Based Learning,就是以問題為導向的學習,以實際解決問題方案的學習。未來是終身學習的時代,不存在大學畢業之后就不學習了。如何終身學習?一定要帶著問題去學,這樣學得越來越深入,學得越來越有用。人工智能也是一樣的,它是一種學習的過程。學習不能為了學而學,一定是問題為導向的。
我的第二個觀點就是,深度學習的發展不僅僅要靠數學的進步,不僅僅要靠計算機科學的進步,還要對人類自己的神經、腦神經、傳輸神經、感知神經的理解,才能知道是怎么回事。
現在我們每個人有基礎的學習能力,機器學習也是一樣,只是通過開放的接口開放學習的通用能力。未來每個人一定要在通用能力之上,掌握行業的學習能力,才能夠真正為人類帶來更大的福祉。
第四點就是要真正產生深度學習能力,我們需要有數據,需要有人才,還要有算法和算力。像微軟這樣專業公司可能會提供更強大的算法和算力,更多的公司需要在人才培養,數據收集上面下很大功夫,這樣才能產生互動的促進作用。數據、人才、算法、算力這四者缺一不可。每一方面在未來都巨大的商機,正是因為我們即將進入智能社會,商機恰恰不是只在智能本身,而是各個方面。
沒有專家的時代,每個人都要終身學習
最后我還有兩個觀點。我用盲人摸象的寓言來舉例,這個時代是沒有專家的時代,我們每個人都在學習。不存在輸在起跑線上,因為每天都在新的起跑線,我們只要不放棄學習,不放棄自己,不要認為我到了某種年紀或某種地位,我就不去學了,也不要因為我是學文科或者我是學理科的我就不要再學其他的知識。未來需要的是天天學習。因為這個偉大時代還沒有來,我們最多是摸著大象的其中一部分,所以每個人都有可能成為最終摸到大象整體的那個人。
第二點,正是因為這個時代沒有專家,同時也是沒有所謂的公理的時代,每一個理論都有可能成為當時可行的理論,但是并不意味著能夠成為永遠的理論,永遠成功的法則。我們要去學習,不要唯各種專家,不要唯新,更重要唯實,你自己去試,小馬過河,水是深淺只有自己知道。聽別人說可以,包括我現在講的,這也只是我在微軟這么多年的體會和理解,并不代表所有人體會和理解,尤其不代表是否是正確的。我們不妨能夠自己去試一下,大膽去試發現原來水既不像A說得那么是深,也不像B說的那么淺,對你來說最適合的就是最好的方法。
最后以比爾?蓋茨先生的這段話作為結尾:“人們大都傾向于高估他在一年內所能完成的事情,但又容易低估他們堅持十年后能夠取得的成就。”大家一定要明白,第一沒有專家,第二沒有起跑線,第三每天都在重新更新有新知識新理念出現,我們先不要放棄自己,同時把握最基本的對自己的自信和信念,認真學習。