幾天的國慶假期很快結束了,顧玩帶着妹妹和女朋友回到學校,恢複到正常的學習生活中。随着gps和as項目都告一段落,顧玩手頭的科研任務确實閑下來一些。每天隻要上上課,考考試,泡泡圖書館,連實驗室都可以不去了。不過,他就像黑夜中的螢火蟲,注定是不會讓自己生蛆的。所以沒過幾天,他就找到了丁院長。“院長,我想發一些跨專業的論文,搞一些跨專業的課題,這事兒不違反學校紀律吧?”顧玩也不預約,當天中午徑直走進院長辦公室,直接就攤牌。當時還有個副院長、以及院長的助理在旁邊看着呢。丁院長都微微吓了一跳:“咋了?受委屈了?還是突然腦子犯抽,想換專業了?”旁邊那個副院長出言打圓場:“院長您别多慮,說不定是小顧同學能者多勞,興趣涉獵廣泛而已。”顧玩還沒接話,丁院長倒是跟副院長一問一答,自我腦補起來了:“原來你是想修二專業啊,以你現在的成績,這當然是沒問題的了。你可是科技部表彰過的人了,校長也會給你特批的。何況,我們學校本來就允許修二專業。”這事兒就這麽決定了?自己可沒打算雙修二專業啊,隻是想跨圈稍微搞一搞深度學習人工智能的基礎有木有!但學校領導已經這麽決定了,顧玩也就接受咯。一切手續很快搞定。上面标示學分什麽的不重要,有空稍微多修幾門數學課,就算二專業的标準達到了。實在不想修,隻要論文夠,一樣算過。得到這個承諾後,顧玩讓麻依依也去試試雙修,看能不能申請下來。麻依依就沒那麽大面子了,畢竟沒在科技部表彰大會上挂過号,所以一切還是要公事公辦。最終咨詢的結果是雙修可以,但學分不能打折沒有優惠。面對困難,麻依依不禁要多問幾句老公的打算:“你到底希望我修個啥?”顧玩回答得很直接:“修個心理學分支下的認知神經科學方向好了——這是一個心理學跟腦科學交集的專業。”麻依依一臉懵逼。顧玩卻知道,他選的這個方向,與地球上傑夫辛頓當年搞深度學習時的路徑,幾乎是如出一轍的。憑心而論,傑夫辛頓的能力也不算多逆天的科學家,但他成功了。這裏面努力和方向正确占八成,但還有至少兩成是運氣和環境。深度學習型人工智能的成功,得益于其他地球人的固有技術偏見——在此之前,很少有人從“挖掘人腦的深層學習機理究竟是怎樣的”這個角度,來思考訓練機器學習的問題。所以,誰這麽想了,而且第一個付諸實踐了,就能撿到漏。當然了,這個漏也不是阿貓阿狗都能撿的,論證過程比較複雜。通俗地說,你至少得是個世界名校的計算機和神經認知科學領域雙博士,你才有資格在方向對的前提下,撿到這個漏。連個盟校雙博士都做不到的人,天大的機會白白送到他面前,他撿都撿不起來。另外一方面,顧玩也深谙地球上人工智能發展的另一個重要契機——在深度學習和卷積神經網絡發展起來之前,這條技術路線的認可度并不高,因爲這條技術路線哪怕試水到04年,初步原理略微跑通了,學界也依然發現有問題:這個算法的缺點,是訓練效率太低。也就是說消耗的算力極大,而機器學習的進步速度其實很慢,還無法進行白盒邏輯解釋,也就無法通過人工幹預/“教導”來讓機器的學習速度加快。當時還有另外兩三條技術路線,那些路線的優缺點正好與深度學習相反。那些訓練方法白盒化程度更高,也就是機器學習的決策過程的可解釋性,人類更能理解,也就更容易幹預,便于人類“手把手教機器快速進步”。而這些算法的缺點,就是“學習進化的上限比較低”(這裏是籠統概括,實際科學原理比這個複雜得多。但是寫給外行人看,隻能這樣不太準确地類比一下了。)換句話說,要是人類繼續被摩爾定律束縛、靠電腦pu運算速度的技術提升,來滿足訓練算力的話,那麽那些白盒度更高、更容易用少量算力就初步訓練出成績的人工智能學習路徑,說不定就能在曆史選擇中勝出“深度學習/卷積神經網絡”這條技術路線了。但是,地球上偏偏在你2007~2009年,誕生了分布式架構算力設計。這玩意兒,最初是出現在很多矽谷it公司,那些程序員嫌棄代碼寫好後、編譯速度太慢,甚至覺得光靠專門的編譯服務器都不夠用,所以天馬行空地創新出一個“分布式編譯架構”,讓一家公司裏所有同一局域網内的電腦,都可以加入這個架構,然後把編譯任務拆分分配給所有電腦,讓所有pu共同分包編譯。分布式編譯是從07年出現的,一兩年之内,這玩意兒就成長成了“雲計算”。有了雲計算之後,應用就很廣泛,而雲計算對人工智能訓練的最大影響,就是某個智能在執行機器學習的時候,不用再受限于這個機器人本身那顆pu的算力了——機器人自己的pu不夠快,可以接入雲,用雲上的幾千幾萬台機器的pu幫你一起算。這時候,摩爾定律就不重要了。隻要算力任務能高效拆分,單顆pu弱一點就弱一點了,咱可以芯海戰術堆數量嘛。如此一來,其他那些“算力效率更高、白盒可解釋性更強、但訓練上限和自動化程度更低的算法”,一下子就争不過深度學習了。因爲深度學習原先最大的瓶頸,就是黑盒,算力效率低下。但雲計算的出現,讓算力瞬間沒那麽值錢了,可以大水漫灌狂訓你。……這些道理,顧玩心知肚明,不過他沒法全部告訴麻依依。他隻能鼓勵麻依依,讓她往這個領域布局,夫妻倆暫時把外圍科技先湊起來。幸好,時間上也不是非常緊急。地球上傑夫辛頓讓學界接受深度學習,就花了兩年。至于後來從學界承認到産業界承認,又花了四年——其中三年都是在等雲計算的出現。他的成績06年在學界就初步被認可了,但09年雲計算才正式出現,2010年傑夫辛頓才被谷歌高薪挖走。後世的人工智能,用一句話概括運作原理,就是“使用雲計算的算力,用深度學習算法處理學習大數據”。算力,算法,大數據。三要素裏,從技術難度來說,最先有的是大數據,這是一種資源,有稀缺性,但卻沒有技術含量,所以是最早出現的。算法,或者說深度學習的思路,是第二個出現的(06年)用這種算法處理這些數據的算力,是最後出現的(09年)三要素都齊了之後,第二年地球上谷歌就開始在這條路上狂奔了。顧玩覺得,就算自己開了挂,也有1年多的時間,先把基礎算法方面的架構性論文發完。具體追求産業界應用的事兒,将來去留學開公司期間再說好了。而且,把算法淵薮階段的論文,在中國念書的時候就發表,将來也好撇清跟老外的關系——咱可不是去斯坦索姆留學後,才琢磨出這些玩意兒來的,一開始在中央科大念書,就已經有這方面的建樹了,功勞都是中國人的。讓麻依依認識清楚這一切節奏後,顧玩明确分配了任務:“你今年除了修學分之外,我就給你兩個文的任務。第一,你在計算機本專業領域,琢磨一個分布式編譯的活兒。把架構想出來,在你們數科院的項目公司也好,研究所也好,先試着幹起來。确有提高效率,就可以把這篇實驗性的論文發出去了。第二,在你雙修的認知神經科學領域,我希望你發一些人腦神經學習效率方面的研究——跟計算機沒關系,就是研究活人的學習效率,多做對照組,具體實驗設計,我會幫你一起參詳的。這些論文不會直接産生商業價值,但是會讓你我有資格在相關領域的頂級期刊稍微混點臉熟,進入圈子。”顧玩原先也發表不少論文了,但可惜都是物理類的。正所謂隔行如隔山,一旦他想進入數學/計算機算力架構/認知神經科學,重新刷臉刷聲望,肯定是免不了的。就跟你打魔獸,哪怕奧格瑞瑪崇拜了,幽暗城還得重新刷不是。當然了,你奧格瑞瑪崇拜,對于你幽暗城聲望的刷速度肯定略有幫助,比你一個所有聲望都沒有的純萌新,肯定要容易一些。麻依依還是沒太明白老公分配的具體任務,但她覺得這不妨礙她搞個人崇拜,盲目迷信跟着老公的思路走。“我這學期還是先從分布式編譯下手吧。我本來就是學計算機的,我覺得這個容易寫,也容易發表。”麻依依讀大學這一年多來,也是發過論文的,不過一共隻發了兩篇,還都是在本校的《中央科大學報》上。這個成績跟其他本科生,甚至是其他想當交流生的頂級優等生相比,已經很牛逼了。但是跟她老公一比,那就簡直是菜的不行。這次的分布式編譯架構,她決定鼓搗出來後,發到外面的期刊上,最好還是外國的。