跳槽、行業前景、模型等創業者想問的,鄧力這樣說

學識都 人氣:1.29W

2017年5 月25 日晚,剛剛宣佈加入 Citadel 的前微軟人工智能首席科學家、IEEE Fellow 鄧力參加了由中國科大百人會和阿爾法公社聯合主辦的人工智能產業機會研討會。

鄧力攜手另外兩位 IEEE Fellow:中國科學技術大學信息科學技術學院執行院長吳楓和科通芯城集團及硬蛋科技的 CTO 李世鵬,與十多位不同行業的創業者、技術人員促膝而談,回答了他們關於人工智能領域,尤其是關於人工智能技術如何在不同行業得到應用的一系列問題,機器之心對此做了梳理與總結。

Q:近年來,人工智能在哪些領域取得了重大進展呢?對現在和未來幾年的業界有哪些直接影響?

鄧力(以下簡稱鄧):我認爲最大的突破是深度學習被引進人工智能領域。它推動了幾個垂直領域世界範圍內行業慣用方法的變更,分別是語音識別、圖像識別和機器翻譯。還有一些領域有突破的跡象,比如銷售的數據和自然語言的數據做結合。下一步可能會有更多領域,如健康、金融,進入快速發展階段。金融領域發展速度很快有兩個原因,一是數據充足,二是目標清楚。有一點像 AlphaGo,輸贏一目瞭然,而且可以自己對抗。

李世鵬(以下簡稱李):在應用層面,人工智能應用在了許多意想不到的領域,獲得了不俗的成果。比如在農村金融和畜牧業領域,通過給豬植入芯片,讓它成爲抵押物,信貸機構能夠獲得第一手信息,以此爲依據發放貸款和銷售保險,解決了農村信貸難以量化的問題。

Q:鄧力博士,您爲什麼從科技行業轉向金融行業?

鄧:因爲金融行業機會比較多。在硅谷十七年,人工智能哪些領域可以做哪些領域不可以,基本都知道。同時在現有職位感覺自己的成長已經基本飽和,想進入一些更大的領域進行探索。本來健康領域也一直在我的考慮範圍內,但由於隱私問題,數據私有化現象十分嚴重,尤其在美國,項目如何落地、如何盈利,還有很多未解決的問題。金融領域行業數據相對公開,比較容易成功。

Q:在金融領域已經有很多機構嘗試應用了人工智能,比如 Bridgewater,比如 Renaissance。在不同的機構裏,人工智能發揮的作用相同嗎?

鄧:不清楚。因爲金融領域不像科技領域那麼開放。科技領域的開放、開源,會帶來整個平臺的提高,從而創造價值。而金融領域的對抗性更強,一旦對手學會了你的方法,你的方法就沒有用了。而且科技領域即使方法相同,對手沒有數據也無法複製你的成功,金融領域的數據則相對公開。

Q:在 Citadel 這樣的機構裏,交易員和人工智能科學家的工作有什麼區別?

鄧:我其實不瞭解交易員的工作,但人工智能科學家的工作邏輯會和 AlphaGo 做圍棋有點像。圍棋如此大的一個搜索空間,人工智能仍然能獲得很大成功,其根本原因是規則確定,且自行對抗的時候輸贏作爲輸出也一目瞭然。金融領域的問題也類似,結果一目瞭然,唯一的區別在於圍棋的規則確定性更強,金融則更爲複雜,除了兩方博弈,還要考慮多個狀態間的互相關聯。

Q:傳感器讓我們獲得了關於世界的大量數據,在此基礎上,人工智能能帶來多大的加成?

鄧:嚴格定義裏,機器學習有兩種。一種是如今的深度學習,給定輸入輸出後,中間複雜的關係不再需要人撰寫規則進行特徵提取。它的好處是可以用非常基礎的模型把過去需要大量背景知識來建立複雜模型的工作自動完成,侷限性是解釋性有限。另一種老的基於規則的機器學習方法則能夠給出解釋性,結果不是很好,但是出了問題後知道如何改正。我認爲將來的發展方向是,將新方法和老方法結合在一起,取長補短。結合得比較好的話會有一些不一樣的成果。

Q:我們是一家做人體動作捕捉的公司,傳統做法是藉由陀螺儀、加速度、電磁等傳感器,測量骨骼並對人的動作並進行建模。然而由於測量精度已經基本達到傳感器的極限、傳感器成本無法再大幅度下降等問題,導致動作捕捉技術的應用場景非常有限。請問深度學習能否對強烈依靠測量的動作捕捉領域有所改進呢?能否讓我們可以用更少的、更簡單的傳感器來增強移動性和實時性呢?

鄧:近期的深度學習有一個新的概念叫 GAN(生成對抗網絡)有可能幫你們解決這個問題。現在它主要還是在圖像生成領域,如果你能將它擴展到動態領域那可能對你的工作比較有幫助。GAN 和之前模型的主要區別在於,之前模型直接從數據進行生成,很難保證它和真正的圖像沒有區別,GAN 的基本思想是,讓生成出來的`圖像(或視頻、自然語言)即使和訓練數據放在一起,也看不出區別。它的實現原理是建立兩個神經網絡,一個叫生成器,一個叫鑑別器。鑑別器負責判別一幅圖像究竟是真的圖像還是由生成器生成出來的。兩個模型同時訓練,最後期望達到的效果是鑑別器分不出來圖像的真假,這時候的生成器,給定一個隨機變量,就能夠生成一個和原來數據沒什麼區別的數據。

吳楓:在可行性方面,我的答案是肯定的。你的工作是將傳感器輸入變成關節參數,這和機器人行走領域很像。2015 年開始有人工智能方法進入機器人行走領域。以前的機器人一定要傳感器的反饋,然後進行判斷、做出動作。但是很多特殊的行爲是來不及等傳感器數據的,數據處理完了,機器人已經失去重心摔倒了。因此研究人員用神經網絡,在只有少量信息(比如傳感器被遮擋得非常厲害)的時候,對未知信息做出估計和預測,進而做出決策。這是神經網絡完全可以做的。在實時性方面,這個挑戰很大,主要受到計算能力的制約。實際上在人工智能的發展中,計算資源是主要的一個制約因素,如果有好的計算能力,很多方法都可以投入應用。現在很多人在做神經芯片,比 TPU 對矩陣的加速還要更進一步,用高密集度,比如百萬個核,用仿生結構實現高效率低能耗的計算。