“每一個位置空出來,我馬上就想,如果全的人隨便我挑,我會讓誰來坐這個位置?”并不掩飾追逐“科技大牛”們的野心,這是百度董事長李彥宏的用人原則。5月16日,伴隨吳恩達正式加盟百度,這位愛好上網、自稱是“半個IT宅男”的百度公司掌舵人,悄悄在自己實時更新的“人才目錄”上重重劃下一個鉤。
吳恩達是誰?
這個在國內用戶中顯得陌生的名字,在大洋彼
此前谷歌收購了多家機器人公司,而國內的百度也開始動作了,大力招攬人才開發“人工智能”。“谷歌大腦之父加盟百度!”事隔近一月,這條消息帶來的“余震”仍在大洋彼岸的硅谷科技圈蔓延著。5月16日,百度宣布任命吳恩達為百度首席科學家,全面負責百度研究院。“這會在互聯網行業再次掀起一股人工智能的熱潮。”作為國內同行,南京大學機器學習專家周志華興奮地說道。
硅谷“挖人”只花10天
“每一個位置空出來,我馬上就想,如果全的人隨便我挑,我會讓誰來坐這個位置?”并不掩飾追逐“科技大牛”們的野心,這是百度董事長李彥宏的用人原則。5月16日,伴隨吳恩達正式加盟百度,這位愛好上網、自稱是“半個IT宅男”的百度公司掌舵人,悄悄在自己實時更新的“人才目錄”上重重劃下一個鉤。
吳恩達是誰?
這個在國內用戶中顯得陌生的名字,在大洋彼岸以及全球科技界卻是個響當當的光環人物。他有著眾多頭銜,作為學者,他是斯坦福大學計算機科學系和電子工程系副教授、人工智能實驗室主任;作為企業家,他是在線教育平臺Coursera的聯合創始人;尤為重要的是,他曾一手創建和了谷歌的深度學習團隊,開啟名噪一時的谷歌大腦項目,被稱為“谷歌大腦之父”、“谷歌大腦背后的X教授”。和多倫多大學的GeoffreyHinton、紐約大學的YannLeCun一起,被譽為“人工智能三大專家”。
盡管和谷歌這樣的科技公司一直有合作,吳恩達一直并未真正加入其中的某一家。今年3月,當他向身邊朋友透露想進入工業界的想法時,不需要發布任何求職簡歷,這個消息迅速被谷歌、FaceBook等各家互聯網大佬獲悉。百度是其中一家。
“我們不是出價的一方,恰恰相反,還比一些競爭對手的價格低了不少。”百度大廈5層的一間小型會議室里,百度級副總裁王勁回憶這場火藥味十足的競爭,興奮之情溢于言表。
挖人,無論對當時正在美國硅谷親自邀約吳恩達的王勁,還是在北京坐鎮的李彥宏都并不陌生。就在一年前,百度同樣參與了對“人工智能三大專家”另一大佬GeoffreyHinton的競標。在這場每隔半個小時就報價一次的競標中,百度出價甚至于對手,卻在競標過半時被谷歌“橫刀奪愛”。
這一次,相似的故事有了完全不同的結局。
幾次在美國當面溝通之后,王勁認為時機已經接近成熟。4月,王勁邀請吳恩達來到北京,與李彥宏吃了一頓飯。在這頓長達3個小時的午餐里,討論的話題從兩人都感興趣的人工智能開始,順利延伸至百度研究部門形態和將要解決哪類問題。“我不要求好的收入。我希望來幫助你們。”吳恩達就這樣接下了百度首席科學家一職。
此時,距離吳恩達的好朋友、百度深度學習實驗室負責人余凱次向他提出邀約,不到10天時間。
百度大腦具備2至3歲孩子智商
“百度會是幾家中跑得快的。”對于為何選擇百度,吳恩達給出了自己的理由——百度的執行能力讓他吃驚。
這也是在國內“BAT”(百度、阿里、騰訊)互聯網級俱樂部中為低調的李彥宏近年來在下的一盤大棋。在多個場合,屢屢被問到和另兩家如何競爭時,李彥宏總是會拋出一個詞,“厚積薄發”。
什么是人工智能?這個不足10字的問題卻是一厚摞學術專著都難以概括的。原因無他,人工智能涉及眾多領域、枝蔓復雜,讓機器人從處理自然語言到處理語音、圖像識別的“深度學習”技術是其中一角。
2012年6月,吳恩達操刀完成的科技界經典的“識別貓”正是一個經典案例:1.6萬臺電腦模擬一個人腦神經網絡,向它展示1000萬段隨即抓取的視頻,在沒有任何外界干涉的條件下,這個網絡自己認識到貓是什么,并找到了貓的照片。
2013年年初,百度成立深度學習研究院,李彥宏親自擔任院長。這個研究機構用了競爭對手不到一半的時間就構建起動力澎湃的計算平臺,用于大規模模型訓練;目前百度大腦已經具備2至3歲的孩子智商,擁有200億個參數,構造起大的深度神經網絡;過去一年,百度的圖像識別能力已經做到了全球一流水平,穩坐國內把交椅,識別度達到92%左右,過了過去15年識別率增幅的總和。
李彥宏近在讀一本書,《奇點臨近》,“技術臨近突破點”的觀點讓他興奮。一組數據顯示,截至2014年季度,百度研發費用三個季度連續過十億元,2013年第三季度研發支出為10.91億元,第四季度為12.64億元,2014年季度為12.77億元。
“互聯網公司平均把營收的7%投入研發,百度投入的比11%還要多。隨著營收不斷增長,研發投入還在繼續增加。”王勁說道。
未來兩年百度大數據引擎不談收入
“未來兩年,你不要問我有沒有收入。”今年年初,領下百度“大數據引擎”開放項目,王勁提了個要求。沒有猶豫,李彥宏爽快答應。
今年4月份,百度宣布開放全球首個“大數據引擎”,一直在后方深耕細作的技術積累面向整個社會。在這幅百度提供的愿景中,開放云通過分布全國的百度數據中心,可以為傳統行業提供大規模的數據存儲和分布式計算。在此基礎上,數據工廠則對行業數據進行一系列規范化處理,提供數據管理和分析能力。更上一層,百度大腦則可實現前瞻性的智能數據分析和預測功能。
吳恩達和他代表的人工智能研究技術,正是實現這幅愿景的關鍵環節。
作為整個百度的智囊團,百度研究院目前包括三大實驗室,硅谷人工智能實驗室、北京深度學習實驗室和北京大數據實驗室。未來,吳恩達的工作重心也將是這三個實驗室。盡管目前剛剛開張的硅谷人工智能實驗室還只有幾名研究員,但到2015年它就將擴大成一支200人左右的國際化團隊。
就在吳恩達宣布他加盟百度的當天,就有6位在人工智能方面的知名研究學者來申請百度的職位。和此前客氣居多的態度截然不同,吳恩達將成為百度下一步吸攬人才的一面“活招牌”。
事實上,大數據早已成為百度的一大“生財之道”。以應用了百度深度學習技術的“鳳巢”項目為例,用戶在百度搜索框里輸入內容后為其找到貼切的搜索結果,同時實現精準營銷,這樣的大數據變現能力已經成為百度所有營收構成中增長快的一部分。
不到一周前,百度更是牽手萬科,百度的大數據分析及云計算技術將為商業地產提供智能化升級的解決方案。智能化升級之后的金隅萬科廣場將裝上一顆“百度芯”,顧客可以在手機上查詢金隅萬科廣場周邊交通是否擁堵、停車場還有多少空位等等。
在英國布拉德福德大學教授彭永紅看來,這正是互聯網企業走向線下的一個代表。“大數據不只是優化了服務流程,也將改變服務結構。”
人物專訪:現在的很多數據沒有價值
記者:“大數據”已經成為一個流行詞,你怎么看待這個趨勢?誰在大數據方面有競爭優勢?
李彥宏:現在(很多人說)數據已經爆炸了,我們要解決的是信息爆炸、數據太多的問題。其實我覺得,這有點誤導的嫌疑,我們現在看到,每天產生的很多數據基本都是沒價值的數據。現在傳統產業在數據上仍然沒有優勢,互聯網公司目前在數據上也沒有優勢。百度在技術上已經有多年積累,在我們看來,技術已經充分準備好了,可真正想要的數據現在還沒有搜集上來。舉個例子,百度每天有幾十億人次的搜索,可只能據此作出宏觀預測,想要真正做到個性化,現在的數據積累其實還不夠。
新一代的數據收集,不管是收集工具也好,或者說數據本身也好,都會有很大的發展。但是這里面,難點并不在于你制造出來一個新型的硬件,而在于能夠找到那個點,找到什么數據對人們是有價值的。
百度大腦未來可能比人聰明
記者:“百度大腦”未來會比人腦更聰明嗎?
李彥宏:我們的“百度大腦”,是用很多計算機加上我們的人工智能,再加上深度學習這些技術去模擬人腦的思維,現在大約相當于2到3歲孩子的智力水平。這可能是上復雜的、模擬人大腦思維的系統。但是,根據摩爾定律繼續做十年、二十年的話,這樣的一個大腦很有可能就會比人腦還要聰明,那時候質變就會發生。
這一天我覺得并不會太遙遠,因為技術的發展可以使得人的智力越來越大程度被電腦所模仿,有一天電腦的這種能力可以達到人的智力。其實,現在已經有所端倪,例如無人駕駛汽車、智能機器人可以代替酒店的行李員,幫你拿行李。但是再過五年、十年,將有更多的事情可以用電腦來干,可以通過互聯網的方式來做,那個時候中國的社會將發生根本改變。
技術會改變互聯網
記者:互聯網和其他行業的跨界合作似乎已經成為一股“流行風”,教育、理財、旅游等領域在互聯網的介入下成為如今風光無限的在線教育、互聯網金融、在線旅游等。在您看來互聯網對傳統行業意味著什么?未來,互聯網又會被什么改變?
李彥宏:我認為互聯網思維模式幾乎對任何一個傳統產業都有很大的啟發作用。未來會發生一件事就是技術會改變互聯網。我相信很多人在過去很多年都切身感覺到互聯網對自己生活的改變,但是有多少人能真正感受到技術對于互聯網的改變呢?并不多。
因為技術在積累過程當中,在它還沒有真正爆發出來、沒有影響到具體的衣食住行的時候,你可能不會感覺到。然而,技術積累到一定地步的時候,會發生從量變到質變,當發生質變時,人們就有可能措手不及。我覺得這就需要我們對技術,對大數據,或者以大數據為基礎的互聯網相關技術,有一個及早的了解、及早的認知、及早的擁抱。