簡單總結李彥宏的演講:
他認為,移動互聯網之后人工智能是百度的核心。三年前的“百度大腦”就已經具備了兩三歲孩子的智力水平。百度今天同時擁有超大規模的計算資源、中國最大的GPU集群以及國內最為豐富(如果不是之一的話)的搜索、圖像、視頻、定位數據,百度今天的“大腦”已經成長到什么水平?
以下是李彥宏的演講實錄全文:

在這之前,互聯網的發展已經經過兩個重要階段,也就是PC互聯網階段;第二個是最近四五年移動互聯網階段。中國7億網民都用上了智能手機,上網人口滲透率已經超過50%。互聯網的發展已經不能靠人口紅利來驅動了。
當前,中國進入到經濟的新常態,國家也提倡互聯網+,實際上是希望我們用互聯網的效率來推動行業的發展。整個中國的經濟增長需要依靠互聯網,但是互聯網的增長卻遇到了瓶頸,過去粗放式的野蠻增長沒有了,互聯網行業從業者感受到深深的危機。
移動互聯網的下一幕,是人工智能。對于百度來說這是核心中的核心,過去百度投了很大的研發精力。對于百度來說意味著什么?用四個字形容就是百度大腦,三年前,百度就講過“百度大腦”這個概念。那個時候的百度大腦已經具備了大概兩三歲孩子的智力水平。
今天很多人問我,百度大腦相當于多少歲的人腦呢?回答這個問題還蠻難的。百度大腦和人腦的正常發育過程很不一樣。
百度大腦包括三個部分:計算方法,包括超大規模的神經網絡、萬億級的參數、千億樣本和千億特征訓練;計算能力,包括數十萬臺服務器構成了“百度大腦”的實體,幾年前百度便開始自建中國最大的GPU集群,不是傳統基于CPU的服務器,而是GPU,GPU早年在游戲領域使用廣泛,適用于深度計算;數據,全網的網頁數據、十多年來累積的搜索數據,以及百億級的圖像、視頻、定位數據。這樣,百度大腦就可以開始工作了。
百度大腦有哪些能力?四個能力,語音、圖像、自然語言理解和用戶畫像。
第一個語音已經進入相對成熟的階段。
百度大腦的語音識別已經到了第二代,使用深度學習的技術進行語音識別。百度語音識別的準確率能夠達到97%,已經超過了人對語音的識別能力。
這樣的能力到底可以在什么地方幫助到我們?舉個例子,很多公司都有自己的電話銷售部門,這個行業人員流動性很大,而銷售人員需要長時間培訓才能上崗。即使是經過培訓,甚至有一定經驗的銷售人員,每個人銷售效率也是參差不齊的。但是通過百度語音識別能力,一個新的銷售上崗的第一天,就可能掌握他所獲得的最優秀的銷售能力:
新銷售打電話給潛在客戶的時候,客戶每說一句話,客戶每問一個問題,百度大腦都實時地識別了問題,并且顯示在銷售的電腦的屏幕上,屏幕上不僅實時展示了客戶的問題,而且實時地把最優秀的銷售是怎么回答這個客戶的問題也展示在這個屏幕上。這樣,新的銷售的工作就簡單多了,其實他基本上可以照著屏幕念,就能夠達到最優秀的銷售的話術水平。
語音識別還有很多應用場景,大家可以根據自己的行業背景去想象。
語音能力分為兩個方向,語音合成和語音識別。
語音合成是把文字轉換成語音,用自然人的聲音讀出來,而不是以前的勻速無表情的語音。目前,百度每天響應的語音合成的請求達到了2.5億次。在情感語音合成技術上線后,用語音聽小說的百度用戶從過去平均每天聽0.69小時,增長到現在的2.21小時。
今天,語音合成還可以根據個人需求進行定制,形成自然發聲的能力,模擬任何一個你喜歡的人的說話方式。百度地圖中有一個李彥宏導航語音包,其實我并沒有說過那些話,就是根據我日常的語音合成的。
我們現場合成一下13年前去世的張國榮的聲音。合成張國榮的聲音比較難,國語的語調比較少。以張國榮在影視、電臺等留存下來的原聲進行建模,通過情感語音合成技術實現合成。
任何一個人只要用30分鐘按照要求錄制50句話,就可以用百度大腦的語音合成技術模擬出來這個人的聲音。人人都可以擁有自己的聲音模型。
第二個圖像識別能力是如何實現的?
從技術的角度講,它是通過對人臉特征的關鍵點的提取,找到了其中最不一樣的地方,構成了一個面部的表情。當一個人表情發生變化的時候,他的表情特征并不會發生改變。
除了人臉識別之外,百度在其他場景中也經常會遇到圖像識別需求。計算機視覺或者圖像識別技術是無人車的最后一公里。過去一年,百度花了不少精力提升百度無人車在城市道路的運行水平。百度無人車在行駛過程中,通過感知,可以探測到路面上車、路標以及各種各樣的障礙物,每個物體有一個獨特的編號,便于車對它進行識別。這個車的識別是通過百度大腦來識別的。今年8月份KITTI評測的最新成績顯示,百度無人車在車輛檢測中排名第一,車輛跟蹤6項指標中取得4項第一。
下一個是增強現實,廣告主可以把現實產品和希望展示的場景聯系起來展示給消費者。歐萊雅與百度合作,拍洗發水就可以準確識別并和用戶互動。
第三種是自然語言處理能力,目前發展程度不如圖像識別。
去年在百度世界大會上推出的度秘,是個人智能助理。現在度秘和用戶進行溝通的方式和傳統的搜索已經很不一樣了,有56%是通過語音或者圖像來完成的,語音和圖像的交互正逐步超越傳統文字的使用頻次,成為人們表達需求的主流方式。
除此之外,更核心的技術是用人的語音進行交流,雖然不是每一次度秘都能理解。今年奧運期間,百度機器人度秘搭檔知名解說員楊毅,進行里約奧運男籃首場四分之一決賽解說。
最后一個用戶畫像能力。
通過大量的用戶行為數據,百度大腦能夠描繪出著名演員胡歌的粉絲群體的基本特點。胡歌粉絲群體的畫像我們從興趣和偏好的角度來看,其實在影視、音樂、公益、旅游、出行。我們看到這里面最大的一個特點還是旅游出行,而不是影視音樂,還是跟常人的思維不太一樣。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://m.hanmeixuan.com/
本文標題:李彥宏:百度大腦為什么是“核心中的核心”?
本文網址:http://m.hanmeixuan.com/html/news/10515320035.html