2016TFC優數科技溫光普：大數據助手遊點石成金

　　蘋果園3月18日消息，為期兩天的2016第十二屆TFC全球移動遊戲大會暨智能娛樂展已於昨日在北京國際會議中心正式開幕。今日上午，優數科技副總裁溫光普受邀出席大會，在主會場上發表瞭《大數據助手遊點石成金》的主題演講。他認為，當下互聯網的發展使得用戶能夠同時擁有多種智能設備，然而如何實現這些設備之間的跨屏互動營銷成為其探究的問題。而優數科技在大數據、機器人學習以及效果廣告等方面的實力也將助力遊戲企業更高效的發展。

　　以下為演講實錄:

　　優數科技成立於2015年10月，是由中國最大的語音和大數據提供商科大訊飛和中國效果廣告第一股壁合科技共同創辦的。因為科大訊飛有海量的數據，以及對數據的處理能力，而壁合科技有10年的廣告行業從業經驗，及對廣告效果優化的經驗，所以說優數科技是站在兩位巨人的肩膀上。

　　我們的大數據來自於以下幾個方面：

　　一：訊飛開放平臺。2010年建立，到現在超過5年的時間，有11萬以上的合作夥伴，覆蓋瞭13億手機終端，每天產生的交互次數超過10億次。語音行業中超過60%的應用使用的都是訊飛的語音能力，這其中就包括手機QQ、微博、滴滴出行、高德導航等大型或超大型APP。這些APP為訊飛開放平臺提供瞭大量的語音數據。

　　二：訊飛還有一些自有的APP，比如訊飛輸入法，目前用戶量僅次於搜狗輸入法;另外還有靈犀語音助手、酷音鈴聲等，這些APP也能為我們提供大量數據。

　　三：另外還有來自優數科技和壁合科技的廣告投放數據，比如廣告素材的曝光、點擊、下載等數據。

　　有瞭海量的數據以後，我們首先對數據進行脫敏，去除包含用戶隱私的部分，然後對數據進行清洗和分析，得到瞭DMP人群標簽。訊飛DMP目前覆蓋瞭5億用戶，包括25個子分類，1500多個標簽。這些標簽不光包含性別、年齡、職業、籍貫等人口屬性標簽，也包含一些上網行為、興趣愛好、生活方式等人群特征標簽。有瞭這些標簽可以進行廣告的精準投放。優數科技就是大量使用訊飛的人群標簽進行遊戲類廣告投放的，目前來看效果非常好。

　　互聯網發展到今天，我們每個人可能擁有很多個智能設備，比如多個手機、Pad或是其他可穿戴設備，甚至是是智能傢居的設備，如何跨設備互動營銷是目前困擾所有廣告公司的難題。為此訊飛創建瞭一套聲紋ID系統，聲紋是類似於人的指紋的一種生物特征，對每個人來說都是唯一的，聲紋可以唯一標識一個人。這樣就可以在不同設備之間進行精準的廣告投放。

　　前面講的是優數的數據來源，有瞭這些數據該怎麼用，是我們一直在探索的課題。最近alphago大勝李世石是互聯網圈最熱門的話題，alphago其實就是一套人工智能系統。類似的系統國內也出現過，比如去年在合肥中考閱卷中使用到的訊飛的閱卷機器人，閱卷內容不光包括客觀題，也包括閱讀理解、作文等主觀題。

　　2015年被稱為”人工智能之年”，2016年將會是人工智能和廣告相結合的一年。

　　人工智能最核心的是一套機器學習系統。什麼叫機器學習，我們來看這個例子，這是現任facebook人工智能實驗室主任在一次采訪中為瞭說明機器學習而舉的例子，這是一個最簡單的機器學習系統，它的目標是給機器一張圖，他能夠識別出這張圖中是一隻狗，還是一輛汽車，這個系統包括三個部分，最左邊是輸入部分，是一個攝像頭，可以通過它來拍攝圖片。中間就是核心的機器學習系統，它上面有很多的開關，另外右邊是輸出系統，如果識別系統認為用來識別的圖片是一隻狗，那麼亮紅燈，如果認為是一輛車，那麼亮綠燈。有瞭這個系統我們就可以啟動我們的機器學習瞭，機器學習怎麼做的?首先需要我們有訓練樣本，比如說我現在有10張圖，5張是狗，5張是汽車，哪5張是狗，哪5張是汽車，是預先知道的。通過攝像頭拍瞭照片，把已知的訓練樣本通過攝像頭錄入，通過中間的機器學習系統進行識別，識別出來以後如果是狗的樣本，紅燈亮，我們就認為識別正確，如果綠燈亮，就調整機器學習系統上的開關讓它變成紅燈。開關調節的過程其實就是一個機器學習的過程，通過不停不斷的調整和學習，這個識別系統就會越來越準確。如果我們有數千種顏色的燈，有千萬級別的訓練樣本，百萬級別的按鈕開關，那麼這個系統就成為一個深度學習系統。。

　　深度學習最常用有三種模型DNN/RNN/CNN，今天主要講DNN和RNN，因為這兩種模型現在的應用是最多的。訊飛最初是把DNN和RNN 用於優化語音識別能力，後來逐漸用於人工智能領域。講DNN就必須講到多層感知器，如果機器學習的系統隻有一個左邊的輸入設備和右邊的輸出設備，這樣就是一個單層感知器，解決的是一個線性可分的問題，如果我們給出一條狗和一個汽車，一條線就可以把它們分開，這就是線性可分。但是當海量的狗和汽車或者是其他的樣本加入的時候，並且有很多的線索，你無法通過線性的方式把它分還，這個時候就要加入中間層，就變成瞭多層感知器，來解決線性不可分的問題的。多層感知器就是在模擬神經網絡，自從1986年BP算法流行開來以後，DNN模型得到快速發展。RNN就是在DNN的基礎上模擬人腦記憶，使DNN具有“聯系上下文”的能力。

　　前面講我們有瞭DMP標簽，這些標簽怎麼用於廣告的投放呢。傳統的DSP公司都是通過優化師憑經驗去使用標簽優化廣告效果，很多時間和資金就會浪費在廣告的優化過程中。我們把DNN和RNN模型引入到廣告點擊預測中，目前得到的效果是對點擊率有15%的提升。隨著人工智能技術的發展及廣告數據的不斷積累，未來我們可以預測安裝、激活、留存和回收，甚至可以預測一個遊戲的整個生命周期。

　　下面講一下一些特殊的廣告形式(互動廣告)。2014年我們做過一些探索，包括跟搜狐視頻、紅牛等做過一些案例，改造傳統廣告的投放形式，讓它具備語音交互能力，通過說話或者是哼唱歌曲，來跟廣告進行交互，達到廣告效果的同時還能提升用戶的體驗。更重要的是通過跟用戶的語音交流，能獲取很多用戶對產品的反饋，這個反饋也能成為數據的重要來源。

　　最後總結一下，優數是這樣一傢公司：

　　首先，優數雖然是一傢創業型公司，但我們能精準營銷、場景營銷，有自己的智能算法，有互動廣告形式，有訊飛ADX的優質媒體資源，同時我們能進行跨屏營銷，是一個一站式的互動營銷平臺。優數的願景是：以優質數據，助力移動營銷。

　　我的分享就到這裡，謝謝大傢。

　　2016第十二屆TFC大會簡介：

　　2016年TFC品牌全面升級，跨界整合“B C”雙端資源，攜“第十二屆TFC全球移動遊戲大會暨智能娛樂展”和“TAC漫遊展”兩大展會重磅來襲，深入影響遊戲與智能娛樂業界精英，輻射全國50萬二次元人群，打造最強漫遊資源矩陣。B端展會將覆蓋移動遊戲、VR/AR、智能玩具和硬件、 HTML5遊戲、二次元產業、影視泛娛樂IP等多個領域，C端展會將專精二次元，利用國人自制、專業團隊、優質原創的強大優勢，打造“音影漫遊”全景式互動體驗。