Skip to content

GMGC2016|阿裡雲資深架構師劉英飛:遊戲 阿裡雲,雲端共贏

  2016年3月7-9日,由全球移動遊戲聯盟主辦的第五屆全球移動遊戲大會GMGC2016在國傢會議中心盛大舉行,作為亞太地區最具影響力的遊戲行業盛會,此次大會以“Game2.0:創新不止·忠於玩傢”為主題,包括騰訊、百度、360、阿裡、谷歌、中手遊、京東、藍港互動等在內的來自全球移動遊戲及泛娛樂產業的開發商、運營商、制作商、平臺商、硬件廠商、大眾玩傢以及相關政府機構和國際產業組織齊聚一堂,共話移動遊戲及泛娛樂產業的熱點議題。8日上午,GMGC2016開發者訓練營(Developers Camp)開幕。來自阿裡雲資深架構師劉英飛進行瞭主題為“遊戲 阿裡雲,雲端共贏”的演講。

  以下是課程內容實錄:

  劉英飛:大傢好!非常高興在這跟大傢分享一下我們阿裡雲在遊戲行業的技術特點和產品特征。

  我剛才在會場逛瞭一圈,發現今天大會和去年和前年都有很大不同,我發現雲廠商參會的非常多,遊戲廠商傳統的減少瞭。為什麼這些雲廠商會大量進入到遊戲行業呢?因為從國外的經驗到國內經驗來看,其實遊戲行業和雲計算是天然共生的,在所有雲供應商裡面,阿裡雲和其他公有雲最大的區別是什麼呢?首先阿裡雲上面承載的是我們阿裡巴巴集團的核心架構,阿裡巴巴的淘寶天貓都是跑在阿裡雲之上的,這是最大的區別。等於是你開瞭一傢飯店,但是你自己會不會在裡面吃飯的問題,很多雲供應商他們自己的核心業務並沒有跑在公有雲之上。每年的雙十一對大傢來講是消費的狂歡節,但對我們來說就是最大的一次壓測。我們對整個集團提供服務。這是我們自研的分佈式系統。

  這是阿裡雲整體部署架構圖,現在我們在全球多點數據中心上面架構X86極群,超過20萬臺物理機連起來,我們類比開發者,上面藍色部分就是雲產品。後面這張圖是我們目前在阿裡雲上對於遊戲雲業務的前景圖,對於遊戲這個行業來說,雲供應商要提供的不僅是非常穩定的產品和帶寬,更重要的是在雲上面提供金牌7×24小時的服務。這是目前我們阿裡雲能夠提供給客戶的產品全傢圖,從彈性計算到數據庫,再到CDN存儲,包括PaaS的東西,全齊瞭。這張是我們目前能看到的遊戲行業常用業務全景圖,我分塊解釋一下。這是遊戲平臺,包括登陸支付,包括其他渠道接口平臺。第二個是Game Server,這塊對遊戲廠商來說是最重要的。最右面是遊戲的數據平臺。剛才Unity也講到瞭,包括遊族網絡也講到瞭,很多遊戲廠商都在做精細化運營,精細化運營就是數據分析能力。給大傢講講我們阿裡巴巴怎麼樣用大數據的方式去提高遊戲用戶的留存率。

  首先是阿裡雲上的遊戲專項集群,我們的內網隔離做的非常好,在公有雲上,就像一個飯店一樣,其他的公有雲,比如你買10臺或者100臺,它們之間有影響,但我們能夠隔離,並保持高速。CPU性能保障,磁盤I/O性能保障。當然,最重要的是數據庫部分,阿裡巴巴是做電商起傢的,我們最重要的是數據庫。接下來是我們在遊戲集群上最重要的的是RDS,我們這些數據庫用起來和正常的數據庫是一模一樣的,但後面能提供什麼多餘的服務呢?這是我們的全景圖,你使用的一個數據庫是雙核的,能保證你的遊戲數據不可能丟失,也不可能檔機,保證用戶的數據絕對不會回檔或者有丟失,或者沒法校驗的情況發生。這個圖周邊部分是我們阿裡雲自己開發的一套集群控制部分,包括自動任務調度,包括在線遷移,包括備份,有瞭它的保障,讓遊戲客戶,包括遊戲大廠商不用找專職人員,在數據庫全部解決。

  除瞭我們能做到邏輯上的保障之外,在底層硬件上我們怎麼保障呢?一個數據庫和一臺服務器,從機櫃到電源,我們都分兩份。比如你所購買的一臺服務器和數據庫,它不可能因為一些能源,比如電源斷瞭,去損耗你的數據。再是怎樣減少停機時間,目前我們的公有雲上可以做到可用性達99.95%,我們是雙節點冗餘,有問題直接切到備庫。大部分開發者,無論是個人開發者還是公司,他們都很頭疼數據怎麼做備份,但造成的一個問題是空間很大成本很高。我們阿裡雲數據庫本身是默認給你保持七天日志,數據會恢復到一個臨時實例,可以直接回到那個時間點進行校驗。再是數據容災,現在很多遊戲能夠做到玩傢跨區戰鬥,面對遊戲行業的這個變革,對於數據庫的容災和數據庫的安全性要求逐步提高,我們目前能夠做到三級高可用容災架構,這是第一級最基本的。第二級在雲上可以做到多可用區部署。我們也可以做到異地容災,大傢都知道餘額寶,跟金融相關的所有項目至少需要兩地三中心異地部署的,目前我們可以對遊戲用戶把這個功能開放出來,提供三層容災保障。

  在阿裡雲上我們的數據可以熱升級,完全不影響你的業務,我們的技術可以做到這一點,幫助很多客戶上線初期減少很多麻煩,很多客戶,包括小的開發者,預估不到未來數據庫影響多大,在雲上開一個最小實例,隨著業務量增長,你可以隨時把數據升到更高的位置,這是縱向擴展。其實阿裡雲數據庫最大的是橫向擴展,它是一個數據庫的集群,這是DRDS,分佈式的數據庫。目前在遊戲行業能用這麼大擴展能力和這麼大數據吞吐量的還很少用到,但未來會用到這些最新技術。這是數據庫。

  說完數據庫說我們的網絡,阿裡巴巴最早做電商,我們有兩個技術,一個是SQL技術,一個是CDN。我們全球所有節點都是純自建的,而且目前能夠把成本做到最低,帶寬做到最高,質量第一。左邊部分是阿裡雲的基線,其他的廠商,基本上從各個地區和各個運營商基調測試來看,都大大弱於阿裡雲,隻有幾個比較偏僻的地方,一些小的地方比較偏的問題他會有一些優勢。

  說完遊戲服務器,第二部分是我們的遊戲平臺部分。

  無論你現在是開發者或者是小CP,或者是中型廠商,你的遊戲平臺部分可能不會很多,但這是核心,所有的登陸、支付和接口都在這部分,我們一定要保證高可用性。這是跑在雲上的卡牌遊戲,左邊是他的平臺部分,想表達的是大部分遊戲廠商在他們平臺部分完全沒有做任何高可用的架構設計。你們公司的平臺部分,不說官網,就說登陸和支付,它可能都是單機,登陸的話除非你是剛發行的時候並發量很大,沒有必要做負載均衡,但實際上是錯的,我們之前看過很多遊戲客戶,他屬於中型廠商的時候沒有那麼大的並發量,但如果有一天他收瞭比較好的IP,準備上線的時候,發現他推的這一天從UC或者360過來的用戶遠遠超過他的預測,這個時候他的平臺不給力,檔掉瞭,但是在我們雲平臺我們可以幫他解決。我們在平臺部分向用戶強烈推薦的,而且是在雲上做護航的重點客戶。目前華人對開源社區做最大貢獻的就是我們阿裡巴巴首席技術官貢獻給開源社區的。簡單來說,你的整個平臺入口完全沒有任何單點故障,如果一臺服務器有故障切到另一臺。

  這是真實的負載均衡部分架構圖,我們在所有關鍵點上都是物理上兩臺機器,假設這個負載均衡設備在一個機房裡,這個機房也出現故障。中國的骨幹網聯通電信經常出現抖動,導致不穩定。我們現在可以提供更高級的容災,如果這個時候電信出現任何故障,可以把應用全部承接過去,保證你的登陸平臺支付平臺不會受到任何影響,電信有故障還可以走聯通。後面是數據分析平臺,結合前面幾位講的,包括Unity ADS廣告,社會黨人說做數據想的是怎麼用這個數據把我的客戶更吸引住,其實我們阿裡巴巴,包括馬雲提倡的是我們做到千人千面。09年阿裡雲成立,2010年我們非常低調上線瞭一個ODPS平臺,在2012年整個集團做瞭一件事,阿裡巴巴集團將所有數據匯總到這個平臺上,現在大傢看到的阿裡巴巴所有數據,我們收購的,所有的數據,這麼大規模數據都在一個平臺上,就是ODPS平臺上。把數據匯總到一起可以多維度分析你的用戶,做用戶畫像,每個人登陸淘寶你看到的界面都是不一樣的,這就是所謂的“千人千面”。剛才Unity廣告也是,他隻是說每個人都要看這個視頻,但你是否能夠通過大數據分析這個用戶想看的是什麼視頻,如果你給他看的是他感興趣的視頻,你的收入就會大大增加,這是我們大數據做的東西。

  後面給大傢介紹一下目前我們大數據能處理的能力,包括我們的單核已經超過500TB內存能力,超過10萬核的能力,包括留存分析,需要邏輯回歸算法,有多大數據算多大數據。你知道大致知道怎麼寫SQL,知道哪個算法,就可以即開即用。

  剛才所有的東西總結成一句話,數據存和用,在存通這塊我們向客戶提供的是什麼呢?以前我們做到的是遊戲部署在雲上,做大數據分析,現在遊戲不在雲上。我們舉一個例子,墨跡天氣APP,很多海外華人也在用這個APP,這個APP已經擁有超過4億註冊用戶,每天日志增長的非常快,需要分析每天哪個區域有哪些用戶增長很快,我對他推送什麼樣的天氣和相應的廣告。這是他在雲上的整體部署圖,他在國內、韓國、日本都有自己的機房,在機房上部署瞭阿裡雲數據采集,每天寫他的SQL,做數據分析,然後形成日志,做他的整體報表。原來他這個平臺是跑在亞馬遜AWS上,為什麼遷到阿裡?因為亞馬遜是面向開源的,沒有對底層數據量進行壓縮,我每天采集的日志可能有400G、500G,每天存這些數據就有很高的成本,大量都是重復的日志,你可以做很好的壓縮,壓縮完之後把空間壓到很小。我們雲上本身做壓縮,能夠把存儲成本降低到之前的70%,減到30%,從成本到技術到實現上都是可以的。

  我今天主要講三點,簡單可靠,成本最低。在遊戲平臺部分,阿裡雲可以保證你的平臺不會出任何故障。在大數據方面,阿裡雲是目前公有雲提供商裡面最先進的,可以即開即用的。謝謝大傢!