當(dāng)前位置:首頁 >  IDC >  服務(wù)器 >  正文

阿里雙11集團(tuán)技術(shù)總指揮湯興:一場不亞于移動化的變革已經(jīng)發(fā)生

 2020-03-23 16:56  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

2019年11月11日,阿里巴巴所有技術(shù)人經(jīng)歷了第11次技術(shù)大考。這一年,阿里巴巴實現(xiàn)了核心交易系統(tǒng) 100% 上云,總銷售額達(dá)2684億元。核心交易系統(tǒng)百分百上云可以說是整個基礎(chǔ)設(shè)施最大的變化以及技術(shù)突破,在此之外,阿里巴巴的整個業(yè)務(wù)形態(tài)也發(fā)生了巨大改變。在QCon全球軟件開發(fā)大會(北京站)2020 即將召開之際,InfoQ采訪到了擔(dān)任此次大會聯(lián)席主席的阿里巴巴副總裁、2019年雙11集團(tuán)技術(shù)總指揮湯興(花名:平疇)。本文將與你分享這場意義非凡的變革以及阿里新零售的技術(shù)方向。

1. 從愛奇藝CTO到淘系技術(shù)掌門人

2019年,湯興正式加入阿里巴巴集團(tuán),任職阿里巴巴集團(tuán)副總裁,花名平疇。整體負(fù)責(zé)包括淘寶技術(shù)、天貓技術(shù)、農(nóng)村淘寶技術(shù)、閑魚、躺平 等多個團(tuán)隊組成的新零售技術(shù)事業(yè)群淘系技術(shù)部。

翻開平疇的履歷,他擁有超過十年全球 TOP IT 公司研發(fā)及管理方面的工作經(jīng)驗。加入阿里之前,平疇最近的一份工作經(jīng)歷是任職愛奇藝 CTO,他帶領(lǐng)愛奇藝技術(shù)團(tuán)隊建立起全球首個基于視頻數(shù)據(jù)理解人類行為的視頻大腦——愛奇藝大腦,讓機(jī)器能夠理解視頻內(nèi)容,并領(lǐng)導(dǎo)在視頻社交領(lǐng)域推出愛奇藝泡泡,開創(chuàng)了視頻社交先河。

雙11現(xiàn)場的平疇

雙11之前,阿里宣布由平疇擔(dān)任本屆雙 11集團(tuán)技術(shù)總指揮,從視頻領(lǐng)域到新零售領(lǐng)域,角色轉(zhuǎn)變的同時,還要帶領(lǐng)技術(shù)團(tuán)隊面對雙11流量高峰的挑戰(zhàn),壓力可想而知,但平疇很快就適應(yīng)了這種變化。

看懂兩者之間的內(nèi)在聯(lián)系與差異,就很容易在兩個領(lǐng)域切換和適應(yīng)。

采訪中,平疇表示,視頻是內(nèi)容行業(yè),本質(zhì)上是內(nèi)容虛擬商品的供給與需求匹配。阿里是電商行業(yè),主要是實物商品的供給與需求匹配,兩者既有相同之處也有不同之處,比如一個沒有庫存,一個有庫存;一個通過線下物流履約,一個通過線上數(shù)字媒體傳送;一個側(cè)重營銷交易活動運(yùn)營,一個側(cè)重主題運(yùn)營活動等。無論是虛擬數(shù)字經(jīng)濟(jì)還是實物經(jīng)濟(jì),都脫離不了零售的本質(zhì),供給與需求的有效匹配,而技術(shù)體系的框架也基本類似。

2. 第11個“雙11”:一場堪比無線化的變革

2019 年,雙 11 直播已成為淘寶內(nèi)容生態(tài)里程碑式的節(jié)點(diǎn),其意義可對標(biāo)當(dāng)年的無線化變革。

回憶起2019年的11月11日,平疇表示,淘寶經(jīng)歷了一場意義完全不亞于無線化的變革,那就是直播。

如今,不知還有多少人對淘寶當(dāng)年的那場無線化變革印象深刻。

2013年,移動化的浪潮來了,所有人都感受到了移動化即將帶來的巨變。阿里集團(tuán)一聲令下,正式宣布“ALL IN 無線”戰(zhàn)略,很多人被從原有部門放到戰(zhàn)場最前線,有人不適應(yīng)走掉了,后續(xù)的再補(bǔ)上,就這樣不斷調(diào)整和優(yōu)化。

2016年,現(xiàn)任阿里巴巴CEO張勇正式向外宣布淘寶網(wǎng)與無線淘寶合并,淘寶成功從PC時代轉(zhuǎn)型為移動時代。事后證明,如果不是這場變革,我們很難見到如今的淘寶。

業(yè)務(wù)形態(tài)在變,技術(shù)必須跟上

“在云原生的大潮下,新一代的技術(shù)變更可能才剛剛開始,核心交易系統(tǒng)百分百上云可以說是整個基礎(chǔ)設(shè)施最大的變化以及技術(shù)突破。但是,在基礎(chǔ)設(shè)施的變化之外,整個業(yè)務(wù)形態(tài)也發(fā)生了巨大改變。”

平疇在采訪中對InfoQ表示,這種業(yè)務(wù)形態(tài)的改變指的就是直播。淘寶從2015年就開始做直播,短短四年打造了一個年成交千億的行業(yè)。

2019 年,雙 11 直播已成為淘寶內(nèi)容生態(tài)里程碑式的節(jié)點(diǎn),其意義可對標(biāo) 2015 年的淘寶無線化。當(dāng)天,淘寶直播成交近 200 億 (2019年雙11總交易額為2684億元),超過 50% 的品牌商家通過直播獲得增長。

如今,直播已經(jīng)成為天貓雙11商家的標(biāo)配,直播的內(nèi)容形式與圖文截然不同,更強(qiáng)調(diào)實時互動和流暢的觀看體驗,而這些特點(diǎn)對消息通道、網(wǎng)絡(luò)和 CDN 等軟硬件資源 提出了苛刻的要求。

既要保證用戶體驗,又要追求技術(shù)上的最低成本,包括最小帶寬消耗、最大機(jī)型覆蓋等。平疇帶領(lǐng)的技術(shù)團(tuán)隊遇到了很大挑戰(zhàn)。

為了解決直播中可能遇到的問題,淘寶直播技術(shù)團(tuán)隊自研音視頻實時通信引擎,采用去中心化的設(shè)計方式,支持橫向級聯(lián),實現(xiàn)大規(guī)模低延時直播,時延從原先的5到7秒降低至 1 秒內(nèi),并在弱網(wǎng)下有更好的表現(xiàn)。

雖然做足了準(zhǔn)備,但平疇回想起當(dāng)下,坦言還是有些擔(dān)心:“很怕發(fā)生預(yù)期外的問題,尤其是新場景、新用戶動線和新架構(gòu)。”

實踐證明,歷年雙11期間產(chǎn)生的相對嚴(yán)重問題,往往都不是我們預(yù)先最擔(dān)心的問題,甚至絕大多數(shù)可能不在預(yù)期內(nèi)。

道理很簡單,無論項目的挑戰(zhàn)或風(fēng)險有多大,只要在雙11前能預(yù)想到,技術(shù)側(cè)就一定會做好預(yù)案應(yīng)對最差情況,并且做好演練工作。對于預(yù)期外的問題,往往是沒有準(zhǔn)備預(yù)案或者預(yù)案有效性沒有經(jīng)過驗證,遇到這種情況就非常挑戰(zhàn)整個技術(shù)團(tuán)隊?wèi)?yīng)急解決問題的能力了。不過,這也是雙11的魅力所在:

我們永遠(yuǎn)沒有辦法對所有問題做好預(yù)案,永遠(yuǎn)有未知的挑戰(zhàn)在前方等待,而我們唯有通過技術(shù)升級去不斷地逼近那個能夠做到的最好的極限。

所以,對技術(shù)人來說,雙11永遠(yuǎn)沒有做的最好,只有做的更好。

3. 提前一年,決定上云

今年雙11,我們把“最要命”的系統(tǒng)全都放在云上。

這是當(dāng)時阿里巴巴集團(tuán)CTO、阿里云智能總裁行癲在雙11當(dāng)晚說的一句話。如開篇所言,2019年雙11,阿里實現(xiàn)了核心交易系統(tǒng) 100% 上云,而這個決定早在一年前就做出了。

“每年雙11結(jié)束,全集團(tuán)都會進(jìn)行一次全面的技術(shù)復(fù)盤,除了復(fù)盤在整個雙11過程中的得與失,更重要的是,確定下一年雙11技術(shù)的整體方向。2018年雙11復(fù)盤時,集團(tuán)就整體確定了將核心電商搬到云上的大策略。”

2019年1月份,上云項目正式啟動,這個項目在阿里內(nèi)部被稱為“云創(chuàng)未來”。電商核心鏈路全面上云意味著沒有云下的資源做切換與互備,平疇表示,這涉及到阿里電商數(shù)百個核心應(yīng)用,上萬臺物理機(jī)臺,總核數(shù)過百萬核??上攵?,這其中的挑戰(zhàn)有多大。

分步遷移:Q3季度進(jìn)入大規(guī)模應(yīng)用開發(fā)

為了實現(xiàn)這個目標(biāo),從機(jī)房到軟件部署、網(wǎng)絡(luò)拓?fù)?、中間件等一系列基礎(chǔ)設(shè)施都要先行準(zhǔn)備并且在更早一些的大促,比如618大促中驗證有效性。平疇透露,除基礎(chǔ)設(shè)施外,每年上半年是業(yè)務(wù)上各類技術(shù)平臺與框架升級迭代的黃金期,等到7、8月份,再結(jié)合雙11業(yè)務(wù)的具體玩法逐步進(jìn)入業(yè)務(wù)應(yīng)用的大規(guī)模開發(fā)期間。

按階段來看,平疇表示,雙11上云在技術(shù)層面可以分為如下三個部分:

1、平穩(wěn)遷移上云;

2、穩(wěn)定使用云服務(wù);

3、結(jié)合云技術(shù)探索新的高效研發(fā)方式。

第一階段:應(yīng)用遷移上云。

平疇表示,在這個過程中,最大的風(fēng)險來源于云上基礎(chǔ)設(shè)施和中間件等產(chǎn)品的變化,應(yīng)用需要配合這些變化進(jìn)行改造和升級。

梳理清楚這些變化后,技術(shù)團(tuán)隊才有依據(jù)判斷需要進(jìn)行哪些相關(guān)的應(yīng)用改造與升級工作,來規(guī)避重大風(fēng)險。在這個過程中,淘系技術(shù)推動了中間件二方庫升級、版本檢測、日志異步化改造、緩存集群遷移等工作,建立了一套應(yīng)用升級檢測的自動化機(jī)制和升級流程管理,確保所有應(yīng)用升級到位,并在云上布署最小業(yè)務(wù)集群,能夠通過自動化業(yè)務(wù)功能回歸來驗證遷移后的業(yè)務(wù)功能一致性。

其次,遷移過程必須有很強(qiáng)的可控性,具備快速容災(zāi)能力。平疇表示,淘系技術(shù)會通過線上流量的復(fù)制進(jìn)行壓測,全量回歸云上的應(yīng)用確保不出現(xiàn)性能退化。壓測的同時,技術(shù)團(tuán)隊準(zhǔn)備好快速切流逃逸的方案,在原有的異地多活的容災(zāi)基礎(chǔ)上把中心機(jī)房建立成4個邏輯機(jī)房, 實現(xiàn)一鍵在同城4個邏輯機(jī)房之間的容災(zāi)逃逸能力,并經(jīng)過多次驗證。在具體遷移的過程中,小步驟切流,同時加強(qiáng)云上監(jiān)控,避免突發(fā)性大面積問題出現(xiàn)。

第二個階段,建立上云保障小組。

淘系內(nèi)部將云和電商相關(guān)的研發(fā)一起拉通,明確響應(yīng)機(jī)制和負(fù)責(zé)人,打通兩邊的變更系統(tǒng)和告警系統(tǒng),細(xì)化云告警信息中明確關(guān)于電商應(yīng)用相關(guān)的信息。通過不定時的模擬攻擊云環(huán)境,推動兩邊對故障處理的應(yīng)急能力提升。

新零售線專門成立了上云、用云項目組,阿里云也有專門的項目成員進(jìn)行對接。同時,我們有專業(yè)的PMO來保障跨團(tuán)隊的項目合作,保障日常的周/月例會進(jìn)行信息同步以及項目推進(jìn),針對演練中不同的線上問題有專門的應(yīng)急機(jī)制,雙11項目的橫向拉通保障工作也隨著多年的技術(shù)升級而不斷沉淀經(jīng)驗。

為了保障云上的容載能力,雙11技術(shù)項目組組織了多次云上突襲演練,演練云上單元機(jī)房不可用情況下的應(yīng)急手段。通過持續(xù)迭代逐步將核心業(yè)務(wù)搬到云上,過程中持續(xù)進(jìn)行云上回歸測試以及切流演練,在雙11前的幾次大促中也驗證了線上的用云穩(wěn)定性。

第三個階段,結(jié)合云技術(shù)探索新的研發(fā)方式。

上云的過程中,云技術(shù)在向云原生發(fā)展。除了神龍服務(wù)器(阿里云彈性裸金屬服務(wù)器)之外,新的ASI容器也大規(guī)模使用。為了探索Serverless的價值,淘系技術(shù)結(jié)合云技術(shù)構(gòu)建了自己的函數(shù)平臺FaaS,覆蓋淘寶互動、閑魚、導(dǎo)購、躺平等多個業(yè)務(wù)場景。這個平臺一方面大幅提升了研發(fā)效率,另一方面提供了云端一體的輕量級研發(fā)方式。

(淘系自研云端一體函數(shù)平臺 Gaia架構(gòu)圖)

在上云的過程中,我們看到基礎(chǔ)設(shè)施變厚了,研發(fā)變得輕了,推動業(yè)務(wù)研發(fā)從Procode走向Lowcode,進(jìn)而聚焦業(yè)務(wù)研發(fā),可以更大地釋放研發(fā)生產(chǎn)力。

4. 端側(cè)AI決策140億次

上云、做AI,這是近兩年所有重視技術(shù)研發(fā)的科技公司的大主題。在上云之前,阿里淘系就開始研發(fā)端側(cè)的智能應(yīng)用,這也符合當(dāng)下國人的消費(fèi)習(xí)慣,大部分消費(fèi)者習(xí)慣通過移動端進(jìn)行交易。

2019年,手淘大規(guī)模使用端上AI技術(shù),在客戶端實現(xiàn)對用戶行為的實時感知,應(yīng)用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行用戶意圖識別,并根據(jù)識別結(jié)果進(jìn)行智能決策,做到推薦內(nèi)容的實時更新,大幅提升個性化推薦效果和用戶體驗。

2019年雙11當(dāng)天,端側(cè)AI決策一共運(yùn)行了140億次, 對于信息流的個性化推薦、消息的智能投遞、直播的商品智能檢測,效果上都有非常大幅度的提升。平疇表示,淘系技術(shù)部的輕量級深度學(xué)習(xí)端側(cè)推理引擎MNN已經(jīng)開源,這種有效利用云與端的各自數(shù)據(jù)和計算優(yōu)勢的方式一定是未來的發(fā)展趨勢。

除了端側(cè)的AI技術(shù)研發(fā),阿里淘系也正在將深度學(xué)習(xí)、機(jī)器視覺和3D技術(shù)結(jié)合在一起,形成3D AI的方向,并將之應(yīng)用于躺平家裝和家居領(lǐng)域。

最近五到十年,人工智能技術(shù)有了突飛猛進(jìn)的進(jìn)展,集中表現(xiàn)在深度學(xué)習(xí),以及深度學(xué)習(xí)和人工智能問題的結(jié)合上,但是越來越多人對于人工智能技術(shù)是否可以再取得突破有所疑慮。平疇坦言,過去兩三年,業(yè)界對人工智能的作用有過度夸大。人工智能提升甚至創(chuàng)造新的場景需要和業(yè)務(wù)、產(chǎn)品、工程的深度結(jié)合,這需要較長的時間摸索。理想和現(xiàn)實的差距讓人們轉(zhuǎn)而認(rèn)為人工智能達(dá)到了瓶頸,這是缺少對技術(shù)到產(chǎn)品轉(zhuǎn)化規(guī)律的耐心和尊重的表現(xiàn)。

新的人工智能應(yīng)用場景的出現(xiàn)不僅需要人工智能技術(shù)發(fā)展這單一的條件,更是依賴數(shù)據(jù)、業(yè)務(wù)和產(chǎn)品的發(fā)展。因此,開發(fā)人工智能新場景不僅僅是人工智能技術(shù)團(tuán)隊的工作,也不是簡單的理論結(jié)合實際,而是需要打造基礎(chǔ)設(shè)施、新產(chǎn)品、新的數(shù)據(jù)的積累。有了這些條件,人工智能的新場景才會源源不斷的孕育出來。

人工智能是戰(zhàn)術(shù),核心還是具體場景的需求滿足,如何準(zhǔn)確定義場景和相應(yīng)的衡量體系才是人工智能發(fā)揮所長的前提。

5. 未來規(guī)劃

2019年的雙 11 過后,阿里內(nèi)部同樣召開了一場復(fù)盤會。平疇透露,2019年的雙11是技術(shù)歷史上消費(fèi)者最順滑的一次,交易核心鏈路全面上云,淘寶直播的同時在線人數(shù)也創(chuàng)了歷史新高。未來,阿里會持續(xù)不斷提升購物車、下單等核心鏈路的消費(fèi)體驗,同時通過技術(shù)升級的手段大幅優(yōu)化整體資源使用效率,降低大促過程中的技術(shù)資源使用成本。

接下來,阿里淘系的研發(fā)重點(diǎn)會聚焦在5G可能帶來的技術(shù)創(chuàng)新。平疇補(bǔ)充道,隨著5G的發(fā)展,網(wǎng)絡(luò)速度越來越快,視頻和直播的普及度越來越高。對于淘寶和阿里來說,傳統(tǒng)的電商是基于圖文和用戶進(jìn)行交互,5G會帶來新的購物方式。目前來看,直播是一種新的變化,5G的部署可能會讓直播上出現(xiàn)AR互動,底層的低延時直播相關(guān)技術(shù)(編解碼、低延時通信)應(yīng)該也會給消費(fèi)者帶來新的消費(fèi)體驗。

此外,AI、端計算、基于物理的3D渲染等技術(shù)在業(yè)務(wù)上的實施和應(yīng)用也是十分值得關(guān)注的技術(shù)。比如,阿里巴巴旗下家居家裝平臺躺平,將AI技術(shù)應(yīng)用到智能家居、家裝領(lǐng)域,智能化、自動化地為用戶提供專業(yè)設(shè)計師水準(zhǔn)的軟硬裝設(shè)計方案,并且基于物理的3D渲染技術(shù)能夠?qū)⒃O(shè)計師的設(shè)計方案渲染出照片級的逼真效果。同時,以全鏈路數(shù)字化改造為基礎(chǔ),以用戶定制化、場景化為消費(fèi)者提供服務(wù),形成端到端的解決方案,提供一站式全屋解決方案。這些技術(shù)的高度結(jié)合才能創(chuàng)造極致的用戶體驗。

# 采訪嘉賓 #

湯興博士,現(xiàn)任阿里巴巴副總裁,領(lǐng)導(dǎo)包括淘寶技術(shù)、天貓技術(shù)、農(nóng)村淘寶技術(shù)、閑魚、躺平 等多個團(tuán)隊組成的新零售技術(shù)事業(yè)群淘系技術(shù)部,致力于打造消費(fèi)者和商家一體化的新零售智能商業(yè)平臺,開創(chuàng)場景化新賽道。湯興博士擁有超過十年全球 TOP IT 公司研發(fā)及管理方面的工作經(jīng)驗,曾任谷歌上海研發(fā)中心技術(shù)總監(jiān),負(fù)責(zé)了 Google 視頻搜索業(yè)務(wù)及參與 YouTube 視頻搜索服務(wù)的研發(fā),后加入愛奇藝擔(dān)任 CTO,全面推動了視頻行業(yè)產(chǎn)品技術(shù)用戶體驗的創(chuàng)新和發(fā)展。——文章轉(zhuǎn)載自InfoQ

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
云服務(wù)器

相關(guān)文章

  • 影響云服務(wù)器性能的主要因素有哪些?

    性能是企業(yè)和云服務(wù)提供商比較關(guān)心的問題。那么為什么性能很重要,在使用美國云服務(wù)器時影響性能的因素有哪些?讓我們通過下面的文章一探究竟。

    標(biāo)簽:
    云服務(wù)器
  • 云服務(wù)器與物理機(jī)有哪些區(qū)別

    企業(yè)在選擇方面都是需要考慮很多因素,物理機(jī)就是獨(dú)立的一臺服務(wù)器,可以理解成物理機(jī)為一個大房子,這個房子的歸屬權(quán)就在你手里,而云服務(wù)器是大房子里的一個房間。

    標(biāo)簽:
    云服務(wù)器
  • 如何選擇更好的香港云服務(wù)器?

    云服務(wù)器很適合開發(fā)者和中小企業(yè)使用,不管是建站還是托管業(yè)務(wù)都可以放心使用云服務(wù)器。隨著香港云服務(wù)器越來越首歡迎,更多人關(guān)心如何選擇香港云服務(wù)器及云服務(wù)有哪些優(yōu)勢,

    標(biāo)簽:
    云服務(wù)器
  • 什么是裸機(jī)云?

    裸機(jī)云(BareMetalCloud),簡單地理解,它是一種裸機(jī)服務(wù)器,沒有預(yù)先安裝操作系統(tǒng)和應(yīng)用程序,用戶可以完全自定義配置。

    標(biāo)簽:
    云服務(wù)器
  • 香港云服務(wù)器有哪些優(yōu)勢?

    相對于物理服務(wù)器來說,云服務(wù)器使用更方便靈活,價格更優(yōu)惠,很多個人站長和小型企業(yè)都比較喜歡使用云服務(wù)器,其中香港云服務(wù)器更受歡迎。

    標(biāo)簽:
    云服務(wù)器

熱門排行

信息推薦