中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》
  • 首頁 > 
  • 教程 > 
  • 數據庫 > 
  • 80后阿里P10,“關老板”如何帶著MaxCompute一路升級?

80后阿里P10,“關老板”如何帶著MaxCompute一路升級?

發布時間:2020-08-08 11:49:32 來源:ITPUB博客 閱讀:439 作者:養碼場訂閱號 欄目:數據庫

我是個幸運的人。雖然幸運不能被復制,但是眼光和努力可以。

80后阿里P10,“關老板”如何帶著MaxCompute一路升級?

關濤/關老板,80后的阿里P10,阿里巴巴通用計算平臺負責人,阿里巴巴計算平臺研究員。12年職場人生,微軟和阿里的選擇。

關濤的花名取自諧音:觀濤。有種看海觀濤的閑適,但在MaxCompute技術團隊里,因為團隊既要做核心技術,也要“落地拿結果”,承擔阿里云的客戶規模和營收,像一個小的創業公司,所以大家更喜歡叫他關老板,一下子就世俗親近了起來。

關老板是個北方人,大高個也帶著些書生氣。因為工作的關系,帶領著一支跨國團隊,兩岸四地奔波(太平洋兩岸,北京、杭州、西雅圖、加州),說話間偶爾喜歡中英文match一下。

“我是一個興趣驅動型的人,職業生涯總的來說,還算挺幸運的,做自己感興趣的事情,走上IT這一行……

如果有認識關濤的人,應該會忍不住說上一句:這家伙,運勢太好了吧。

一路保送,沒考過什么試,大學選擇計算機的原因也很任性,喜歡玩游戲。研究生畢業后就進入了微軟,是微軟最年輕的技術管理者,后來去了阿里云,不到3年時間,已經是P10,阿里巴巴通用計算平臺MaxCompute團隊負責人。

“特別特別久以前,大概初中的時候有了自己的第一臺電腦,大名鼎鼎的486,帶一個數學協處理器,主頻266MHz,內存只有4M。”

喜歡玩游戲的都知道,往往會碰見有些關卡比較難,闖不過去的情況。當時的關濤就想著:怎么能夠繞開系統這些設置?于是查了很多雜志也看了很多書,試圖去改游戲存檔,那個階段他第一次知道什么是十六進制,也是最初接觸編程

最后自己折騰著,操縱游戲角色大殺四方,簡直無敵。讓程序按照自己的意愿運行的感覺,“嘿,還好玩的。”

于是,開始覺得這個專業(計算機)不錯。到了高中畢業的時候,因為數學競賽被保送到南開大學,當時的一個選擇是可以進數學系,南開的王牌專業,但最后,關濤還是因為興趣選擇了計算機。

人生的分叉口有很多,有時候做了第1個選擇,后面的路都會開始相通,看似順勢而為,其實都是選擇的結果。

從200公里的北京到8000多公里的西雅圖

工作需要定期make a little change

2006年,關濤畢業了。這意味他要開始自己的職業生涯了,他有些躍躍欲試。

研究生的3年,因為導師有額外要求:不能去實習,這讓關濤對于招聘市場并不那么了解,對于微軟同樣是“沒有太多的認知”。但北京有個MSRA,微軟亞洲研究院,據說是當時最好的R&DCenter。

抱著試試看的心態,經歷了一整天的面試后,關濤順利地拿到了offer。 他回憶:“好像也不是那么難”。

在離家鄉河北承德200公里遠的北京,關濤一呆就是6年,是微軟Bing搜索北京團隊最初的幾十個人之一。從偏存儲層到計算層,在項目里不斷地去充實自己。他是個興趣驅動的人,但在工作中愿意變成完美主義者。

在微軟的第一個項目,是做一個分布式KV+ObjectStore系統,用于支持Bing搜索的圖片和視頻存儲。2006年,還沒有Hbase這樣的開源系統,當時6個人的小團隊完全手寫一套分布式KV,最終部署在3000臺機器并支持正常線上流量,在實戰中接觸到了分布式系統中的各種挑戰,也學到了非常多的東西。“這個項目,是個好的機會與開始”。

第二個項目是做搜索后臺的IndexGen Pipeline:一個定制化的存儲與計算系統,用于支持通用搜索100B級別的超大規模數據存儲和處理,后來這個搜索后臺也成為了微軟Bing搜索后臺的第二代架構,并服務至今。

再后來就是牽頭來做大數據上交互式查詢(JetScopeOn Cosmos),最后基本微軟一半以上的團隊都在用這個系統。

在關濤看來,不管是生活還是職業發展,定期去make a little change是很好的選擇,保持新鮮感的同時,能看到學到更多的東西從被別人帶著寫代碼、到自己獨立負責一些板塊,再到自己帶項目小組、帶大一點的技術團隊,這些都需要有一個自我時間界定,把握自己的發展節奏。

6年微軟后,他也準備make a bigger change:申請去了美國西雅圖的微軟總部。

8000多公里以外的城市,冬天不太冷,夏天不太熱,還有他最愛的單板滑雪,以至于一直堅持在每年的最后一天自駕去不同的滑雪地。

80后阿里P10,“關老板”如何帶著MaxCompute一路升級?

在美國期間,關濤繼續深入做交互式查詢、StructuredData優化推動等,也積累了很多跨國技術團隊管理的經驗。 “美國有近40年的歷史,團隊成員比北京的團隊更資深一些,在美國能夠看到不一樣的人,看到不一樣的項目。”

而在微軟的10年時間里,關濤也關注到了國內以BAT為代表的本土企業,他們發展的很好,而且有更高的加速度……

西雅圖分部第22號員工

10年后的回歸,面對更多的挑戰

“當時海外辦公室剛建起來,我是阿里西雅圖分部的第22號員工。”

在微軟10年,國內是什么情況?”好奇心不斷膨脹,于是在一次偶然的機會,關濤跳去了阿里,成為了阿里巴巴通用計算平臺MaxCompute團隊里的一員。這是2016年1月。

MaxCompute的前身是ODPS,阿里內部統一的大數據平臺,目前99%的數據存儲以及95%的計算能力都在這個平臺上產生如果把阿里巴巴集團的數據體系比作航母戰斗群,那么MaxCompute就是中間的航空母艦

面對這樣一個已經發展了近6年的相對成熟、體量極為龐大的平臺,挑戰非常多。而2016年1月入職阿里,2016年年會上就接過了MaxCompute的掌舵者位置,從0到1已經做完了,如何做到從1到10?留給關濤的時間并不多。

他認為,大型系統逐步發展,是一個不斷自我進化的過程,大數據系統也不例外。

微軟的經歷給了他一些幫助:包括同樣都是大數據引擎(規模上有較大差異),之前的技術和工程經驗都能復用。而豐富的跨國技術團隊管理經驗也讓關濤更加適應阿里的工作。

從MaxCompute1.0到MaxCompute2.0

“我們是在飛行的飛機上換引擎”

關濤回憶:“當時進來的時候,MaxCompute1.0 其實是在一個技術的成熟期上,承接了阿里巴巴內部和阿里云的核心業務,而引擎升級有技術風險和問題(我們稱為Regression,包括功能和性能的)。為了保證對上層透明,我們先做了一個框架升級,支持把引擎的不同版本同時部署在線上,一點一點地把流量切過來,同時觀察效果。”之后再進行引擎層面的大手術。

有點像是“在飛行的飛機上換引擎”。

80后阿里P10,“關老板”如何帶著MaxCompute一路升級?

如今的MaxCompute2.0相較于1.0版本,規模達到近10萬臺,性能提升超過1倍以上,每年為阿里巴巴節省預算超過20億,同時也讓阿里的大數據引擎可以在未來3-5年架構上有個相對好的布局。

  • MaxCompute2.0的具體內容,可以在云棲社區的論壇上搜索MaxCompute進行了解~

技術團隊如何管理

關濤的看法是:技術管理者歸根結底還是一個管理者。

1、首先考慮的不是自己要做什么事情而是幫助團隊做什么事情,更多的有一種“利他”的責任感。

2、技術前瞻性,技術團隊管理者是要帶著團隊有目標地、正確地往前走,把握未來方向非常重要。 

3、招聘層面,思考如何招到合適的人,如何進行人才布局。現在是人才在哪辦公地點就在哪的階段。

從大數據角度看阿里雙十一

要支持好雙十一,先從兩個統一說起(數據統一和資源統一)。

  • 數據具有1+1大于2的特性,不同的數據融合計算能產生更大的價值。而關鍵就在于如何把數據都打通。

  • 幾年前阿里巴巴建設中臺,把內部所有的數據放在一起(物理上分布在多地的近10萬臺服務器上,但邏輯上統一,數據的分布和調度對用戶透明),讓豐富的數據幫助產品、業務前進。

  • 資源的統一化:把所有機器放在一個大的資源池里(內部稱為混布項目),資源調度系統打通,對于機器的效率優化和整個系統的容災都有非常大的幫助。

  • 做大數據的都了解,數據可以3年翻5倍,機器卻不行,否則成本太高,不現實。而利用已有的服務器進行混合部署,“這也是近一年,我們重點投資的一個項目,也就是把不同BU、不同種類的機器部署在同一個資源池中。

有了這兩個統一架構的前提,雙十一在洪峰來臨的時候,可以選擇把不那么重要的工作先停掉(在百萬級別的作業中基于優先級和依賴做調度),讓這些機器都用來支撐洪峰。洪峰過后,又把機器主力轉移到計算上,把需要的計算盡快地輸出來。

今年雙十一,大數據集群在流量洪峰最高的幾個小時,通過彈性支持了超過1/4的交易業務流量。

不增加棋子,僅依靠挪動棋盤上的子,就完成布局守住將軍。當然,在此之前,團隊把MaxCompute已經從1.0版本切到了2.0版本,性能的提升也是支持雙十一數據量的關鍵。

在硬件只增加不到三分之一的基礎上,處理數據相較去年翻了一番,達到單日處理600PB的規模。可以說,MaxCompute在這一戰役中發揮得不錯,甚至比去年更為優秀。

未來:云化、新硬件、非結構化計算、非關系型計算、AI是趨勢

DBA或將被淘汰?

去年的時候,原阿里云總裁胡曉明說:“互聯網的云計算競爭是世界寡頭經濟的全面競爭,在我看來,就是杭州和西雅圖的競爭。誰擁抱技術,誰就擁抱未來。”場主深以為然。

關濤認為:目前云計算已經從互聯網企業向傳統企業蔓延,例如杭州的城市大腦和“最多跑一次“項目,是2G(To Government)的項目。還有基于工業大腦的工業4.0項目等。

從目前的市場態度來看,企業或許可以更加開放一些,歡迎和擁抱這種技術變化,完成自我的數字化轉型。云計算不會是寡頭反而會是普惠,關濤說。

前瞻話題:大數據處理領域,未來程序員應該關注什么東西?

1、 新硬件的發展

計算層面越來越與新硬件的創新緊密結合,硬件會帶來平臺革命。例如芯片類的CPU(AVX、SIMD)、ARM眾核架構、GPU,FPGA,ASIC,存儲類的NVM、SSD、SRM,網絡類的智能網卡和RDMA等新硬件的發展,新硬件與軟件的配合是值得關注的發展方向。

2、 非關系型計算領域(圖計算)有很多機會

大數據現在還是在關系型的處理層面,包括流和批都是基于關系型數據的計算,事實上,現在非關系的計算越來越流行了,包括知識圖譜、畫像等越來越有價值,這些數據組織不是關系型表達,而是以點邊的形式用圖的方式表達,更符合物理抽象,比如人和貨的關系,在風控層面,知識圖譜層面,用來描述物理實體的關系更合適。

明年初,將會推出MaxCompute的圖計算系統MaxGraph,支持圖存儲、查詢、模式匹配和GraphEmbedding等機器學習運算。

3、 非結構化數據將變成大數據的主流

越來越多的短視頻、圖片、語音類數據,并隨著IoT的發展,可能占據80%的數據量,由于這類數據的特性在于結構各不相同,且數據非常大但是單位價值不高(相比傳統結構化數據),如何快速高效的解析和處理非結構化數據,是計算平臺的關鍵挑戰。

去年的時候MaxCompute發布了一個非結構化數據處理模塊,能夠用戶自定義的方式處理包括視頻音頻在內的數據。

4、 Al for Everything(also for BigData)

DBA或將被淘汰?

大數據的特點是大,不僅僅是包括數據的處理規模,還包括了整個的海量數據的管理和優化傳統數據庫領域依靠DBA人力去管理的模式將不再適用。

用Al優化數據分布、數據管理、做計算優化和成本優化(例如自動SubQuery合并,智能索引建立等)。“讓大數據無人駕駛”這也是未來的趨勢。

關老板寄語

Wake up every day with a feeling of passion for the difference technology will make in people'slife。

每天早晨當你醒來時,都會為技術進步及其為人類生活帶來的發展和改進而激動不已

——引用自《比爾·蓋茨全傳》(《Biography of BillGates》)

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

建始县| 彩票| 德安县| 杭锦后旗| 通许县| 肥西县| 铁岭县| 名山县| 合江县| 大宁县| 固原市| 长泰县| 定西市| 阳谷县| 乃东县| 呼伦贝尔市| 娱乐| 达拉特旗| 县级市| 家居| 绥棱县| 信阳市| 凤翔县| 沿河| 芜湖县| 娄烦县| 搜索| 镇远县| 陆川县| 眉山市| 禹城市| 长岭县| 虹口区| 兴海县| 洛川县| 新余市| 南涧| 营山县| 沙湾县| 宾川县| 巴彦淖尔市|