您好,登錄后才能下訂單哦!
君子生非異也,善假于物也。
“物”能夠延展英雄的能力。它是呂布的赤兔馬,楊過的玄鐵重劍,CS中的沙漠之。鷹,曹操傳中的鳳凰羽衣。“物”也可用以治愈英雄,例如張無忌的黑玉斷續膏,李逍遙的天香續命露,還有深夜里TVB的一碗面。
對于不同的位面,有著不同的寶物定義。對古時文人來講,筆墨紙硯,是當時具有生產力輸出的四大工具。對程序員來講,當代的“文房四寶”不外乎是:筆 記本,大屏幕,機械鍵盤,人體工學椅,Google,Github這幾種。特別是機械鍵盤和人體工學椅,它們是極為重要的“人機接口”。前者可以用來延展 英雄的輸出能力,后者可以用來治愈英雄的腰椎。
在數據領域也有類似的情況。一個數據項目,最重要的是定義問題,其次是拿到好的數據,再次是找到合適的方法,最不重要的可能就是選擇一個工具了。但是看起來最形而下的工具,卻是最具體而真實的“人數接口”。用一種順手的工具來玩數據,我們會覺得比較舒服,輸出效率更高。
市面上的分析工具大致分為兩大類,菜單式的工具和命令行式的工具。前者適合于初學入門,類似于跟團旅游,提供了固定的路線。分析套路比較固定化,點 幾下鼠標就可以搞定也很省事。后者適合于老手玩家,類似于自由行,需要自己規劃數據工作流,適用于自定義的靈活分析。大多數用戶害怕命令行,然而使用命令 行才能掌握真正的力量。命令行是Jedi的原力。
在命令行工具類別中,最耀眼的是R和Python這對雙星。他們有非常多的相似之處,第一個相似之處是“快”。這種快不是純計算速度快,而是從想法 到結果的快。因為不論是探索數據還是建模,都需要各種嘗試各種試錯各種踩坑,如果要花2小時寫代碼,跑1分鐘,不如花1分鐘寫程序,跑1小時。因為人的時 間總是更為寶貴。第二個相似之處是擴展豐富。即有大量現成的函數模塊。從想法到結果的快速實現,不能等待重新造輪子,另一方面,試錯也要做很多復雜的自定 義任務,將各種模塊進行組合,調用各種外部交互接口,這兩種開源工具都非常擅長。
二者的差異點在于Python是一種通用型編程工具,R專注于數據領域;R有更為豐富的專業統計函數,Python則長于機器學習;R有更好的可視 化包,Python正在快速追趕;Python和R的核心語法非常簡潔,一些R包的語法則兼收并蓄,錯綜復雜。當你有時間的時候,雙修是最好的選擇。因為 這兩種工具類似于筷子和勺子的區別,在不同場景下使用某種工具更為有效。
R語言這個工具與其生態系統,在統計之都上已經介紹得非常多了。下文簡單介紹一下python的七個最為重要的數據分析模塊,或者稱之為七種武器。
Numpy是Python提供數值計算的基礎模塊,也是Python生態中歷史最為悠久的模塊,可稱得上“長生”二字。如果沒有這柄長生劍,就沒有 辦法做快速高效的向量化計算。它還提供了線性代數等高級矩陣運算功能,另外還能集成C的代碼,讓你出劍更加的快。Python的許多擴展模塊都是基于 Numpy開發的,所以學好Numpy就算是奠定好了根基。
SciPy是基于Numpy開發的高級模塊,它用于解決科學計算中的一些標準問題。例如數值積分和微分方程求解,擴展的矩陣計算,最優化,概率分布和統計函數,甚至包括信號處理。練習好碧玉刀和長生劍,就足以解決常見的計算問題,并不需要自己哼哧哼哧造輪子寫函數了。
孔雀的尾羽聚合了世間所有的色彩,做數據研究同樣需要漂亮的可視化工具。Matplotlib是python下最著名的繪圖庫,提供了一整套和 Matlab相似的API,十分適合交互式繪圖。也可將它作為繪圖控件,嵌入各種應用程序中。在其基礎之上,還有更為有趣的繪圖工具Seaborn和 Bokeh。
在數據整理階段,我們經常需要連接讀定不同類型的數據源,處理不同格式的數據對象,如果只使用Numpy會很麻煩。Pandas使Python具備 了類似R的數據框對象。這樣方便用于真實江湖的數據處理和分析,它提供大量易用、高效的數據操作函數庫,能執行join以及其他SQL類似的功能來重塑數 據,支持各種格式的輸入輸出數據。它與Python生態中的其它模塊也有很好的整合,多情環名不虛傳。
Statsmodels是python中專門用于統計分析的模塊,提供各種回歸模型函數,包括廣義回歸和穩健回歸,還提供大量時間序列分析函數,例如ARIMA/VAR,各種經典假設檢驗和非參數方法一個都不少。有了離別鉤,你可以隨時和R說離別。
Scikit-learn是非常著名的機器學習庫,它提供一個統一的接口來使用不同模型,有助于迅速地在數據集上應用流行的算法。它包含了許多用于 標準機器學習任務的工具,例如聚類、分類和回歸等。不僅是各種算法,機器學習中重要的特征選擇和模型評估均在模塊中包含了。值得一提的另一個模塊 gensim:提供了詞向量、主題模型等函數。有了這兩種模塊,天下就絕沒有不能解決的事。
古龍并未寫完最后的第七種武器,通常會將《英雄無淚》中的一口箱子作為最為神秘最為強悍的終級武器。在Python生態中,一口箱子只能屬于 TensorFlow。它作為名門大派出品的深度學習框架,一出世就備受矚目。TensorFlow提供了C++和python兩種接口,讓你能高效的設 計各種機器學習算法,并且能運行在各類硬件架構之上。此外還有各種強力組件搭配,TensorBoard用于監控學習過程中的各項參 數,TensorServer可用于生產環境的模型部署,甚至傳說還有TPU這種專門用于深度學習的芯片。
在數據江湖中,沒有順手的武器,英雄亦束手加班中。七種武器雖強,但器物總是死的,更重要的是從器物的把玩中,能領悟到運用之妙,數據之道。一件武 器是否能令讀者覺得神奇有價值,主要還是得看使用它的是什么人。有赤兔的呂布沒有看到明天,沒有玄鐵重劍的楊過卻有更進一步的修煉。
江湖路遠,少俠們一路走好。
大家在學python的時候肯定會遇到很多難題,以及對于新技術的追求,這里推薦一下我們的Python學習扣qun:784758214,這里是python學習者聚集地!!同時,自己是一名高級python開發工程師,從基礎的python腳本到web開發、爬蟲、django、數據挖掘等,零基礎到項目實戰的資料都有整理。送給每一位python的小伙伴!每日分享一些學習的方法。和需要注意的小細節
點擊: python技術分享交流
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。