中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python數據挖掘如何進行預處理

發布時間:2020-11-16 09:34:33 來源:億速云 閱讀:321 作者:小新 欄目:編程語言

這篇文章給大家分享的是有關Python數據挖掘如何進行預處理的內容。小編覺得挺實用的,因此分享給大家做個參考。一起跟隨小編過來看看吧。

Python數據預處理實戰

常見的數據預處理方法如下內容:

1、缺失值處理

缺失值是指在一組數據中,某行數據缺失的某個特征值。

2、異常值處理

異常值產生的原因往往是數據在采集時發生了錯誤,如在采集數字68時發生了錯誤,誤將其采集成680。

3、數據集成

相較于上文的缺失值處理和異常值處理,數據集成是一種較為簡單的數據預處理方式。

接下來以淘寶商品數據為例,介紹一下上文預處理的實戰。

在進行數據預處理之前,首先需要從MySQL數據庫中導入淘寶商品數據。在開啟MySQL數據庫之后,對其中的taob表進行查詢,得到了如下的輸出:

Python數據挖掘如何進行預處理

可以看到,taob表中有四個字段。其中title字段用于存儲淘寶商品的名稱;link字段存儲淘寶商品的鏈接;price存儲淘寶商品的價格;comment存儲淘寶商品的評論數(一定程度上代表商品的銷量)。

通過pymysql連接數據庫(如果出現亂碼,則對pymysql的源碼進行修改),連接成功后,將taob中的數據全部檢索出來,然后借助pandas中的read_sql()方法便可以將數據導入到內存中。

感謝各位的閱讀!關于Python數據挖掘如何進行預處理就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

洛南县| 故城县| 潍坊市| 宁晋县| 明水县| 扬州市| 汉阴县| 长乐市| 行唐县| 理塘县| 海盐县| 红河县| 治县。| 拉萨市| 盖州市| 台州市| 瑞昌市| 中牟县| 新密市| 兴安县| 苍溪县| 达州市| 岳阳市| 合川市| 罗山县| 曲阜市| 黔东| 山阴县| 焉耆| 盐亭县| 连城县| 安庆市| 扶风县| 嫩江县| 德钦县| 交城县| 武穴市| 灵武市| 梅河口市| 石棉县| 泸定县|