中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么用Python分析全網取暖器數據

發布時間:2021-11-23 16:28:00 來源:億速云 閱讀:157 作者:iii 欄目:大數據

本篇內容主要講解“怎么用Python分析全網取暖器數據”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“怎么用Python分析全網取暖器數據”吧!

用Python分析全網取暖器數據

我們使用Python獲取了淘寶網搜索關鍵詞暖氣片、取暖器、壁掛爐的商品數據,并進行了數據分析。

讀取數據

首先導入獲取的數據。

# 導入工具包
import numpy as np 
import pandas as pd 

from pyecharts.charts import Bar, Pie, Map, Page
from pyecharts import options as opts

import jieba 

# 讀取數據
df_all = pd.read_csv('../data/導出數據.csv')
df_all.head()

怎么用Python分析全網取暖器數據

df_all.shape
(13212, 7)

數據清洗和整理

此處我們需要對數據集進行數據清洗以便后續分析和可視化,主要工作內容如下:

  • 刪除記錄的重復值

  • goods_price列處理:提取數值

  • purchase_num列處理:提取數值

  • 計算銷售額sales_volume = goods_price*purchase_num

  • 刪除多余的列

代碼實現如下:

df = df_all.copy()
# 去除重復值
df.drop_duplicates(inplace=True)
df.shape
(6849, 7)

# 篩選記錄
df = df[df['purchase_num'].str.contains('人付款')]

# goods_price列處理
df['goods_price'] = df['goods_price'].str.extract('(\d+\.{0,1}\d*)')  
df['goods_price'] = df['goods_price'].astype('float')

# purchase_num列處理
df['num'] = df['purchase_num'].str.extract('(\d+\.{0,1}\d*)')
df['num'] = df['num'].astype('float') 
df['unit'] = [10000 if '萬' in i else 1 for i in df['purchase_num']]

# 計算銷量
df['purchase_num'] = df['num'] * df['unit']

# 計算銷售額
df['sales_volume'] = df['goods_price'] * df['purchase_num']

# 提取省份字段 
df['province_name'] = df['location'].astype('str').str.split(' ').apply(lambda x:x[0]) 

# 刪除多余的列
df.drop(['num', 'unit', 'detail_url'], axis=1, inplace=True)

# 重置索引
df = df.reset_index(drop=True)
df.head()

怎么用Python分析全網取暖器數據

可以看到"取暖器">

接著,看到店鋪月銷量排名Top10。

店鋪月銷量排名Top10

怎么用Python分析全網取暖器數據

可以看到店鋪銷量前十,凱瑞萊旗艦店位居第一。其后春尚電器專營店和蘇寧易購分別是第二第三名。排在前十的還有美的、tcl等品牌。

# 計算top10店鋪
shop_top10 = df.groupby('shop_name')['purchase_num'].sum().sort_values(ascending=False).head(10)

全國各省份產地銷量排名Top10

這些取暖器的產地都在哪兒呢?經過分析發現,浙江是生產取暖器的頭號大省,在產地銷量排名中一騎絕塵位居第一。之后排在第二位的是廣東。湖南、江蘇、山東分別位居第三第四第五名。

# 計算銷量top10
province_top10 = df.groupby('province_name')['purchase_num'].sum().sort_values(ascending=False).head(10)

不同價格區間的商品數量占比

怎么用Python分析全網取暖器數據

取暖器都賣多少錢呢?經過分析發現,100元以下的商品是最多占比高達34.76%。其次是200-500元的商品,占比22.09%。

不同價格區間的銷量占比

與此同時,在銷量方面,價格在100元以下和100-200元之間的取暖產品也是銷量最好的,全網銷售量分別占比37.49%和35.92%。

到此,相信大家對“怎么用Python分析全網取暖器數據”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

普安县| 恩平市| 海门市| 翼城县| 辽中县| 红桥区| 资阳市| 恩平市| 白山市| 昂仁县| 永泰县| 资讯| 新疆| 重庆市| 南城县| 哈巴河县| 夏津县| 九寨沟县| 樟树市| 扶绥县| 黄平县| 罗定市| 新丰县| 临桂县| 贵港市| 中方县| 肥东县| 桑植县| 贵溪市| 肥乡县| 阿拉尔市| 乐至县| 许昌县| 清河县| 申扎县| 随州市| 买车| 竹溪县| 定结县| 内乡县| 岑溪市|