您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python爬蟲爬取并簡單分析A股公司數據”,在日常操作中,相信很多人在Python爬蟲爬取并簡單分析A股公司數據問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Python爬蟲爬取并簡單分析A股公司數據”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
利用Python爬取并簡單分析A股公司數據。讓我們愉塊地開始吧~
requests模塊;
bs4模塊;
lxml模塊;
pyecharts模塊;
wordcloud模塊;
jieba模塊;
以及一些Python自帶的模塊。
安裝Python并添加到環境變量,pip安裝需要的相關模塊即可。
目標網站:
http://www.askci.com/reports/
需要爬取的數據如下圖所示:
懶得動腦子了,直接借助BeautifulSoup提取的這些數據,簡單粗暴,源代碼如下:
完整源代碼詳見個人主頁或私信獲取相關文件中的Spider.py文件。
運行效果截圖如下:
All done~
在數據爬取部分,我們共獲得了3573條A股公司數據,下面我們就來簡單地可視化分析一波吧~
首先讓我們來看看A股公司的區域分布吧:
其中A股公司超過三百家的省份有:
廣東
北京
浙江
江蘇
接下來再來看看A股公司的收入情況吧:
其中主營業業務收入TOP10為:
再來看看A股公司的員工數量唄:
再來看看A股公司的上市時間分布唄:
其中,2013年上市的公司數量最少(2個);2017年上市的公司數量最多(438個)。
OK,要不我們再來看看A股公司所在的行業類型占比TOP10吧:
Emmmm,很真實。
到此,關于“Python爬蟲爬取并簡單分析A股公司數據”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。