您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關Python如何寫出新冠狀病毒確診人數地圖,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
第一步扒取數據:發現一個大問題,各省的確診人數網頁源代碼里竟然沒有。百度才知道這是js渲染生產的,又是一頓查。找到一種方法。用selenium執行一遍網頁渲染的過程就可以了,首先安裝selenium。
pip install selenium
在引用庫的時候還需要webdriver這個啟動瀏覽器的東西,我用的是google,所以要下載chromedriver。先查找自己chrome的版本
然后找到chromedriver的對應版本,下載
下載之后把exe文件解壓到編代碼的文件夾里就可以使用了。現在可以爬數據了,導入庫
from selenium import webdriver
然后驅動瀏覽器,并訪問網址
driver = webdriver.Chrome() driver.get('https://news.163.com/special/epidemic/#map_block')
這里記住得設置一個等待,要不然爬取數據的時候可能程序運行完了網頁還沒打開
driver.implicitly_wait(5)
這時就可以獲取數據了
data = driver.page_source
還是得用正則表達式篩選一下想要的數據,別忘了在前面導入import re
name = re.findall(r'<span class="item_name">(.*?)</span>',data,re.S)[1:32] value = re.findall(r'span class="item_confirm">(.*?)</span>',data,re.S)[1:32]
爬取成功
已經爬取到數據了,接下來就是可視化的部分了,用到pyecharts的Map塊。
pyecharts文檔鏈接在這里——按照文檔里把庫導入
地圖的代碼如下
但是我Faker這個下不下來,后來查了一下用了這個大佬的方法:地址
整體代碼如下:
from pyecharts.charts import Map from pyecharts import options as opts import re from selenium import webdriver driver = webdriver.Chrome() driver.get('https://news.163.com/special/epidemic/#map_block') driver.implicitly_wait(5) #data = driver.find_element_by_xpath('/html/body/div[3]/div[2]/div[2]/ul[1]/li[1]/div/span[1]').text#.get_attribute('href') data = driver.page_source attr = re.findall(r'<span class="item_name">(.*?)</span>',data,re.S)[1:32] value = re.findall(r'span class="item_confirm">(.*?)</span>',data,re.S)[1:32] sequence = list(zip(attr, value)) def map_visualmap(sequence, year) -> Map: c = ( Map() .add(year, sequence, "china", ) .set_global_opts( title_opts=opts.TitleOpts(title="新冠裝狀病毒各省確診人數"), visualmap_opts=opts.VisualMapOpts(max_=130, min_=95), ) ) return c map = map_visualmap(sequence, '新冠病毒感染情況') map.render(path='2020.html')
關于“Python如何寫出新冠狀病毒確診人數地圖”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。