您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“python如何處理大型json文件”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“python如何處理大型json文件”這篇文章吧。
如圖所示,要處理的數據是一個json數組,而且非常大
下圖為電腦配置,使用 json.load() 方法加載上述json文件電腦直接卡死
解決思路:
先用python進行預處理,即一整個json數據加載慢,那就分開加載,每次加載一個json對象,然后使用 json.dumps()方法 存儲到txt中,方便讀取。當然也可以存儲到內存中,根據情況而定。
算法思想:因為 json 是一種結構化的數據,所以 {} 是成對存在的。因為使用逐行讀取的方法讀入json文件,所以根據 {} 的數量來判斷是否讀取了一個完整的json對象,如果是完整的,則使用 json.dumps()方法 存儲到txt中。
getUsefullData(temp + line,id)這個方法是提取自己需要的數據
def jsonProcess(fileName,round): id = 1 with open(fileName, 'r', encoding='utf-8') as f,open('../tempData/tempFile'+str(round)+'.txt','w') as tempFile: line = f.readline() line = f.readline() temp = '' khNum = 0 id = 1 while line: # print(line) if line.find('{') != -1: khNum += 1 if line.find('}') != -1: khNum -= 1 if khNum == 0: line = line.replace(',','') data = getUsefullData(temp + line,id) id += 1 if len(data) > 1: # print(data) try: tempFile.write(json.dumps(data)+'\n') except 'json.decoder.JSONDecodeError': break temp = '' line = f.readline() continue temp += line line = f.readline()
讀取方法:
with open('../tempData/tempFile'+str(round)+'.txt') as f: dataList = f.readlines() # 解析保存好的list for data in dataList: data = json.loads(data)
以上是“python如何處理大型json文件”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。