您好,登錄后才能下訂單哦!
這篇文章主要講解了“python編碼格式導致csv讀取錯誤怎么解決”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“python編碼格式導致csv讀取錯誤怎么解決”吧!
本文記錄python小白我今天遇到的這兩個問題(csv.reader和pandas.csv_read):
pandas模塊“CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2”錯誤
csv模塊“line contains NULL byte”錯誤
今天處理數據時疏忽了,而且還偷懶把數據復制到xlsx保存后,直接修改文件后綴成.csv準備用來讀取。之后運行算法要讀數據的時候果然問題來了。
import pandas as pd path = 'water30.csv' df=pd.read_csv(path)
注:后兩行可寫作df=pd.read_csv('water30.csv')。
但由于read_csv本身有好多參數(雖然這里不用), 故寫成path習慣好些。
這樣會報錯CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2
我在網上查了好多種解決辦法,由于read_csv的參數很多,所以各有其詞,我這里遇到的應該也只是其中一種,久尋無果。直到我看到這里說看了模塊_csv.c的代碼后,發現文件里不能有 “\0”, 所以csv文件不可以是unicode編碼的,可以是ANSI。
針對我直接改后綴名的結果是,點擊那個.csv打開時就已經提示我:
也就是這里改后綴并沒有把文件格式弄好。所以我選擇“另存為”改選了文件格式為
之后,讀取就不會報錯了。
注:有個疑問沒有解決,就是那個我“直接改后綴得到的那個.csv”我用記事本打開查看了一下,編碼就是ANSI啊。那我就不知道為什么報錯了……不過問題倒是暫時解決了。
現在讀取到的格式為
是個結構體。
另外,對于:csv模塊“line contains NULL byte”錯誤。和上面出現問題原因和解決方案是一樣的,比如
import csv csvfile=file('water30.csv','rb') reader = csv.reader(csvfile) for line in reader: print line csvfile.close()
報錯:Error: line contains NULL byte
修正后,讀入的數據格式為list,如下
[‘1’, ‘2’, ‘2’, ‘1’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘1’, ‘2’, ‘1’, ‘1’, ‘1’]
[‘1’, ‘1’, ‘1’, ‘1’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘1’, ‘1’, ‘1’, ‘2’, ‘2’]
[‘0.697’, ‘0.744’, ‘0.634’, ‘0.403’, ‘0.481’]
[‘0.46’, ‘0.376’, ‘0.264’, ‘0.237’, ‘0.149’]
[‘1’, ‘1’, ‘1’, ‘1’, ‘1’]
錯誤提示:
pandas.errors.ParserError: Error tokenizing data. C error: Expected 1 fields in line 121, saw 2
解決方法:
import pandas as pd data = pd.read_csv(inputfile, encoding='utf-8',header=None,sep = '\t')
錯誤提示:
pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string starting at line 15945
解決方法:
import pandas as pd import csv df = pd.read_csv(csvfile, quoting=csv.QUOTE_NONE, encoding='utf-8')
感謝各位的閱讀,以上就是“python編碼格式導致csv讀取錯誤怎么解決”的內容了,經過本文的學習后,相信大家對python編碼格式導致csv讀取錯誤怎么解決這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。