Python可以使用多種方式來讀取數據集,具體取決于數據集的格式和大小。下面是幾種常見的方法:
open()
函數來讀取文本文件:with open('dataset.txt', 'r') as file:
data = file.read()
csv
模塊來讀取CSV文件:import csv
with open('dataset.csv', 'r') as file:
reader = csv.reader(file)
data = list(reader)
pandas
庫來讀取各種格式的數據集,如CSV、Excel、SQL等:import pandas as pd
data = pd.read_csv('dataset.csv')
numpy
庫來讀取二進制數據集:import numpy as np
data = np.fromfile('dataset.bin', dtype=np.float32)
h5py
來讀取HDF5文件:import h5py
with h5py.File('dataset.hdf5', 'r') as file:
data = file['dataset_name'][:]
以上只是一些常見的讀取數據集的方法,實際上還有很多其他的方式,具體取決于數據集的特點和所使用的庫。