中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么用python標準庫difflib比較兩份文件的異同

發布時間:2021-04-25 10:46:05 來源:億速云 閱讀:216 作者:小新 欄目:開發技術

小編給大家分享一下怎么用python標準庫difflib比較兩份文件的異同,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

python的數據類型有哪些?

python的數據類型:1. 數字類型,包括int(整型)、long(長整型)和float(浮點型)。2.字符串,分別是str類型和unicode類型。3.布爾型,Python布爾類型也是用于邏輯運算,有兩個值:True(真)和False(假)。4.列表,列表是Python中使用最頻繁的數據類型,集合中可以放任何數據類型。5. 元組,元組用”()”標識,內部元素用逗號隔開。6. 字典,字典是一種鍵值對的集合。7. 集合,集合是一個無序的、不重復的數據組合。

【需求背景】

有時候我們要對比兩份配置文件是不是一樣,或者比較兩個文本是否異樣,可以使用linux命令行工具diff a_file b_file,但是輸出的結果讀起來不是很友好。這時候使用python的標準庫difflib就能滿足我們的需求。

下面這個腳本使用了difflib和argparse,argparse用于解析我們給此腳本傳入的兩個參數(即兩份待比較的文件),由difflib執行比較,比較的結果放到了一個html里面,只要找個瀏覽器打開此html文件,就能直觀地看到比較結果,兩份文件有差異的地方會高亮顯示出來。

【程序正文】

以python2.7為例,compare_two_files.py程序正文:

#!/bin/env python
# -*- coding: utf-8 -*-

# 20180430

import difflib
import sys
import argparse


# 讀取建表語句或配置文件
def read_file(file_name):
 try:
  file_desc = open(file_name, 'r')
  # 讀取后按行分割
  text = file_desc.read().splitlines()
  file_desc.close()
  return text
 except IOError as error:
  print 'Read input file Error: {0}'.format(error)
  sys.exit()


# 比較兩個文件并把結果生成一份html文本
def compare_file(file1, file2):
 if file1 == "" or file2 == "":
  print '文件路徑不能為空:第一個文件的路徑:{0}, 第二個文件的路徑:{1} .'.format(file1, file2)
  sys.exit()
 else:
  print "正在比較文件{0} 和 {1}".format(file1, file2)
 text1_lines = read_file(file1)
 text2_lines = read_file(file2)
 diff = difflib.HtmlDiff() # 創建HtmlDiff 對象
 result = diff.make_file(text1_lines, text2_lines) # 通過make_file 方法輸出 html 格式的對比結果
 # 將結果寫入到result_comparation.html文件中
 try:
  with open('result_comparation.html', 'w') as result_file:
   result_file.write(result)
   print "0==}==========> Successfully Finished\n"
 except IOError as error:
  print '寫入html文件錯誤:{0}'.format(error)


if __name__ == "__main__":
 # To define two arguments should be passed in, and usage: -f1 fname1 -f2 fname2
 my_parser = argparse.ArgumentParser(description="傳入兩個文件參數")
 my_parser.add_argument('-f1', action='store', dest='fname1', required=True)
 my_parser.add_argument('-f2', action='store', dest='fname2', required=True)
 # retrieve all input arguments
 given_args = my_parser.parse_args()
 file1 = given_args.fname1
 file2 = given_args.fname2
 compare_file(file1, file2)

【待比較的文件】

兩份文件分別是old_ddl_file和new_ddl_file,內容分別是—— 
old_ddl_file文件內容 
CREATE EXTERNAL TABLE raw_tags( 
p0 string COMMENT ‘uid', 
p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL', 
p4 string COMMENT ‘e.g. 0, Games', 
p11 int COMMENT ‘gender', 
dt string COMMENT ‘date, like 26/6/2017', 
action string COMMENT ‘clickmodule, click_taghead_link, clicklink') 
CLUSTERED BY ( 
dt) 
INTO 4 BUCKETS 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ‘,' 
STORED AS INPUTFORMAT 
‘org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' 
LOCATION 
‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags' 
TBLPROPERTIES ( 
‘numFiles'='1', 
‘numRows'='0', 
‘rawDataSize'='0', 
‘totalSize'='70575510', 
‘transient_lastDdlTime'='1500469448')

new_ddl_file文件內容 
CREATE EXTERNAL TABLE raw_tags( 
p0 string COMMENT ‘uid', 
p3 string COMMENT ‘tag name, e.g. news, games, fairs, shoopingURL', 
p4 string COMMENT ‘e.g. 0, Games', 
p11 int COMMENT ‘gender', 
dt string COMMENT ‘date, like 26/6/2017', 
action string COMMENT ‘clickmodule, click_taghead_link, clicklink') 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ‘,' 
STORED AS INPUTFORMAT 
‘org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
‘org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' 
LOCATION 
‘hdfs://hdfs-ha/apps/hive/warehouse/ksai.db/raw_tags' 
TBLPROPERTIES ( 
‘COLUMN_STATS_ACCURATE'='{\”BASIC_STATS\”:\”true\”}', 
‘numFiles'='0', 
‘numRows'='0', 
‘rawDataSize'='0', 
‘totalSize'='0', 
‘transient_lastDdlTime'='1521546069')

肉眼很難看出來區別吧?

【執行結果】

那么就使用上面的腳本來比較,在linux命令行的使用方法 python -f1 file1 -f2 file2 也就是:

python compare_two_files.py -f1 old_ddl_file -f2 new_ddl_file

怎么用python標準庫difflib比較兩份文件的異同

再把運行結果產生的html文件下載到本地,用任一種瀏覽器打開即可,如截圖:

怎么用python標準庫difflib比較兩份文件的異同

運行結果:

怎么用python標準庫difflib比較兩份文件的異同

使用瀏覽器查看html文件,可以看到,里面給出了各種顏色標注的圖例說明,一目了然。

看完了這篇文章,相信你對“怎么用python標準庫difflib比較兩份文件的異同”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

石林| 奉节县| 奉新县| 新民市| 高平市| 德清县| 孝义市| 霸州市| 大荔县| 霍邱县| 西和县| 涟水县| 沂水县| 泾阳县| 黔南| 南昌市| 绥江县| 霍州市| 尚志市| 通海县| 洛南县| 巧家县| 永兴县| 黄梅县| 休宁县| 铜山县| 阿拉善盟| 东源县| 若尔盖县| 桂阳县| 铜鼓县| 河西区| 乌恰县| 三亚市| 曲水县| 都昌县| 拉孜县| 武川县| 塔河县| 江津市| 黔西县|