Linux下怎么刪除大數據文件中部分字段重復行

發布時間：2021-07-26 21:49:58 來源：億速云閱讀：222 作者：chen 欄目：系統運維

本篇內容介紹了“Linux下怎么刪除大數據文件中部分字段重復行”的有關知識，在實際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領大家學習一下如何處理這些情況吧！希望大家仔細閱讀，能夠學有所成！

最近寫的一個數據采集程序生成了一個含有1千多萬行數據的文件，數據由4個字段組成，按照要求需要刪除第二個字段重復的行，找來找去linux下也沒找到合適的工具，sed/gawk等流處理工具只能針對一行一行處理，并無法找到字段重復的行。看來只好自己python一個程序了，突然想起來利用mysql，于是進行乾坤大挪移：

1. 利用mysqlimport --local dbname data.txt導入數據到表中，表名要與文件名一致
2. 執行下列sql語句(要求唯一的字段為uniqfield）

代碼如下:

use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;
drop table tablename;
rename table t2 to tablename;

“Linux下怎么刪除大數據文件中部分字段重復行”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站，小編將為大家輸出更多高質量的實用文章！

向AI問一下細節

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Linux下怎么刪除大數據文件中部分字段重復行

猜你喜歡

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

Linux下怎么刪除大數據文件中部分字段重復行

猜你喜歡

最新資訊

相關推薦

相關標簽