您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關使用python怎么提取文件的指定列,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
之前用featureCount 處理得到結果,要提出第一列gene_id 和 readcount 列,首先軟件輸出的第一行默認是你使用的命令行,沒有用,用bash批量刪掉。
for i in `ls`;do sed -i '1d' $i;done
刪除當前文件夾下所有文件第一行。
其實提出兩列很簡單,不過我受夠了每次一個文件執行一次的煩。想搞成別的程序調用時命令行參數直接就行。第一次知道sys.argv這玩意,學到了。
我設置了 -i 輸入,-o 輸出 這兩個參數來判斷輸入輸出文件個數,不過對于錯誤命令行輸入的判斷還很欠缺,畢竟只有自己用。
上代碼:
import sys leng=len(sys.argv) for i in range(leng): # index the input file and output file location,maybe it's too complex if sys.argv[i]=="-i": it=i if sys.argv[i]=="-o": out=i for i in range(it+1,out): # input file number(there should have same # of in and out file) print(sys.argv[i]) file=open(sys.argv[i],'r') f=open(sys.argv[i+out-it],'w') count=[] for lines in file.readlines(): two=[] lines=lines.rstrip('\n') b=lines.split('\t') two.append(b[0]) if(b[6].startswith('.')): #chage path to count,some output problem b[6]="count" two.append(b[6]) s='\t'.join(two) f.write(s+'\n') f.close
上述就是小編為大家分享的使用python怎么提取文件的指定列了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。