學習筆記5 處理資料檔案

2022-05-08 00:48:07 字數 1800 閱讀 3997

一、排序  sort

1、sort -n :按數字排序

2、sort -r :反向排序

3、sort -t +字元:指定字元為區分鍵

4、sort -k +n:指定第幾個字元

二、搜尋資料  grep

1)grep -關鍵字 +文件 :列出文件中跟關鍵字有關的資料,相當於模糊搜尋

2)grep -v +關鍵字 +文件 :列出文件中跟關鍵字無關的資料

4)grep -c +關鍵字 +文件 :列出文件中有多少個跟關鍵字匹配

5)grep -e +關鍵字 -e +關鍵字 +文件 :多個關鍵字匹配,也可以寫成:grep -e [關鍵字1 關鍵字2] +文件

三、查詢   find

1)find 目錄 -name +型別 :在目錄中查詢跟該型別的所有檔案,若提示【路徑必須在表示式之前】在型別前加『\』轉義

2)find 目錄 -size + 大小(nk/+nk) :在目錄中查詢小於nk/大於nk的檔案或目錄,k也可以替換成m,g

3)find 目錄 -mtime n:在目錄中查詢在n天之前的一天內修改過的檔案,n=0即當天修改過的檔案

4)find 目錄 -mtime +n :在目錄中查詢在n天之前修改過的檔案,不包含n

5)find 目錄 -mtime -n :在目錄中查詢n天之內修改過的檔案,包含n

6)find 目錄 -newer file :在目錄中查詢比file還要新的檔案

三、壓縮   zip、tar

1、zip

1)壓縮: zip -r 路徑/壓縮包名  檔案1 檔案2......

2)解壓:unzip -d 路徑 壓縮包名

格式: tar -zcvf 壓縮檔案名 被壓縮的檔案

z 指定壓縮檔案格式 tar.gz

v 顯示壓縮過程

f 指定檔名

x 解壓

c 指定壓縮後檔案存放的位置

1)壓縮

2)解壓

tar -xvf 壓縮包名 -c 指定路徑

23 處理資料檔案

資料分析需求 每行內容需要生成以每行 首年月日為名稱的檔案,檔案內容寫入 0 後的所有 行內容 也包括 0 演算法分析 遍歷每一行,每行取頭14個字母 新建檔案,檔名為首14個字母,然後把第15字元後的所有字 符拷貝到檔案中 關閉檔案 fp open e data.log for line in f...

C 學習筆記3 處理資料

c primer plus 第6版 讀書筆記 知識點 1.oop的本質是設計並擴充套件自己的資料型別。2.變數命名規則 字母字元 數字 下劃線 第乙個字元不能是數字 區分大小寫 不能使用關鍵字 以兩個下劃線或下劃線加大寫字母打頭的名稱被保留給實現 編譯器及使用的資源 使用,以乙個下劃線開頭的名稱被保...

Featuretools 學習5 處理時間

當對時間資料執行特徵工程的時候,謹慎選擇用於計算的資料是十分必要的。通過使用乙個time index列注釋實體 並且 在計算中提供乙個cutoff time時,featuretools會自動過濾截止時間之後的任何資料,然後再執行計算。時間索引是資料中的列,用於指定何時知道每一行中的資料,例如 檢查乙...