NLP Unix命令 第一節練習 1

2021-09-11 20:22:41 字數 1184 閱讀 9285

文字無處不在,我們可以利用unix的命令列做一些簡單的操作,有的甚至比編寫python程式要快得多。

trtr是個簡單的替換命令,從標準輸入中替換、縮減和/或刪除字元,並將結果寫到標準輸出。

tr [option]…set1[set2]

sort

將文字檔案內容加以排序,sort可針對文字檔案的內容,以行為單位來排序。

sort [-bcdfimmnr][-o《輸出檔案》][-t《分隔字元》][+《起始字段》-《結束字段》][–help][–verison][檔案]

uniq

linux uniq 命令用於檢查及刪除文字檔案中重複出現的行列,一般與 sort 命令結合使用

uniq [-cdu][-f《字段》][-s《字元位置》][-w《字元位置》][–help][–version][輸入檔案][輸出檔案]

head

head命令用於顯示檔案的開頭的內容。在預設情況下,head命令顯示檔案的頭10行內容。

revrev命令將檔案中的每行內容以字元為單位反序輸出

tail

用於顯示指定檔案末尾內容,常用檢視日誌檔案

tr -sc 『a-za-z』 『\n』 < nyt_201811.txt | sort | uniq -c

可以使用head只列出一些結果

tr -sc 『a-za-z』 『\n』 < nyt_201811.txt | tr 『a-z』 'a-z『 | sort | uniq -c

或者tr -sc 『a-za-z』 『\n』 < nyt_201811.txt | tr 『[:upper:]』 『[:lower:]』 | sort | uniq -c

tr -sc 『a-za-z』 『\n』 < nyt_201811.txt | tr 『a-z』 『a-z』 | tr -sc 『aeiou』 『\n』 | sort | uniq -c

tr -sc 』a-za-z』 『\n』 < nyt_201811.txt | sort | uniq -c | sort -nr | head -n 50

tr -sc 』a-za-z』 『\n』 < nyt_201811.txt | tr 『a-z』 『a-z』 | rev | sort | uniq -c | rev | tail -n 10

??發現不止這麼少以』zz『結尾

第一節綜述

shader是什麼?shader是著色器。渲染流水線的概念?渲染流水線的工作任務在於由乙個三維場景出發,生成一張二維影象。渲染流程分為3個階段 應用階段 幾何階段 光柵化階段。1 應用階段 由cpu負責實現,由開發者主導。最重要的輸出是渲染所需的幾何資訊,即渲染圖元。這些渲染圖元傳遞給幾何階段。2 ...

第一節 熱機

一.熱機 內燃機是熱機的一種,以汽油或柴油為燃料 二.汽油機 練1.三.柴油機 練2.從能量轉化的角度看,一台四衝程內燃機在乙個迴圈中 1 哪個衝程存在著化學能轉化為內能的過程?2 哪個衝程存在著內能轉化為機械能的過程?3 哪個衝程具有很明顯的機械能轉化為內能的過程?練3.關於單缸四衝程內燃機,下列...

第一節 1C 基礎

using system using system.collections.generic using system.linq using system.text virutal studio 是開發工具 c 是一種語言c sharp net framework是提供函式庫類庫 建立第乙個控制台程式...