資料分析 Excel 檔案清洗函式

2021-10-13 23:11:45 字數 2889 閱讀 2052

說明:函式find用於在第二個文字串中定位第乙個文字串,並返回第乙個文字串的起始位置

比如第二文字串中有兩個第一文字串,根據起始位置定,返回的是與之相匹配的最前面的第一文字串的位置

語法:=find(find_text,within_text,[start_num])

備註:find_text 必需,為查詢的文字

within_text 必需,為包含要查詢文字的文字

start_num 可選,指定開始進行查詢的字元

within_text中的首字元是編號為1的字元。如果start_num,則預設其值為1.

find區分大小寫,並且不允許使用萬用字元。

事例:a1=10k-20k

(1)=find("k",a1,1) 返回結果是3

(2)=find("k",a1,2)返回結果是3

(3)=find("k",a1,4)返回的結果是7

注:返回的是都是從1開始計數,需要根據start_num判斷要查詢的第一文字的位置

說明:left從文字字串的第乙個字元開始返回指定個數的字元

語法:left(text,[num_chars])

備註:text 必需,包含要提取的字串的文字字串

num_chars 可選,指定要由left提取的字元的數量

如果num_chars大於文字長度,則left返回全部文字

如果省略num_chars,則預設其值為1.

事例:a2=10k-20k

(1)取出10,則第一步需要根據find函式確定10k中"k"的位置,第二步根據left函式取值

=find("k",a2,1) 返回3

=left(a2,3-1) 返回10

(2)取出20

=find("-",a2,1) 返回4

=right(a2,4-1) 返回20k

用《替換》按鈕將k替換成空格

類似left函式的使用

說明:返回文字字串中從指定位置開始的特定數目的字元,該數目由使用者指定

語法:=mid(text,start_num,num_chars)

備註:text 必需,包含要提取字元的文字字串

start_num 必需。文字中要提取的第乙個字元的位置。文字中第乙個字元的start_num為1,以此類推

num_chars 必需。指定希望mid從文字中返回字元的個數

事例:a2=10k-20k

(1)=mid(a2,1,2) 返回10

(2)提取20

第一步找到"-"的位置 =find("-",a2,1) 返回結果是4

第二步找到第2個"k"的位置=find("k",a2,4)返回結果是7

=mid(a2,4+1,2) 返回20

&"|concatenate

(1)當需要連線的量少時,可以選擇"&"連線符

事例:=8&"k" 返回8k

="big"&"_"&"small"返回 big_small

(2)concatenate函式

語法:concatenate(text1,text2,...)

=concatenate(8,"k") 返回8k

=concatenate("big","_","small") 返回 big_small

說明:根據指定的字元數,replace將部分文字字串替換為不同的文字字串,是根據文字位置尋找替換

語法:replace(old_text,start_num,num_chars,new_text)

old_text:必需 為替換其部分字元的文字

start_num:必需 old_text中要替換為new_text的字元起始位置

num_chars:必需 old_text中希望replace使用new_text來進行替換的字元數量

new_text:必需 將替換old_text中字元的文字

事例:a2=10k-20k

=replace(a2,4,2,"*") 返回10k*0k

說明:在文字字串用new_text替換old_text。如果需要在某一文字字串中替換指定的文字,請使用函式substitute;如果需要在某一文字字串中替換特定位置處的任意文字,請使用replcae函式。

語法:=substitute(text,old_text,new_text,[instance_num])

備註:text 必需,需要替換其中字元的文字,或對含有文字(需要替換其中字元)的單元格的引用

old_text 必需,需要替換的文字

new_text 必需,用於替換old_text的文字

instance_num 可選,指定要用new_text替換old_text的事件。如果指定了instance_num,則只有滿足要求的old_text被替換。否則,文字總出現的所有的old_text都會更改為new_text。

事例:a2=10k-20k

(1)=substitute(m2,"k","千") 返回結果10千-20千

(2)=substitute(m2,"k","千",1) 返回結果10千-20k

(3)=substitute(m2,"k","千",2) 返回結果10k-20千

說明:除單詞之間的單個空格外,移除文字中的所有空格

語法:trim(text)

備註:text 必需,要從中移除空格的文字

事例:=trim(" a big house ") 返回a big house

從公式的文字中移除前導空格和尾隨空格

說明:返回文字字串中的字元個數

語法:len(text)

備註:text 必需,要查詢其長度的文字。空格將作為字元進行計數

事例:=len("a big house ")返回12,中間和結尾的空格都算作字元

DA0203 資料清洗 資料分析之EXCEL

快捷 ctrl g 定位條件 空值 null等值,使用ctrl f查詢 2 處理缺失值 由於調查 編碼和錄入誤差,資料中可能存在一些無效值和缺失值,需要給予適當的處理。常用的處理方法有 估算,整例刪除,變數刪除和成對刪除。估算 estimation 最簡單的辦法就是用某個變數的樣本均值 中位數或眾數...

excel資料清洗 資料清洗excel

資料清洗與加工 目的 獲得具備準確性 完整性和一致性符合分析質量的資料。資料處理第一步 資料清洗 1 資料去重 方式1 刪除重複項功能。適用於有重複項出現的列,並且這樣的重複無意義,比如標識列。操作 資料 選項卡下的 刪除重複值 按鈕 方式2 排序刪除重複項。適用於需要人工判斷無用重複項的資料,即將...

資料分析常用Excel函式

不寫一遍看來我是記不住了 預處理 instance num 可選引數是數值形式,預設全部替換 start num 表示第幾位開始查詢,預設為1。注意返回值為find text在整個字串中的位置而不是從查詢位開始的位置。關聯匹配 lookup lookup value,array lookup 查詢的...