Excel DAY 02 資料處理基礎

2021-10-24 06:06:18 字數 1890 閱讀 9349

分類彙總方法 : 選中需要分組區域 – 資料 – 組合

複製分組後的結果方法 :

若是直接複製貼上 得到的將是沒有分組前的部分 如果我們只需要分組之後的部分

選中乙個單元格(需要貼上的起始座標) – 複製分好組的部分 – 開始 – 貼上 – 選擇性貼上 – 數值(或者值和數字格式)

複製前:

若不採用選擇性貼上:(無分組)

若是使用選擇性貼上:

如果在**區域內出現錯誤單元格 如!name 等 可以使用

開始 – 查詢 – 定位條件 – 公式 – 錯誤

即可選中所有該區域錯誤的單元格 (同時選中)

選中需要複製的區域(單元格也可) – 複製 – 選中需要貼上的單元格 – 輸入需要進行運算(加減乘除)的數字 比如1.5 – 開始 – 貼上 – 選擇性貼上 – 運算 – (乘)

tips: 我們可以通過選擇性貼上的方式進行轉格式 如文字格式*1即可轉為資料格式

如 需求是將這樣的**兩列變成一一對應的一列

這個地方我們需要引入乙個輔助列 輔助列的作用是 將資料一行一行隔開 做到這樣的形式

輔助列一般我們設定為等差數列 從1開始(若這個表的資料為50行)一直遞增填充1-50 步長為1 – 然後在同一列 加入51-100 1.5-50.5的步長為一的等差數列 – 將這個**與輔助列一起選中 對輔助列進行公升序排列(資料–公升序) – 複製金額部分 選擇性貼上 勾選跳過空單元格

目標將所有成績為0的替換為"0"

如果我們直接使用查詢替換 則會預設選中單元格內只要有0的部分全部替換為"0" 如下:

我們如果要避免這種情況 需要記得在替換時勾選 單元格匹配

資料驗證即為我們在此單元格內只能填寫我們預定的資料 如果不是預定的資料則會不予修改(並報錯)

我們通常使用資料驗證只能選中一行或者一列作為資料來源 選擇多行多列的資料進行資料驗證的預定資料

公式 – 名稱管理器 – 新建(假設名字為"name") – 引用位置(先填寫一行或一列) – 資料 – 資料驗證 – 允許(序列) – **(=「name」) – 返回名稱管理器 – 選中區域

選中資料區域 – 資料 – 資料驗證 – 允許(整數) – 資料(介於) – 最小值 最大值 – 資料驗證 – 圈示無效資料

一般我們使用分列功能可以選中某個特定的符號或者空格等進行分列 但是如果我們遇到大於乙個字元的進行分列 單憑分列功能就不能完全滿足需求

比如 足球比賽 中國vs義大利

我們的需求是使用vs這個字元對兩個國家進行分列 但是分列功能只能針對其中乙個字元 顯然不是最優解

我們可以使用開始 – 替換 將所有的vs替換為單個符號 再對資料進行分列

資料 – 合併計算 – 新建引用區域即可

資料處理 流資料處理利器

流處理 stream processing 是一種計算機程式設計正規化,其允許給定乙個資料序列 流處理資料來源 一系列資料操作 函式 被應用到流中的每個元素。同時流處理工具可以顯著提高程式設計師的開發效率,允許他們編寫有效 乾淨和簡潔的 流資料處理在我們的日常工作中非常常見,舉個例子,我們在業務開發...

爬蟲 資料處理 pandas資料處理

使用duplicated 函式檢測重複的行,返回元素為布林型別的series物件,每個元素對應一行,如果該行不是第一次出現,則元素為true keep引數 指定保留哪一重複的行資料 dataframe替換操作 使用df.std 函式可以求得dataframe物件每一列的標準差 資料清洗清洗重複值 清...

資料處理 pandas資料處理優化方法小結

資料處理時使用最多的就是pandas庫,pandas在資料處理方面很強大,整合了資料處理和資料視覺化。pandas的視覺化使用的是matplotlib。回到主題 計算資料的某個欄位的所有值,對其欄位所有值進行運算 處理的字段資料為時間戳,需要計算該時間戳距離現在的時間,單位為天。一般方法 使用現在的...