Excel DAY 02 資料處理基礎

分類彙總方法 : 選中需要分組區域 – 資料 – 組合

複製分組後的結果方法 :

若是直接複製貼上得到的將是沒有分組前的部分如果我們只需要分組之後的部分

選中乙個單元格(需要貼上的起始座標) – 複製分好組的部分 – 開始 – 貼上 – 選擇性貼上 – 數值(或者值和數字格式)

複製前:

若不採用選擇性貼上:(無分組)

若是使用選擇性貼上:

如果在**區域內出現錯誤單元格如!name 等可以使用

開始 – 查詢 – 定位條件 – 公式 – 錯誤

即可選中所有該區域錯誤的單元格 (同時選中)

選中需要複製的區域(單元格也可) – 複製 – 選中需要貼上的單元格 – 輸入需要進行運算(加減乘除)的數字比如1.5 – 開始 – 貼上 – 選擇性貼上 – 運算 – (乘)

tips: 我們可以通過選擇性貼上的方式進行轉格式如文字格式*1即可轉為資料格式

如需求是將這樣的**兩列變成一一對應的一列

這個地方我們需要引入乙個輔助列輔助列的作用是將資料一行一行隔開做到這樣的形式

輔助列一般我們設定為等差數列從1開始(若這個表的資料為50行)一直遞增填充1-50 步長為1 – 然後在同一列加入51-100 1.5-50.5的步長為一的等差數列 – 將這個**與輔助列一起選中對輔助列進行公升序排列(資料–公升序) – 複製金額部分選擇性貼上勾選跳過空單元格

目標將所有成績為0的替換為"0"

如果我們直接使用查詢替換則會預設選中單元格內只要有0的部分全部替換為"0" 如下:

我們如果要避免這種情況需要記得在替換時勾選單元格匹配

資料驗證即為我們在此單元格內只能填寫我們預定的資料如果不是預定的資料則會不予修改(並報錯)

我們通常使用資料驗證只能選中一行或者一列作為資料來源選擇多行多列的資料進行資料驗證的預定資料

公式 – 名稱管理器 – 新建(假設名字為"name") – 引用位置(先填寫一行或一列) – 資料 – 資料驗證 – 允許(序列) – **(=「name」) – 返回名稱管理器 – 選中區域

選中資料區域 – 資料 – 資料驗證 – 允許(整數) – 資料(介於) – 最小值最大值 – 資料驗證 – 圈示無效資料

一般我們使用分列功能可以選中某個特定的符號或者空格等進行分列但是如果我們遇到大於乙個字元的進行分列單憑分列功能就不能完全滿足需求

比如足球比賽中國vs義大利

我們的需求是使用vs這個字元對兩個國家進行分列但是分列功能只能針對其中乙個字元顯然不是最優解

我們可以使用開始 – 替換將所有的vs替換為單個符號再對資料進行分列

資料 – 合併計算 – 新建引用區域即可

資料處理流資料處理利器

流處理 stream processing 是一種計算機程式設計正規化，其允許給定乙個資料序列流處理資料來源一系列資料操作函式被應用到流中的每個元素。同時流處理工具可以顯著提高程式設計師的開發效率，允許他們編寫有效乾淨和簡潔的流資料處理在我們的日常工作中非常常見，舉個例子，我們在業務開發...

爬蟲資料處理 pandas資料處理

使用duplicated 函式檢測重複的行，返回元素為布林型別的series物件，每個元素對應一行，如果該行不是第一次出現，則元素為true keep引數指定保留哪一重複的行資料 dataframe替換操作使用df.std 函式可以求得dataframe物件每一列的標準差資料清洗清洗重複值清...

資料處理 pandas資料處理優化方法小結

資料處理時使用最多的就是pandas庫，pandas在資料處理方面很強大，整合了資料處理和資料視覺化。pandas的視覺化使用的是matplotlib。回到主題計算資料的某個欄位的所有值，對其欄位所有值進行運算處理的字段資料為時間戳，需要計算該時間戳距離現在的時間，單位為天。一般方法使用現在的...

Excel DAY 02 資料處理基礎

資料處理 流資料處理利器

爬蟲 資料處理 pandas資料處理

資料處理 pandas資料處理優化方法小結

相關推薦

資料處理流資料處理利器

爬蟲資料處理 pandas資料處理