基於python的大資料分析之修改記錄

2021-10-01 17:19:00 字數 916 閱讀 7071

修改記錄是常有的事情,比如資料中有的需要整體替換,有的需要特別修改.

整體替換

整列、整行的替換很簡單,例如執行語句:df[『a列』] = score,該語句中score是將被填進去的資料列(可以是列表或者series)

個別修改

有以下幾種情況

# -*- coding: utf-8 -*-

"""created on wed dec 25 14:42:27 2019

@author: ericray

description: 基於python的大資料分析之修改記錄

"""import pandas as pd

#from pandas import read_excel

df = pd.read_excel(r'e:\python\hello\files\i_nuc.xls'

,sheet_name=

'sheet3'

)print

(df.head(),

'\n'

)#單值替換: df.replace('b','a') a替換b

print

('單值替換:\n'

,df.replace(

'作弊',0

))#指定列單值替換 ,0替換體育列中的作弊,軍訓列中的缺考

print

("指定列單值替換:\n"

,df.replace(,0

))"""多值替換:

df.replace(['a','b'],['c','d']) c替換a,d替換b

或者寫成

df.replace()

df.replace(,)

"""print

("多值替換:\n"

,df.replace(

))

基於python資料分析

資料質量分析是資料探勘中資料準備過程的重要 環,是資料預處理的前提,也是資料探勘分析結論有效性和準確性的基礎,沒有可信的資料,資料探勘構建的模型將是空中樓閣。資料質量分析的主要任務是檢查原始資料中是否存在髒資料,髒資料一般是指不符合要求,以及不能直接進行相應分析的資料。在常見的資料探勘工作中,髒資料...

《基於Apache Kylin構建大資料分析平台》

kyligence聯合創始人兼ceo,apache kylin專案管理委員會主席 pmc chair 韓卿 武漢市雲昇科技發展 董事長,智慧型城市 大資料 物聯網和雲計算之應用 作者楊正洪 萬達網路科技集團大資料中心副總經理,spark高階資料分析 中文版譯者龔少成 資料架構師,it脫口秀 清風那個...

Python大資料分析之網路爬蟲

d匹配乙個數字,d匹配乙個非數字,w匹配乙個字母或數字,可以匹配任意乙個字元,表示任意字元,表示至少乙個字元 表示0個或1個字元,表示n個字元,用表示n m個字元。1 d 表示匹配3個數字 2 s 表示至少匹配乙個空格 s 表示匹配任何非空白字元 s s 可以包括換行符在內的任意字元 3 d表示匹配...