dataframe的一些操作

2021-10-02 02:14:56 字數 3030 閱讀 2811

09-dataframe的修改操作

import pandas as pd

# 載入資料

data = pd.read_excel(

"./users.xlsx"

)print

('data:\n'

, data)

print

('data 的列索引;\n'

, data.columns)

# 將age 修改18歲

# data.loc[:, 'age'] = 18

# 將*** 為 男 全部 改為 女

# bool_index = data.loc[:, '***'] == '男'

## data.loc[bool_index, '***'] = '女'

# 將 age 為偶數的年齡 改為 18歲

bool_index = data.loc[:,

'age']%

2==0data.loc[bool_index,

'age']=

18print

('data:\n'

, data)

10-dataframe的刪除操作

import pandas as pd

# 載入資料

data = pd.read_excel(

"./users.xlsx"

)print

('data:\n'

, data)

print

('data 的列索引:\n'

, data.columns)

# drop --刪除

# labels --指定刪除的列名稱列表、行名稱列表

# axis ---如果為0,刪除行; 如果為1,刪除列

# inplace --- 如果true,直接對原df產生影響;如果為false,不會原df產生影響,返回刪除的結果供我們檢視

# data.drop(labels=['***', 'age', 'address', 'poo'], axis=1, inplace=true)

# res = data.drop(labels=['***', 'age', 'address', 'poo'], axis=1, inplace=false)

## print('data:', data.shape)

# print('res:', res.shape)

# 刪除指定的行

# data.drop(labels=[i for i in range(50)], axis=0, inplace=true)

# print('data:\n',data.shape)

# 按照指定條件進行刪除

# 刪除年齡為偶數的行

# bool_index = data.loc[:, 'age'] % 2 == 0

## labels = data.loc[bool_index, :].index

## # 刪除 年齡為偶數 的行

# data.drop(labels=labels, axis=0, inplace=true)

# print('data', data.shape)

# print('data;\n',data)

# 保留法

# --保留年齡 非偶數的 行

bool_index = data.loc[:,

'age']%

2!=0data = data.loc[bool_index,:]

print

('data:\n'

,data)

print

('data:\n'

,data.shape)

11-dataframe的去重操作

import pandas as pd

"""如果所有樣本--某乙個特徵 值 全部相同,---該特徵對於我們最終的結果影響是相同的

"""# 判斷 是否該特徵所有的值 都是相同的?

# 載入資料

data = pd.read_excel(

'./meal_order_detail.xlsx'

)print

('data:\n'

, data)

print

('data 的列索引:\n'

, data.columns)

print

('*'

*100

)# df.drop_duplicates()

# subset --指定去重的列的名稱

# keep='first' --去重的時候保留出現的第乙個

# inplace --如果true,直接對原df產生影響;如果為false ,會返回乙個去重之後的結果,供我們檢視

# res = data.drop_duplicates(subset='cost', inplace=false)

# print('res:\n', res)

drop_list =

# 剔除 data 中的列--所有值 都相同的列

for column in data.columns:

# 按照每一列都進行去重

res = data.drop_duplicates(subset=column, inplace=

false

)if res.shape[0]

==1:print

('drop_list:\n'

, drop_list)

# 刪除 值相同的列

data.drop(labels=drop_list, axis=

1, inplace=

true

)print

('刪除值相同的列的結果為:\n'

,data)

print

('刪除值相同的列的結果為:\n'

,data.shape)

DataFrame的一些知識點

import numpy as np import pandas as pd arr np.arange 1,17 reshape 4,4 df pd.dataframe arr,index 2 3,4 5 columns a b c d print df print 30 dic print di...

ubuntu的一些操作

1.ubuntu,windows啟動順序修改 圖形化方法 sudo apt get install startupmanager,然後終端startupmanager,圖形化修改啟動順序,其它 2.ubuntu遠端桌面 window xp訪問ubuntu 需在ubuntu設定允許遠端訪問,可以加密訪...

Dom的一些操作

dom 的意思是 文字 物件 模型.寫幾個常用的dom 方便以後查詢 document.getelementbyid id 這個的出鏡率非常的高 有華山那麼高.document.getelementsbytagname name 封裝的時候是必用的 obj.previoussibling 已知節點的...