機器學習之 Pandas 2

2021-08-17 20:56:19 字數 2246 閱讀 6093

從網頁裡抓取資料並進行操作

import numpy as np

import pandas as pd

from pandas import series,dataframe

import webbrowser

linkur2=""

webbrowser.open(linkur2) #開啟網頁

在網頁中複製想要的行和列中的資訊

df2=pd.read_clipboard()  #從作業系統貼上版中解析貼上內容

如果只是想取出特定的列

想增加新的列

如果想給新增的列附上內容

#new1 10-17

#new2 隨機整數

import numpy as np

df3.new1=(np.arange(10,16))

df3.new2=(np.random.randint(0,12,6))

#重新df3.new2=pd.series([100,200,300],index=[1,2,3])

進一步來說,series(一維),dataframe(二維)

data=

#提取字典某列

生成二維的

只想要city這一列的

按行輸出

#df1.iterrows() 行集合

再強調一次,通過series建立dataframe

series  :一維,index--values

dataframe :二維,由多個series組成

轉置

df1.t

pandas 2列資料合併

1 其中的trans type trans class兩列合成一列用於模糊查詢,並建立新的列。df trans type class df trans type df trans class 注 但是某一列如果為空,另一列不為空,則合併結果是為空,所以在合併之前需要對na進行預處理,替換或者刪除。2...

pandas 2索引和選擇資料

對於一種資料結構,最基本的操作就應該是增刪改查了。行選擇和列選擇有許多方法,很容易記混,常用的要記住。主要方法有三種 iloc,loc,df.loc index1 index2 price df.iloc a b price 123 4567 s.sample frac 0.5 引數 預設選擇行,n...

機器學習之pandas

import pandas as pd a pd.read csv 檔案路徑 讀取檔案 a.head 顯示的條數 顯示前部分資料 a.tail 顯示的條數 顯示後部分資料 a.columns 輸出列 a.loc 序列號 輸出乙個樣本 a.columns.tolist 將列轉換成列表 c.endwit...