資料科學包第二天

2021-09-27 13:12:00 字數 831 閱讀 4041

匯入包

import pandas as pd

import numpy as np

匯入資料

#預設utf-8,gbk對中文的支援更好

pd.read_csv(filename,encoding=『gbk』)

#key是列名,value是資料,從字典匯入資料需要指定index

dict1 =

df = pd.dataframe(dict1,index=[0])

檢視資料

#行數、列數

df.shape[0]

df.shape[1]

#前幾行,後幾行,預設為5

df.head()

df.tail(3)

#資料匯**計

df.describe()

#資料概況

df.info()

#列名df.columns

#資料型別

df.dtypes

#各列平均值

df.mean()

資料選取

#按列名檢視某列

df[col_name]

df.col_name

#查列名看多列

df[[col1,col2]]

#按索引檢視某行,第一行:

df.iloc[0]

#按索引檢視某行某列,三行四列那個元素

df.iloc[2,3]

資料合併

#按行拼接

pieces = [df[2:20],df[23:30],df[35:40]]

下面這句replace知乎一直報未知錯誤(醉了,我在整篇文章中用二分法試出來兩句),只能截圖

上班第二天

本想坐晚一班車的,誰知道這晚一班的也只是晚了 五 六分鐘,不高興再在站台上等,也只好小跑到車門上去了,果然,八點十分就到了。白天那個困啊 今天的工作內容和昨天一樣,做到後來我實在覺得測的差不多了,想幹些其他的,但這初來乍到的,也不好幹其他的呀,況且領導辦公室就在我旁邊。今天的工作總結有兩點 1 別把...

第二天實習

今天我早早到了銀行,開始給大家抹桌子,算是向愛妃學習吧。之後向wqy學習做表的方法,他很耐心。今天一天也就是做了這麼乙個表,但是還向dh學習了另外一些業務的處理,收穫不小。中午吃了雞腿 肉串和芸豆,好開心啊。我越來越喜歡自己的實習了。今天好多自己班上的同學來面試實習生,希望她們都能上!今天我沒有去同...

實習第二天

又是早起擠地鐵的一天 今天symphony說給我換了個導師,richard。於是我開始自己看,但是我並不清楚背景,不知道整個資料夾是幹什麼目的的,也不知道哪些檔案是需要看的。然後在richard的講解下,我慢慢明白了,終於知道我是幹啥的了,就是完善優化他們寫的自動化測試程式,首先是要看懂他們寫的。按...