匯入python自帶的一系列資料集等操作

2021-10-01 02:26:39 字數 2474 閱讀 3398

#通過matplotlib實現資料的視覺化

#sklearn庫自帶資料集,載入的方式是固定的,站在巨人的肩膀上

'''#匯入資料集

from sklearn.datasets import load_iris

from sklearn.datasets import load_boston

#匯入matplotlib繪圖模組

from matplotlib import pyplot as plt

#%matplotlib inline#我也不知道這是啥意思

iris=load_iris()

print(iris.descr)

data=iris.data

plt.plot(data[:,0],data[:,1],'.')

boston=load_boston()

print(boston.descr)

data=boston.data

plt.plot(data[:,2],data[:,4],'+')

iris=load_iris()

''''''

#import pandas as pd

#import numpy as np

#df=pd.read_csv('who_first9cols.csv')

#print(df)

# pandas資料結構之dataframe

from pandas.io.parsers import read_csv

df=read_csv('who_first9cols.csv')

print('dataframe',df)

#pandas屬性:以元組形式存放dataframe的形狀資料

print('shape',df.shape)

print('length',len(df))

#考察各列的標題與資料型別

print('column headers',df.columns)#標題

print('data types',df.dtypes)#資料型別

#pandas的dataframe帶有乙個索引,類似於關係型資料庫的主鍵(primary key)

#方法:print('index',df.index)

print('index',df.index)

#遍歷dataframe的基礎資料,pandas的迭代器,遍歷列值的效率會很低

#更好的解決方案:從基礎的numpy陣列中提取這些數值,進行相應處理

print('values',df.values)#非數字的數值被標為』nan『

'''#pandas資料結構之series

#series資料結構是不同型別元素組成的一維陣列,該資料結構也具有標籤

#建立series資料結構:

#1.使用python字典

#2.使用numpy陣列

#3.使用單個標量值

import pandas as pd

import numpy as np

'''df=pd.read_csv('who_first9cols.csv')

country_col=df['country']#選中檔案中的第一列,即country列

print('type country_col',type(country_col))#得到乙個series型的資料

print('series shape',country_col.shape)

print('series index',country_col.index)

print('series values',country_col.values)

print('series name',country_col.name)#可以看到每乙個元素叫什麼

#series的切片功能,取country中的最後兩個國家

print('last 2 countries',country_col[-2:])

print('last 2 countries type',type(country_col[-2:]))

#numpy的函式適用pandas的dataframe和series資料結構

#可以使用numpy的sign()函式獲得數字的符號

#正數返回1,負數返回-1,零值返回0

last_col=df.columns[-1]#最後一列

print('last df column signs:\n',last_col,np.sign(df[last_col]),'\n')

''''''

#小例子說明涉及nan的運算會產生nan

a=np.sum([0,np.nan])

print(np.sum(df[last_col]-df[last_col].values))

#利用pandas查詢資料

#pandas的dataframe結構類似於關係型資料庫,從dataframe讀寫資料可以看作是一種查詢操作

'''

關於mysql 一系列操作

這是在linux 的mysql的資料庫操作,備份資料庫 mysqldump u root p cxn usr local backupcxn.sql 引數說明 cxn 代表著我要備份的資料庫名稱,usr local backupcxn.sql代表著備份到usr local下,輩分的名稱叫做backu...

一系列nginx安全配置

1.檢視所有模組 root proxy nginx 1.12.2 configure help2.選擇適合的模組 pcre 開啟正規表示式支援 http autoindex module 自動索引模組 ssi module ssi 指令碼 http ssl module ssl 支援 http 模組...

第一系列 集合概述

1.會使用集合的儲存資料 2.會遍歷集合,把資料取出來 3.掌握每種集合的特性 collection介面 定義的是所有單列集合中共性的方法 所有的單列結合都可以使用共性的方法 沒有索引方法 list介面 1.有序的集合 儲存和去除元素順序相同 2.允許儲存重複的元素 3.有索引,可以使用普通的for...