資料分析(一)

2021-08-31 21:31:29 字數 3218 閱讀 5939

資料分析應用於各個領域,作為乙個python的程式設計師,又怎麼能不知道資料分析呢。學好資料分析才能學好機器學習,進而才能學習人工智慧,我們一起來了解下資料分析吧。
一.啟動程式

執行命令:jupyter notebook

通過control—c終止jupyter程式

幾個基本操作:

1.雙擊d:刪除當前cell

2.單擊m:轉為markdown文件

3.單擊y:轉為**

4.markdown文件下執行變為預覽模式

二.ipython的幫助文件

1.使用help()

通過以下命令來獲得幫助文件:help(len)

help()是乙個內建函式 可以告訴使用者 傳入的函式的引數和返回值是什麼

2.使用?

或者使用問號:len?

?和help()函式功能一樣,都可以用看檢視幫助文件

使用兩個問號??可以把函式的源**顯示出來

還可以應用到自定義的變數和自定義的函式上來返回幫助文件

使用乙個?和help(len)一樣

len?

import numpy as np

np?對於函式和模組 兩個問號 會直接獲取源** np??

對於自定義函式 後面加乙個? 會顯示說明文件。 後面加兩個問號 會顯示源**。

3.tab自動補全

敲擊tab鍵能自動補全

命令列**提示是tab鍵,jupyter**提示也是tab鍵 其實在jupyter中寫**就是在命令列中寫**,只不過這個介面更好看一些 功能更豐富一些

三.ipython魔法命令

1.執行外部python檔案

使用下面命令執行外部python檔案(預設是當前目錄,最好加上絕對路徑)

%run *.py

例如在當前目錄下有乙個myscript.py檔案:

def square(x):

square  a  number

return x**2

for n in range(1,4):

print(n,"squared is",square(n))

我們可以通過下面的命令執行它:

%run myscript.py
注意:是.py的python**檔案 不是通過jupyter建立的。ipynb檔案

(如果想在jupyter中建立,可以通過建立text file然後改字尾名來實現;編輯後記得儲存)

尤其要注意的是,當我們使用魔法命令執行了乙個外部檔案時,該檔案的函式就能在當前會話中使用

sum(1,2)
run後面跟相對路徑 就可以載入外部的.py檔案(注意是載入.py檔案 不是ipynb檔案)並且路徑要用雙引號引起來 不是單引號

載入之後就可以對函式和變數進行呼叫了

2.執行計時

2.1用下面命令計算statement的執行時間

%time statement

2.2用下面的命令計算statement的平均執行時間

%timeit statement

timeit會多次執行statement,最後得到乙個更為精準的預期執行時間

2.3可以使用兩個百分號來測試多行**的平均執行時間

%%time

statement1

statement2

statement3

%%timeit

statement1

statement2

statement3

記住:%time 一般用於耗時長的**段

%timeit  一般用於耗時短的**段
3.檢視當前會話中的所有變數與函式

快速檢視當前會話的所有變數與函式名稱:%who

檢視當前會話的所有變數與函式名稱的詳細資訊:%whos

返回乙個字串列表,裡面元素是當前會話的所有變數與函式名稱:%who_is

4.執行linux指令

linux指令:

$echo "hello world" #echo is like python's print function

hello world

$ pwd #pwd=print working directory

/users/.. #this is the "path" that we're sitting in

$is #is = list working directory contents

notebooks projects

$mkdir mm

/home/jake/projects

$touch txt

!touch /home/nanfengpo/desktop/xx/hello.txt

在linux指令之前加上!,即可在ipython當中執行linux指令。

注意會將標準輸出以字串形式返回

windows系統前面不加! 也不加$

5.更多魔法命令

列出所有魔法命令 %ismagic

檢視魔法命令的文件:使用?

四.notebook的快捷鍵

1、命令模式

ctrl+enter:執行本單元,選中本單元

alt+enter:執行本單元,在下面插入一單元

shift+enter:執行本單元,選中下個單元

y:單元轉入**狀態

m:單元轉入markdown狀態

a:在上方插入新單元

b:在下方插入新單元

2、編輯模式(enter鍵啟動)

tab:**不全或縮排

shift-tab:提示

# **提示

# jupyter 中也有快捷鍵檢視**提示 shift + tab

# 按tab鍵可以獲取只能提示 選擇智慧型提示使用 enter

# 在函式中按 shift + tab 可以獲取引數的只能提示

# np.random.random()

ctrl-a:全選

ctrl-z:後退

ctrl+shift+z:前進

#匯入包:

import numpy

import pandas

import scipy

import sklearn

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...

資料分析之旅(一)

提出問題 資料再加工 包括資料採集和資料清理 資料探索 培養直覺,找出資料模式 總結,進行 與他人交流結果 部落格 電子郵件 ppt 面談 並且所有的過程都可能回到第乙個階段 提出問題2.從api獲取資料 3.從網頁中爬取資料 4.對多種不同格式的資料進行合併 開啟乙個csv檔案 對比一下在subl...

黑馬 資料分析(一)

定義 資料分析是用適當的方法對收集來的大量資料進行分析,幫助人們作出判斷,以便採取適當行動。用途 有崗位需求 是python資料科學的基礎 是機器學習課程的基礎 conda data science package environment manager 建立環境 conda create name...