大資料學習 Python入門

2021-09-11 12:22:28 字數 2961 閱讀 2611

python入門

一、基礎語法

1、python中資料型別

整數,浮點數,字串,布林值,空值(none)

2、print語句

注意:1.當我們在python互動式環境下編寫**時,>>>是python直譯器的提示符,不是**的一部分。

2.當我們在文字編輯器中編寫**時,千萬不要自己新增 >>>。

print語句也可以跟上多個字串,用逗號「,」隔開,就可以連成一串輸出。print會依次列印每個字串,遇到逗號「,」會輸出乙個空格。

3、注釋

python的注釋以 # 開頭,後面的文字直到行尾都算注釋。

多行注釋是用三引號''' '''。

4、變數

變數是用乙個變數名表示,變數名必須是大小寫英文、數字和下劃線(_)的組合,且不能用數字開頭。

5、字串

(1)字串可以用''或者""括起來表示。

注意:如果字串包含",我們就可以用' '括起來。

同理,如果字串包含',我們就可以用""括起來.

如果字串既包含'又包含",對字串的某些特殊字元進行「轉義」,python字串用\進行轉義。

如:

s = set(['a', 'b', 'c'])

(2)set的特點

set的內部結構和dict很像,唯一區別是不儲存value。

set儲存的元素和dict的key類似,必須是不變物件。

(3)遍歷set 例如:

s = set(['adam', 'lisa', 'bart'])>>> for name in s:... print name

(4)更新set

新增元素時,用set的add()方法:

如果新增的元素已經存在於set中,add()不會報錯,但是不會加進去了:

刪除set中的元素時,用set的remove()方法:

如果刪除的元素不存在set中,remove()會報錯。

六、函式

可以直接從python的官方**檢視文件:

網頁鏈結

也可以在互動式命令列通過 help(abs) 檢視abs函式的幫助資訊。

(1)編寫函式

定義乙個函式要使用 def 語句,依次寫出函式名、括號、括號中的引數和冒號:,然後,在縮排塊中編寫函式體,函式的返回值用 return 語句返回。return none可以簡寫為return。python的函式返回多值其實就是返回乙個tuple。

(2)遞迴函式

例:漢諾塔問題

函式 move(n, a, b, c) 的定義是將 n 個圓盤從 a 借助 b 移動到 c。

參考**:

def move(n, a, b, c):

if n ==1:

print a, '-->', c return

move(n-1, a, c, b)

print a, '-->', c

move(n-1, b, a, c)

(3)預設引數

例如: int() 函式,其實就有兩個引數,我們既可以傳乙個引數,又可以傳兩個引數:

int()函式的第二個引數是轉換進製,如果不傳,預設是十進位制 (base=10),如果傳了,就用傳入的引數。

(4)可變引數

可變引數的名字前面有個 號,我們可以傳入0個、1個或多個引數給可變引數。python直譯器會把傳入的一組引數組裝成乙個tuple傳遞給可變引數。

七、對list切片

(1)['adam', 'lisa', 'bart', 'paul']

l[0:3]或l[:3]表示,從索引0開始取,直到索引3為止,但不包括索引3。所以結果為['adam', 'lisa', 'bart']

l[:]表示從頭到尾,l[:]實際上複製出了乙個新list。

切片操作還可以指定第三個引數:

l[::2]['adam', 'bart']

第三個引數表示每n個取乙個,上面的 l[::2] 會每兩個元素取出乙個來,也就是隔乙個取乙個。

把list換成tuple,切片操作完全相同,只是切片的結果也變成了tuple。

(2)倒序切片

l = ['adam', 'lisa', 'bart', 'paul']>>> l[-2:]['bart', 'paul']>>> l[:-2]['adam', 'lisa']>>>

l[-3:-1]['lisa', 'bart']>>> l[-4:-1:2]['adam', 'bart']

(3)對字串切片

字串 '***'和 unicode字串 u'***'也可以看成是一種list,每個元素就是乙個字元。因此,字串也可以用切片操作,只是操作結果仍是字串。

*注:有序集合:list,tuple,str和unicode;

無序集合:set

無序集合並且具有 key-value 對:dict**

八、迭代

(1)索引迭代

l = ['adam', 'lisa', 'bart', 'paul']>>> for index, name in enumerate(l):... print index, '-',

name... 0 - adam1 - lisa2 - bart3 - paul

enumerate() 函式自動把每個元素變成 (index, element) 這樣的tuple,再迭代,就同時獲得了索引和元素本身。

(2)迭代dict的value

values() 方法實際上把乙個 dict 轉換成了包含 value 的list。

name

score

'(3)條件過濾 例如:

def touppers(l):

return [s.upper() for s in l if isinstance(s,str) ] #isinstance(x, str) 可以判斷變數 x 是否是字串;

print touppers(['hello', 'world', 101]) #輸出[『hello』,』world』]

大資料入門學習?

第一部分 了解大資料平台架構 大資料有非常大的價值,不管是從幫助企業創造營收還是從提高效率 節省企業成本角度。大資料要是做好了,將會是乙個企業增長的發動機,推動業務突飛猛進的發展。要實現大資料的價值,真正讓大資料為企業創造貢獻,首先必須要積累有大資料,把日常的業務和使用者行為資料收集起來。有些資料是...

大資料入門學習(一) 初識大資料

大資料的定義 大資料 big data 又稱為巨量資料,指需要新處理模式才能具有更強的決策力 洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。大資料技術,是指從各種各樣型別的資料中,快速獲得有價值資訊的能力。適用於大資料的技術,包括大規模並行處理 mpp 資料庫,資料探勘電網,分布式檔案系統...

大資料學習 linux入門學習

2017 6 6,開始利用業餘時間學習大資料技術,第一步,在本機安裝虛擬機器,安裝虛擬linux系統,虛擬機器安裝vmware,虛擬系統選擇redhat6.5。其它收穫 vmware安裝時,須將電腦bios中vt開啟。linu學習中避免使用圖形介面,要能折騰,不要規避系統裝機。要學會在linux上安...