復合資料型別,英文詞頻統計

2022-04-09 23:48:09 字數 3273 閱讀 1648

1.列表,元組,字典,集合分別如何增刪改查及遍歷。

列表的增刪改及遍歷

#

定義列表

list1=list('

gzcc')

#列表的增加!'

)list1.extend(

'yes')

#列表的刪除

list1.pop(4)

#列表的修改

list1[0] = '1'

#將第0個元素修改為』1『

#列表的查詢

list1.index('1'

)#列表的遍歷

b=len(list1)

for i in

range(b):

print(i+1,list1[i])#

前面為序列號,後面為值

元組 ,操作和列表類似,但是元組不能修改

#

建立tuple1 =()

tuple1 = 1,

tuple1 = 1,2,3tuple1 = tuple([1,2,3,4])

tuple1

字典的增刪改及遍歷

字典#建立

dict1 =

a = [('

key1

','value1

'),('

key2

','value2')]

dict1 =dict(a)

dict1 = {}.fromkeys(['

key1

','key2

'],'

default_value

') #

從鍵值建立dict

dict1 = dict(key1='

value1

',key2='

value2')

#增加dict1['

key3

']='

value3'#

字典可以自動新增

dict1.setdefault('

key5

','n/a

') #

如果不存在,就設定預設值#刪除

del dict1['

key3']

print dict1.pop('

key2

') #

popitem隨機刪除 和列表的pop一樣

#dict1.clear() #深刪除,即使有拷貝 也會被刪除#修改

if'key1'in

dict1:

dict1[

'key1

']='

new_value_1'#

查詢if

'key1'in

dict1:

print dict1['

key1']

if dict1.has_key('

key1'):

print dict1['

key1']

print dict1.get('

key3

','not exists

') #

寬鬆訪問

print

dict1.keys(),dict1.values() #

拼接dict2 = dict(key4 = '

value4

') #

從字典更新另乙個字典

dict1.update(dict2)

集合增刪改查及遍歷

a=

b=set(a)#

b為集合且b經過了去重

set(b).add('

e')#

#新增元素

set(b).update('

h')#

新增元素

seta.pop() #

刪除操作,無返回值

print([v for v in seta]) #

遍歷print(sorted(seta)) #

set的排序

字典無序,集合不可重複

3.詞頻統計

2.通過檔案讀取字串 str

3.對文字進行預處理

4.分解提取單詞 list

5.單詞計數字典 set , dict

6.按詞頻排序 list.sort(key=lambda),turple

7.排除語法型詞彙,代詞、冠詞、連詞等無語義詞

8.輸出top(20)

排序好的單詞列表word儲存成csv檔案

import pandas as pd

pd.dataframe(data=word).to_csv('big.csv',encoding='utf-8')

線上工具生成詞云:

fn=open("

xiaoshuo.txt

","r+")

print("

成功讀取檔案")

str=fn.read()

#去標點符號

s=',.?:;

'for c in

s: text = str.replace(c,'')#

轉化為小寫

text=text.lower()

#分割並顯示

atext=text.split()

#print(atext)

atext=list(atext)

#list1=

#list1=atext

#統計詞頻

print("

計算單詞出現的次數並按詞頻排序:")

## strset=set(text)

#for word in atext:

#print(word,text.count(word))

fn1=open("

stop.txt

","r")

tyc=fn1.read()

tyc=list(tyc)

#用字典表示詞頻

res ={}

for i in

atext:

if i in

res:

res[i] = res[i] + 1

else

: res[i] = 1

#print(res)

#按照字典的value進行排序

res1 = sorted(res.items(), key=lambda d:d[1],reverse =true)

print(res1)

作業部落格要求:

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表 list1 a b c d 設定列表1 print list1 輸出列表1 增list1.insert 4,e 增添元素 print list1 刪list1.pop 3 刪除指定位置元素 print list1 改list1 0 q 直接修改...

復合資料型別,英文詞頻統計

作業部落格要求 1.列表,元組,字典,集合分別如何增刪改查及遍歷。1 列表 list a b hello 1 第一在列表後方新增資料 第二為在對應的下邊插入資料 list.insert 0,0 print list 通過pop 根據索引刪除並返回被刪除的元素 一般通過for迴圈來遍歷列表,如for ...

復合資料型別,英文詞頻統計

1.列表,元組,字典,集合分別如何增刪改查及遍歷。列表 list 增list.insert index,obj 增加元素到指定位置 index 索引位置 obj 內容 list.extend list i 將list i列表中的元素增加到list中 刪list.pop 預設刪除list末尾的元素 l...