語言處理與Python 1 2將文字當作詞鍊錶

2022-08-03 09:18:13 字數 694 閱讀 7157

鍊錶

-sent1=['call','me','ishmael','.']

這個方括號內的東西在python中叫做鍊錶(list,也叫做列表),他就是我們儲存文字的方式。

我們可以對鍊錶使用加法運算,創造乙個新的鍊錶。

索引列表

-使用數字位置索引text4[173]

-使用index,返回第一次出現的索引。text4.index('awaken')

-切片:子鍊錶。從大文字中任意抽取語言片段,術語叫做切片。

text5[16715:16735],text6[1600:1625],sent[:3],text2[141525:]

text[m:n]指的是從m到n-1

變數

-變數名命名規則:開頭由字母開始,總體可以有數字、下劃線組成。大小寫敏感。在排序中,大寫字母總是出現在小寫字母之前。

字串

-給字串賦值,name='monty',可以通過下標單獨訪問name[0]

-乘法和加法操作,name*2,name+'!'

-鍊錶連線組成單個字串,''.join(['monty','python']),最終效果為'monty python'

-字串分割操作'monty python'.split()

AI與Python 自然語言處理

自然語言處理 nlp 是指使用諸如英語之類的自然語言與智慧型系統通訊的ai方法。當您想要像機械人這樣的智慧型系統按照您的指示執行時,當您想要聽取來自基於對話的臨床專家系統的決定等時,需要處理自然語言。nlp領域涉及使計算機使用人類使用的自然語言來完成有用的任務。nlp系統的輸入和輸出可以是 在本節中...

《Python自然語言處理》筆記 將文字當做詞鍊錶

1.文字統計 len text1 text1從頭到尾的長度,包含單詞和標點符號 set text2 獲得text2的詞彙表 sorted set text3 獲得text3詞彙表的排序表 len set text4 獲得text4詞彙表的長度 len text5 len set text5 獲得te...

Python語言基礎16 檔案開啟與關閉

檔案 檔案 文件 library built in functions 通過python 程式對計算機中的各種檔案進行增刪改查的操作 i o input 和 output 操作檔案的步驟 1 開啟檔案 2 對檔案進行讀寫,再儲存 3 關閉檔案 open 使用該函式來開啟乙個檔案 引數 file 要開...