邏輯回歸在垃圾簡訊分類

2021-09-09 08:05:26 字數 606 閱讀 9483

from sklearn import linear_model //引入線性模型

import pandas as pd //引入為了讀取文字檔案

from sklearn.feature_extraction.text import tfidfvectorizer //特徵提取模組

df=pd.read_csv(「message.txt」,delimiter=』\t』,header=none) //pandas讀取資料

y,x_train=df[0],df[1] //第乙個詞賦值給y,後面的詞賦值給x_train

vectorizer=tfidfvectorizer()//向量化

x=vectorizer.fit_transform(x_train)//轉成數值

lr=linear_model.logisticregression()//建立乙個線性模型

lr.fit(x,y)//呼叫fit方法

testx=vectorizer.transform([『親愛的,明天見』,『我是湖南衛視主持人,您被抽為幸運觀眾了』])//

predictions=lr.predict(testx)//

print(predictions)//

Python垃圾郵件的邏輯回歸分類示例詳解

載入垃圾郵件資料集spambase.csv 資料集基本資訊 樣本數 4601,特徵數量 57,類別 1 為垃圾郵件,0 為非垃圾郵件 閱讀並理解資料。按以下要求處理資料集 1 分離出僅含特徵列的部分作為 x 和僅含目標列的部分作為 y。2 將資料集拆分成訓練集和測試集 70 和 30 建立邏輯回歸模...

邏輯回歸(分類演算法)

在前面講述的回歸模型中,處理的因變數都是數值型區間變數,建立的模型描述是因變數的期望與自變數之間的線性關係。比如常見的線性回歸模型 而在採用回歸模型分析實際問題中,所研究的變數往往不全是區間變數而是順序變數或屬性變數,比如二項分布問題。通過分析年齡 性別 體質指數 平均血壓 疾病指數等指標,判斷乙個...

python 邏輯回歸分類 機器學習 邏輯回歸分類

分類問題 1 本質 決策面 decision su ce 2 評估分類演算法的指標,正確率 正確分類個數 總數 二分分類 邏輯回歸輸入 訓練資料的特徵和標籤 模型 邏輯回歸 輸出 分類結果 什麼是邏輯函式?在0到1之間取值,邏輯回歸是因為引數是邏輯函式 邏輯的數值 表示分類結果是1是y的結果 決策面...