資料探勘 實驗一 資料探勘軟體環境搭建與使用

2022-07-22 00:48:10 字數 2058 閱讀 6406

1、輸出 9*9 乘法口訣表。

分析:分行與列考慮,共9行9列,i控制行,j控制列。

for i in range(1, 10):

for j in range(1, i+1):

print("{}*{}={}".format(i, j, i*j), end=" ")

print()

2、 獲取 100 以內的質數。

分析:質數(prime number)又稱素數,有無限個。質數定義為在大於1的自然數中,除了1和它本身以外不再有其他因數的數稱為質數,如:2、3、5、7、11、13、17、19。

實際上,實際驗證x是否有因子時,不必驗證所有小於x的數,只要驗證所有小於sqrt(x)+1的數就可以了。

from math import ceil, sqrt

a = [1] # 用a儲存不是素數的數,預設1既不是素數又不是合數

b = # 用b儲存是素數的數

for i in range(2, 100+1):

for j in range(2, ceil(sqrt(i))+1):

if i % j == 0 and i != j:

break

for i in range(1, 100+1):

if i not in a:

print(b)

3、列印出所有的"水仙花數",所謂"水仙花數"是指乙個三位數,其各位數字立方和等於該數本身。例如:153是乙個"水仙花數",因為153=1的三次方+5的三次方+3的三次方。

分析:利用for迴圈控制100-999個數,每個數分解出個位,十位,百位。

for i in range(100, 1000):

a = i//100 # 百位

b = (i % 100)//10 # 十位

c = i % 10 # 個位

if a*a*a+b*b*b+c*c*c == i:

print(i)

4、有四個數字:1、2、3、4,能組成多少個互不相同且無重複數字的三位數?各是多少?

分析:可填在百位、十位、個位的數字都是1、2、3、4。組成所有的排列後再去 掉不滿足條件的排列。可以使用排列組合的思想設計遞迴或非遞迴程式實現,也可簡單窮舉搜尋。

a = [1, 2, 3, 4]

b =

for i in a:

for j in a:

for k in a:

if i != j and j != k and i != k:

for i in b:

print(i)

5、乙個整數,它加上100後是乙個完全平方數,再加上168又是乙個完全平方數,請問該數是多少?

分析:假設該數為 x。

1、則:x + 100 = n2, x + 100 + 168 = m2

2、計算等式:m2 - n2 = (m + n)(m - n) = 168

3、設定: m + n = i,m - n = j,i * j =168,i 和 j 至少乙個是偶數

4、可得: m = (i + j) / 2, n = (i - j) / 2,i 和 j 要麼都是偶數,要麼都是奇數。

5、從 3 和 4 推導可知道,i 與 j 均是大於等於 2 的偶數。

6、由於 i * j = 168, j>=2,則 1 < i < 168 / 2 + 1。

7、接下來將 i 的所有數字迴圈計算即可。

for i in range(2, 85, 2):

if 168//i == 168/i:

if i > 168//i:

j = 168//i

if (i+j)/2 % 1 == 0 and (i-j)/2 % 1 == 0:

m = (i+j)//2

n = (i-j)//2

if m % 1 == 0 and n % 1 == 0:

if m*m-n*n == 168:

x = n*n-100

print(x)

一 資料探勘基礎

資料探勘的任務 分類與 聚類分析,關聯規則,時序模式,偏差檢測,智慧型排序 資料探勘的建模過程 1.定義挖掘目標 2.資料採集,取樣 隨機抽樣,分層抽樣,等距抽樣,分類抽樣,起始順序抽樣 3.資料探索 異常值分析 缺失值分析 相關性分析 週期性分析,有無明顯規律和趨勢 4.資料預處理 降維處理,缺失...

資料探勘 (一)資料獲取

1 資料倉儲 全部事實的記錄 必須是全面的 完備的 盡可能詳細的 可以方便的以不同維度抽取和整理資料 資料是拿來用的,一般乙個特定的場景不會使用全部的資料,資料倉儲非常豐富,必須根據不同的應用調取相應的資料,這些被抽取和整理的資料稱為資料集市 dw 1 資料庫 vs 倉庫 資料庫面向業務儲存,需要保...

資料探勘實戰(一) 資料分析

資料集準備 status表示標籤,但是它作為乙個特徵維度混入到特徵列表中,要先將它找出來賦給標籤,並按照約定規則將資料分為訓練集和測試集 import pandas as pd from sklearn.model selection import train test split data pd....