python資料去雜訊 Python資料噪音

2021-10-12 16:10:39 字數 1969 閱讀 9057

資料處理涉及以各種格式處理資料,例如合併,分組,連線等,以便分析或準備將其與另一組資料一起使用。 python具有內建函式功能,可將這些爭議方法應用於各種資料集以實現分析目標。 在本章中,我們將看幾個基於這些方法的例子。

合併資料

python中的pandas庫提供了乙個函式merge,作為dataframe物件之間所有標準資料庫連線操作的入口 -

pd.merge(left, right, how='inner', on=none, left_on=none, right_on=none,

left_index=false, right_index=false, sort=true)

現在建立兩個不同的dataframe並對其執行合併操作。

# import the pandas library

import pandas as pd

left = pd.dataframe()

right = pd.dataframe(

)print (left)

print (right)

執行上面示例**,得到以下結果 -

name id subject_id

0 alex 1 sub1

1 amy 2 sub2

2 allen 3 sub4

3 alice 4 sub6

4 ayoung 5 sub5

name id subject_id

0 billy 1 sub2

1 brian 2 sub4

2 bran 3 sub3

3 bryce 4 sub6

4 betty 5 sub5

分組資料

資料分析中經常需要對資料集進行分組,因為我們需要根據資料集中存在的各個組的結果進行分析。 panadas具有內建的方法,可以將資料轉換為各種分組。

在下面的示例中,我們按年分組資料,然後獲得特定年份的結果。

# import the pandas library

import pandas as pd

ipl_data =

df = pd.dataframe(ipl_data)

grouped = df.groupby('year')

print (grouped.get_group(2014))

執行上面示例**,得到以下結果 -

points rank team year

0 876 1 riders 2014

2 863 2 devils 2014

4 741 3 kings 2014

9 701 4 royals 2014

連線資料

pandas提供了各種功能,可以輕鬆地將series,dataframe和panel物件組合在一起。 在下面的例子中,concat函式沿軸執行串聯操作。建立不同的物件並進行連線。

import pandas as pd

one = pd.dataframe(,

index=[1,2,3,4,5])

two = pd.dataframe(,

index=[1,2,3,4,5])

print (pd.concat([one,two]))

執行上面示例**,得到以下結果 -

marks_scored name subject_id

1 98 alex sub1

2 90 amy sub2

3 87 allen sub4

4 69 alice sub6

5 78 ayoung sub5

1 89 billy sub2

2 80 brian sub4

3 79 bran sub3

4 97 bryce sub6

5 88 betty sub5

¥ 我要打賞

糾錯/補充

收藏加qq群啦,易百教程官方技術學習群

注意:建議每個人選自己的技術方向**,同乙個qq最多限加 3 個群。

python資料去雜訊 Python實現輪廓去雜訊

完整的 實現了最小的矩形,圓形,隨意矩形 import cv2 import numpy as np refer 2018 06 30 yonv1943 2018 07 01 comment to test.png 2018 07 01 gray in threshold,hierarchy 201...

影像去條帶雜訊

經常和遙感影像打交道的同學,不知道有沒有碰到過條帶雜訊的情況,或者叫 丟線 壞線 即一副影像上出現規則的黑色條帶,這些黑色條帶裡的像元值是無效的。例如下面這張圖 咱們放大點來看下 咱們先來說一說條帶雜訊產生的原因,來看一段專業解釋 簡而言之,就是拍攝影像的衛星感測器出問題了,從而週期性的造成影像記錄...

高斯雜訊和椒鹽雜訊python

高斯雜訊的 如下 def gaussiannoise src,means,sigma noiseimg src rows noiseimg.shape 0 cols noiseimg.shape 1 for i in range rows for j in range cols noiseimg i...