python資料幀 Python資料幀

2021-10-16 19:56:17 字數 719 閱讀 2775

我有乙個dataframe(df),並試圖將資料附加到特定的行

index fruit rank

0 banana 1

2 mango 3

3 melon 4

目標是將排名1的水果與每個等級進行比較,然後附加值。

我在用difflib.sequencematcher做比較。現在我可以追加到df,但最後我會將相同的值附加到每一行。我正在努力處理迴圈和附加。

任何建議都將不勝感激。在

以下是我的一些**:new_entry = df[(df.rank ==1)]

new_fruit = new_entry['fruit']

prev_entry = df[(df.rank ==2)]

prev_fruit = prev_entry['fruit']

similarity_score = difflib.sequencematcher(none, str(new_fruit).lower(), str(prev_fruit).lower()).ratio()

df['similarity_score'] = similarity_score

結果是這樣的:

期望的結果是:

index fruit rank similarity_score

0 banana 1 n/a

2 mango 3 0.5

3 melon 4 0.6

謝謝。在

python資料幀 Python資料幀行和列

我是乙個新的python建模者,目前在一行 中遇到了一些問題,這些 可能對很多人來說非常基礎。在 我使用的是python2.7,並成功地使用xlwings將乙個命名範圍從外部工作簿複製到pd資料幀格式。一切都很好除了測向索引以及資料框列.目前,將1分配給n 基於行數和列數 數字作為索引和列名。在 有...

python中DataFrame資料幀的統計方法

我們把每乙個column作為乙個樣本資料集,就可以對其進行一些統計學方法的計算,比如求和sum 求平均mean 求方差var 求標準差std 求個數count 求最大值max 求最小值min,等操作。我們用以下 來進行演示 import pandas as pd dict data df data ...

python索引應用 對資料幀索引應用函式

很多答案都是將索引作為陣列返回,這樣會丟失有關索引名等的資訊 儘管您可以執行pd.series index.map myfunc name index.name 對於多索引也不起作用。我處理這個問題的方法是使用 rename mix pd.multiindex.from tuples 1,hi 2,...