資料清洗和基本異常值分析 鐵塔電費分析報告

2021-09-11 19:16:31 字數 1319 閱讀 7256

下面是最近寫的關於鐵塔電費的分析報告,資料**是因為領導想讓我做資料的自動化,做完自動化就順便做了乙個資料分析報告。

2023年鐵塔電費分析報告

自2023年10月至2023年12月共向鐵塔結算6169次電費,共計電費1078w,現在根據該資料**2023年的鐵塔電費。鐵塔電費的多少取決於四要素:用電量,電費單價,年站點數,分割比例。

一、用電量

在結算電費表中,不同站點的結算週期不一樣,無法直接求出異常值,所以建立不同站點不同結算週期的日用電量字段,通過站點日用電量字段利用箱型圖分析原理查詢用電異常的問題點57處,7處已經與部門財務核實是2023年4月30日不同稅率表合併造成的極度異常點,剩餘50處站點中,42處是直供電,8處是轉供電。其中供電方式為直供電的橋東村是已經確定的偷電大戶,瓦房是曾經有過懷疑並巡查未果的站點。接下來需要對49處未核實確切結果的站點加強巡查,如果確實,就需要改變直供電偷電少的觀念。

總資料刪除異常站點的資料57條,在剩餘的6162條是資料中,分別對不同站點日用電量求平均,得到的全網984處站點的日用電量。詳細資料見附件。

二、電費單價

電費單價與用電量和供電方式有關,獲取站點的電費單價可以在已經剔除異常用電量的站點的資料基礎上分析,對6162條資料的不同站點不同時期的電費單價利用箱型圖分析原理查詢到電費單價異常點10處,6處站點是由轉供電改直供電導致電費單價的下降出現的異常值,在剔除異常用電量和異常電費單價的總資料中,需要將這6處的電費單價改為異常值。其餘四處的供電方式沒有改變,

是由於與業主簽訂合同時電費單價的下降,可以查詢成功降低電費單價方式並推廣。所以也是需要把這4處的電費單價改為異常值作為站點的電費單價。

三、年站點數量

自2023年10月至2023年12月共有688處新建站,建設基站與否的因素眾多,且不易於收集,故取月建設平均數26,年建站312處。

資料時間(月) 新基站數量

1 200

2 41

3 58

4 56

5 59

6 71

7 89

8 50

9 64

四:總結

綜上,在徹底整治偷電行為的理想情況下,2023年鐵塔電費是1541.5w。

python資料清洗(缺失值與異常值處理)

本文寫入的是python資料庫的taob表 source 本地檔案 其中總資料為9616行,列分別為title,link,price,comment檢視資料概括 coding utf 8 author m10 import numpy as np import pandas as pd import...

資料清洗中異常值如何處理(下)

第一我們給大家介紹的是基於模型檢測,具體操作就是先建立乙個資料模型,異常是那些同模型不能完美擬合的物件 如果模型是簇的集合,則異常是不顯著屬於任何簇的物件 在使用回歸模型時,異常是相對遠離 值的物件。而這個方法的優點就是有堅實的統計學理論基礎,當存在充分的資料和所用的檢驗型別的知識時,這些檢驗可能非...

C 如何進行資料清洗或異常值判斷

如何進行資料清洗或異常值判斷?簡單的方法有高斯分布 正態性 和箱線圖。我們可以用c 來演示。如有錯誤之處請指正。public static listfind listdatalist seq return indexlist 返回資料的位置索引集合 public static double gets...