鏈家成都資料分析

2021-08-08 15:50:43 字數 1940 閱讀 6734

全部代售房屋資料

將資料儲存為json格式的檔案

將資料讀取為pds的dataframe格式,用於分析

清洗後資料格式為

age   area decoration elev face2 floor  focus  hall housename  release  \

02005 市一醫院 簡裝 有電梯 南 低樓層 13

2.0 融城理想 14天以前發布

12009 神仙樹 精裝 有電梯 西北 中樓層 15

1.0 融城後街 5天以前發布

22005 市一醫院 nan

nan 東南 中樓層 80

2.0 融城理想 1個月以前發布

32000 新北 nan 無電梯 西 高樓層 73

2.0 新樂中街2號 18天以前發布

42006 神仙樹 nan 無電梯 東北 低樓層 20

2.0 中海名城三期 12天以前發布

room sqr struc totalfloor totalprice unitprice visit

03.0

135 板塔結合 11

270.0

2000021

1.054 塔樓 17

60.0

11083132

3.0133 板塔結合 11

180.0

13534353

2.075 板樓 6

58.0

7698104

4.0171 板樓 6

320.0

18680

25

> 共包括 房齡 區域 單價 總價 電梯 裝修 樓層 總樓層 樓盤 朝向 帶看人數 關注人數 等17個子項資料的視覺化

關聯分類

分別為

* 單價 與 建成年份 關聯關係

— * 單價 與 朝向 關聯關係

意外的是朝南的房子並沒有比較貴

東 10036.214480

東北 10111.987842

東南 9588.616673

北 11304.247423

南 10234.785159

西 11890.804912

西北 10590.946936

西南 9668.406892

* 單價 與 是否電梯 關聯關係

有無電梯區別,反映在**差2500元左右

* 單價 與 區域 關聯關係

* 單價 與 樓盤名 關聯關係

* 單價 與 帶看人數 關聯關係

* 單價 與 關注人數 關聯關係

帶看多的房屋有更高單價,關注多的沒有看到

* 單價 與 總樓層 關聯關係

分別為

cont2 = [up_totalfloor_des, up_hall_des, up_room_des,

up_sqr_des]

* 單價 與 總樓層 關聯關係

總的來說,樓層越過單價越過

* 單價 與 廳數 關聯關係

* 單價 與 室數 關聯關係

室廳較大,單價較高,這個和預期的套一單價高不同,還不知道為什麼

* 單價 與 房屋面積 關聯關係

房屋麵價較大,單價波動較大,也更容易出現較高單價

[email protected]

一元

資料分析 資料分析概述

了解業務 了解資料 確認業務和資料 預期分析和管理 資料分析方式01.了解資料資料 1.測量標度型別 屬性本源並不是數字或者符號,通過測量標度將數值或者符號和物件的屬性建立關聯。屬性的型別 測量尺度 nominal 標稱 等於或者不等於 一對一的變換 ordinal 序數 大於或者小於 單調函式的變...

資料分析 資料分析的誤區

在資料分析的過程中,我們難免會走一些彎路,但有些彎路是可以避免的,下面我將介紹幾個資料分析過程中常見的誤區 我們一定都聽說過二戰中的乙個經典示例 軍方為了提高戰鬥機飛行員的生還率,打算在飛機上增加裝甲的厚度,但不能在所有部位加厚,這樣會喪失戰機的靈活性,於是軍方請了統計學家來研究,這些專家在一開始就...

「資料分析」崗位分析

行業內公司的融資情況從一定程度上說明了選擇資料分析崗位的穩定性 佔比情況是所有職位累加在一起,未區分職位 不需要融資的公司佔比60 d輪以上的公司42 其實很多不需要融資的公司,規模也是很大的,可以結合公司規模來判斷公司的情況如何,是否值得去發展。提供資料類職位的公司,規模還算比較大的 500人以上...