Spark入門案例 計程車資料分析

2021-08-18 03:24:14 字數 766 閱讀 4671

通過分析計程車資料,然後使用kmeans對經緯度進行聚類,然後按照(類別,時間)進行分類,再統計每個類別每個時段的次數。

資料格式以及意義:

111,30.655325,104.072573,173749

111,30.655346,104.072363,173828

111,30.655377,104.120252,124057

111,30.655439,104.088812,142016

列一:計程車id

列二:經度

列三:緯度

列四:時間(例如:142016表示14點20分16秒)

步驟:1.整理資料,分割成訓練資料和測試資料,且使其符合kmeans模型訓練的格式

2.使用訓練好的模型對測試資料進行**,然後對結果以(類別,小時時間 )進行count統計,結果為每個類別每個小時的總次數。

import org.apache.spark.ml.clustering.kmeans

import org.apache.spark.ml.feature.vectorassembler

import org.apache.spark.sql.sparksession

import org.apache.spark.sql.types.

import org.apache.spark.sql.types._

import org.apache.spark.sql.functions._

object tax1

}

貪心入門 計程車費

問題 b 計程車費 時間限制 1 sec 記憶體限制 32 mb 提交 6 解決 6 提交 狀態 討論版 題目描述 某市計程車計價規則如下 起步4公里10元,即使你的行程沒超過4公里 接下來的4公里,每公里2元 之後每公里2.4元。行程的最後一段即使不到1公里,也當作1公里計費。乙個乘客可以根據行程...

習題3 3 計程車計價 15 分

題目 本題要求根據某城市普通計程車收費標準編寫程式進行車費計算。具體標準如下 1.起步里程為3公里,起步費10元 2.超起步里程後10公里內,每公里2元 3.超過10公里以上的部分加收50 的回空補貼費,即每公里3元 4.營運過程中,因路阻及乘客要求臨時停車的,按每5分鐘2元計收 不足5分鐘則不收費...

習題3 3 計程車計價 15分

本題要求根據某城市普通計程車收費標準編寫程式進行車費計算。具體標準如下 起步里程為3公里,起步費10元 超起步里程後10公里內,每公里2元 超過10公里以上的部分加收50 的回空補貼費,即每公里3元 營運過程中,因路阻及乘客要求臨時停車的,按每5分鐘2元計收 不足5分鐘則不收費 輸入格式 輸入在一行...