命令列中只用scala來執行乙個spark應用

2021-09-12 07:40:41 字數 685 閱讀 7046

由於intellij十分消耗記憶體,

並且在概念上來講,scala匯入jar包應該和在整合開發環境中匯入jar包是等效的。

所以我想,能否純命令列,不用spark-submit的情況下來執行呢?

折騰了好幾個小時,方案如下。

testrdd.scala**:

import scala.iterator

import org.apache.spark.sparkconf

import org.apache.spark.sparkcontext

import org.apache.spark.sql.

import org.apache.log4j.logger

import org.apache.log4j.level

object testrdd

total

} def main(args: array[string])

spark.stop()

}}

執行方法:

scala -classpath $(echo *.jar ~/bigdata/spark-2.3.1-bin-hadoop2.7/jars/*.jar| tr ' ' ':') testrdd.scala

執行結果:615

注意:上面匯入了spark本地部署中的所有jars包

golang執行命令列 一

golang中會經常遇到要 fork 子程序的需求。go 標準庫為我們封裝了os exec標準包,當我們要執行外部命令時應該優先使用這個庫。這裡我簡單結合context和cmd模組寫乙個通用的執行 command 方法。如下 runcmd func runcmd ctx context.contex...

命令列 Pytest之命令列執行

基於一套 實現流水線的驗證方案,針對每個流水線傳不同的使用者進行驗證,具體的使用者可以選擇每個集群裡面活躍度比較高使用者來進行測試。正如前面說的,在saas化的模式下,底層服務它是共享的機制,但是每個集群它是不同的,這種不同在於它提供的db層面和計算能力,因此需要被驗證。使用pyhton中的argp...

postman命令列中執行,newman

postman在命令列中執行 執行準備 匯出collecton 安裝nodejs和npm 國內網不好訪問nodejs,則使用cnpm安裝newman 安裝newman 執行及生成測試報告 1 cli reporter 2 json report 3 html reporter 4 junit rep...