Streaming監控指定資料夾檔案內容變化

2022-07-28 21:12:25 字數 802 閱讀 9386

#導入庫

fromoperator importadd

frompyspark importsparkcontext,sparkconf

frompyspark.streaming importstreamingcontext

#配置建立streamingcontext物件

conf =sparkconf()

conf.setmaster('local[2]')

sc =sparkcontext(conf =conf)

ssc =streamingcontext(sc,20)

#指定輸入流資料夾

lines =ssc.textfilestream('file:///usr/local/spark/mycode/streaming/logfile')

#按空格切分

words =lines.flatmap(lambdaline:line.split(' '))

#對單詞進行詞頻統計

wordcounts =words.map(lambdax :(x,1)).reducebykey(add)

#美觀列印資料

wordcounts.pprint()

#開始迴圈監聽

ssc.start()

#等待處理結束(手動結束或因為錯誤而結束)

當logfile資料夾下的內容發生改變時,資料會相應的顯示在上面

監控指定程序

對於守護中介軟體是非常有用的。中介軟體不可能絕對的穩定而不出問題,中介軟體有可能因比較嚴重的錯誤導致當機或者程序被人為地錯誤地關閉了中介軟體。有了這個自動守護程序的存在,這一切的問題都可以迎刃而解。program monitor uses winapi.windows,system.sysutils...

Linux檔案監控

如果要讓伺服器保持最佳效能,你應該將 linux 伺服器的執行級別 runlevel 設定為 3 就是控制台模式,當你需要圖形化桌面的時候使用 startx 命令來啟動它。修改配置 etc inittab 找到 initdefault 一樣,將id 5 initdefault修改為 id 3 ini...

監控日誌檔案

環境 名稱主機名 ip服務端 wangyitong 192.168.232.128 客戶端wyt3 192.168.232.132 root wyt3 ls root wyt3 unzip pyscripts master.zip 解壓安裝包 root wyt3 cd pyscripts maste...