spark讀取資料夾下的檔名稱

2021-09-01 19:44:03 字數 509 閱讀 8999

我之前遇到過處理日誌檔案的是檔案裡面沒有日期,日期在檔名上,後來我就上網上搜了搜,發現spark並沒有對檔名有過多的解釋,但是看到一些文章寫的是spark對檔名的操作,領略了下,把自己的想法寫出來給大家看看

def get_hdfs_dir(input: string, sc: sparkcontext): array[string] = )

})val dirout: array[string] = fileadnline

.distinct() //可能會有很多一樣的path,進去去重操作

.coalesce(1)

// val array: array[list[char]] = fileadnline //這裡面存放的就是path

.map(lines => )

.collect()

dirout //dirout 是乙個array型別的資料裡面存放的就是傳入資料夾下的路徑

}

讀取Windows資料夾下面檔名

在vs工程中新增lib檔名稱比較麻煩,通過 將需要的檔名儲存在txt檔案彙總 在網上找到了一段 修改一下成功執行!test max.cpp 定義控制台應用程式的入口點。include stdafx.h include include include include include include p...

資料夾下的檔名路徑讀取(C )

在機器學習模型訓練前期,需要對資料 影象 文字等進行預處理,而如何快速生成資料的文字路徑呢?本文接下來直接使用c 實現文字路徑生成,可查詢固定格式如.jpg txt等檔案路徑 絕對路徑或檔名 然後儲存為.txt文字,方便後期資料讀取使用。include include include include...

c 讀取資料夾下的所有檔名

目錄 1.讀取某一資料夾下的檔名 非迭代式 2.讀取某一資料夾下的所有檔名 迭代式 tips 主要是通過 findfirst和 findnext來實現。include include include include include include ifstream include 包含getline...