R語言讀取資料 拆分資料,並儲存到相應資料夾

2021-08-02 09:51:35 字數 1346 閱讀 1052

將一張excel表的資料按照第一列元素分組,分組後按照某種規則命名,並重新讀入excel中,放入指定的資料夾中。

如上所示的excel表,將sheet1中的資料按照「地域名稱」拆分,並將資料放入相應的省份資料夾,如放入d盤的test資料夾中

d:\mydata\test

|__test

|___mydata.xlsx

|___安徽省

|___安徽省安慶市.xlsx

|___安徽省蚌埠市.xlsx

|___河北省

|__河北省蚌埠市.xlsx

|___……

假如資料最終的資料夾目錄如上所示。**可以作如下編寫:

library(readxl)  # 載入readxl包,使用read_excel讀入excel檔案

library(xlsx) # 載入xlsx包,使用write.xlsx儲存檔案為excel格式

# setwd()設定路徑為d:\\mydata\\test'

setwd('d:\\mydata\\test')

# 1表示讀入第一張sheet,2表示讀入第二張sheet,也可用sheet = "sheetname",預設第一行為標題行

dt = read_excel('mydata.xlsx', 2)

# unique() 過濾重複資料,保留唯一資料

# 此處過濾掉第2列和第3列的重複行,最終只剩下3行不重複資料,預設不含標題

province_city

setwd('d:\\mydata\\test') # 設定當前路徑為省份資料夾放置的目錄

cdir

# 迴圈次數 n=province_city 的行數

for (i in c(1:nrow(province_city [,1])))else

# 設定檔名稱,即安徽省安慶市.xlsx

c_dir = paste('d:\\mydata\\test\\',province_city[i,2],sep = "")

# 設定c_dir為當前路徑

setwd(c_dir)

# write.xlsx 將所需的檔案列儲存到上述設定的檔案中,col.names=true包含標題

write.xlsx(dt1[,2:5],cfilename,col.names=true,showna=false)

# 設定路徑為cdir,進入到下一次迴圈

setwd(cdir)

}

scrapy爬取資料並儲存到文字

1.scrapy專案結構如下 2.開啟spidler目錄下的duba.py檔案,如下 這個是根據豆瓣一部分頁面獲取的熱門話題內容,有6條資料 coding utf 8 import scrapy from scrapydemo.items import scrapydemoitem from lxm...

php讀取csv資料儲存到陣列的方法

csv是常用的excel格式的替代品,很多時候我們匯出資料是都會導成csv格式的,這樣和excel沒什麼區別,下面的程式是要讀取csv資料儲存到陣列我們要對資料進行操作,所以儲存到資料,如下 複製 如下 info csvtoarray open teste.csv echo print r info...

Python爬取網路資料,並儲存到資料庫

import pymysql from bs4 import beautifulsoup from selenium import webdriver 這是防止頻繁請求網頁而被斷開連線 driver webdriver.phantomjs 這是煎蛋網的 那個page煎蛋網上是不固定的,所以,隨便取就...