python 遍歷資料夾

2021-06-27 05:31:28 字數 2404 閱讀 8581

1.遍歷資料夾

import os

import os.path

rootdir = 「d:

\data」 # 指明被遍歷的資料夾

for parent,dirnames,filenames in os.walk(rootdir)

: #三個引數:分別返回1.父目錄 2.所有資料夾名字(不含路徑) 3.所有檔案名字

for dirname in dirnames: #輸出資料夾資訊

print "parent is:"

+ parent

print "dirname is"

+ dirname

for filename in filenames: #輸出檔案資訊

print "parent is"

:+ parent

print "filename is:"

+ filename

print "the full name of the file is:"

+ os.path.join(parent,filename) #輸出檔案路徑資訊

#windows下為:d:

\data\query_text\el_00154

2.查詢中文字元

import re 

pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?'

) #判斷是否為中文的正規表示式

f=open(

"d:\\workspace\\saas\\core\\admin\\controller\\sale\\ctl.tools.php"

) #開啟要提取的檔案

fw=open(

"getdata.txt"

,"w"

)#開啟要寫入的檔案

for line in f.readlines(

): #迴圈讀取要讀取檔案的每一行

m=pchinese.findall(line.decode(

'utf8'

)) #使用正則表達獲取中文

if m:

str1=

'|'.join(m)

#同行的中文用豎槓區分

str2=str1

fw.write(str2)

#寫入檔案

fw.write(

"\n"

)#不同行的要換行

f.close(

)fw.close()#

3.遍歷資料夾,並將檔案中中文寫入檔案

#coding=utf-8 

import re, os

def find_chn(infile, outfile)

:pchinese=re.compile(ur'([\u4e00-\u9fa5]+)+?'

) #判斷是否為中文的正規表示式

f=open(infile) #開啟要提取的檔案

flag = 0

for line in f.readlines(

): #迴圈讀取要讀取檔案的每一行

if line.find(

'//')!

=-1:

#如果有注釋,直接跳過

continue

if line.find(

'/*')!

=-1 or line.find('')

!=-1:flag = 0

continue

if flag=

=1:continue

m=pchinese.findall(line.decode(

'utf8'

)) #使用正則表達獲取中文

if m:

str1=

'|'.join(m)

#同行的中文用豎槓區分

str2=str1

outfile.write(str2)

#寫入檔案

outfile.write(

"\n"

)#不同行的要換行

print str2

f.close(

)fw=open(

"getdata.txt"

,"a+"

)#開啟要寫入的檔案

for parent,dirnames,filenames in os.walk(

"d:\\workspace\\saas\\core\\shop\\view\\gallery\\"

): #三個引數:分別返回1.父目錄 2.所有資料夾名字(不含路徑) 3.所有檔案名字

for filename in filenames: #輸出檔案資訊

print os.path.join(parent,filename)

find_chn(os.path.join(parent,filename)

, fw)

fw.close()#

python 遍歷資料夾

在python中,檔案操作主要來自os模組,主要方法如下 os.listdir dirname 列出dirname下的目錄和檔案 os.getcwd 獲得當前工作目錄 os.curdir 返回當前目錄 os.chdir dirname 改變工作目錄到dirname os.path.isdir nam...

python 遍歷資料夾

import os import os.path rootdir r d data 指明被遍歷的資料夾 for parent,dirnames,filenames in os.walk rootdir 三個引數 分別返回1.父目錄 2.所有資料夾名字 不含路徑 3.所有檔案名字 for dirnam...

python 遍歷資料夾

遍歷目錄 使用os.walk path 其返回值是乙個三元素元組 目錄parent,目錄parent下的目錄dirnames,目錄parent下的檔案filenames 返回值分析 目錄parent 是乙個純str 目錄parent下的目錄dirnames 是乙個子資料夾集合 目錄parent下的檔...