Python实现递归遍历文件夹并删除文件

1056次阅读  |  发布于5年以前

思路:

遍历文件夹下面的文件夹
如果文件夹名称等于".svn",则修改文件夹的属性(因为".svn"的文件都是只读的,你不能直接删除)
删除此文件夹
如果文件夹名称不等于".svn",则递归上面的方法

Python的实现

代码


    import os
    import shutil
    import os.path
    import stat
    rootdir="F:\\work\\Test"
    for parent,dirnames,filenames in os.walk(rootdir): #遍历文件夹下面的所有文件夹 

      for dirname in dirnames:   
        if dirname=='.svn':
          strfilepath=parent+os.sep+dirname
          if os.path.isdir(strfilepath):
            os.system('attrib -r ' + parent + '\\*.* /s')#设置本文件夹可写
            os.system('attrib -r ' + strfilepath + '\\*.* /s')#设置父文件夹可写        
            shutil.rmtree(parent+os.sep+dirname)#删除此文件夹

要点:

Walk在os模块下面,用来根据提供的文件夹生成一个generator。每次可以得到一个三元tupple,其中第一个为起始路径,第二个为起始路径下的文件夹,第三个是起始路径下的文件。
os.system('attrib -r ' + parent + '\\. /s') 设置文件夹可写
shutil.rmtree(parent+os.sep+dirname) 删除文件夹(即使文件夹里面有文件)

例二:

Python实现递归遍历指定文件目录(startdir),从而找到所有与指定的文件或目录(target)名相同的文件或目录的绝对路径。

scandir.py :


    #! /usr/bin/python
    # filename : scandir.py
    # author : Jesse
    # update : 2011/08/15 10:16

    import os

    def scandir(startdir, target) :
      os.chdir(startdir)
      for obj in os.listdir(os.curdir) :
        if obj == target :
          print os.getcwd() + os.sep + obj
        if os.path.isdir(obj) :
          scandir(obj, target)
          os.chdir(os.pardir) #!!!

    startdir = raw_input('Please input startdir: ')
    target = raw_input('Please input target: ')
    scandir(startdir, target)

关于该程序的一点说明:

1. 函数scandir的形参target可以是目录名也可以是文件名。
2. 函数chdir的作用是切换到指定目录,该参数必须是有效的且有访问权限的相对路径或绝对路径。
3. 函数的第五行,使用getcwd函数也是为了取得当前绝对路径。
4. 加号作为字符串的连接符。os.sep根据你的操作系统给出目录分隔符,在GNU/Linux和UNIX上它的返回值是'/',在windows上它的返回值是'\\',在Mac OS上是':',使用os.sep而不直接使用字符,会提高程序的可移植性。
5. 递归调用后,一定不能忘了os.chdir(os.pardir),返回上层目录(即父目录)。

重要:

1. 理解for中的两个并列的if语句,并列是为了解决目标是文件夹时,该目标文件夹中包含符合要求的文件夹。
2. 如果指定目录中存在访问受限的文件或文件夹,该程序会失败,返回无权访问信息。

例三:

Python递归遍历文件夹,寻找包含某个字符串的文本文件

linux下,如果不使用eclipse的话,想查找某个字符串在哪些文件中出现过就很麻烦,自己写了这个脚本在编码时使用,挺方便的。如果某个文本文件中包含的话,则只记录出现第一次的行数输出
使用方法:
python xxx.py 路径 字符串

python search_content.py /home/www/ abcdefg

search_content.py


    #!/use/bin/env python
    #-*- coding:utf-8 -*-
    import sys,os
    filterType = ['gif','png','bmp','jpg','jpeg','rar','zip',
          'ico','apk','ipa','doc','docx','xls','jar',
          'xlsx','ppt','pptx','pdf','gz','pyc','class']
    num = 0
    def search(path=None,cont=None):
      if not path or not cont:
        print('path or searchString is empty')
        return
      global num
      _loopFolder(path,cont)
      print("%s file find" % num)
    def _loopFolder(path,cont):
      arr = path.split('/')
      if not arr[-1].startswith('.'): #不检查隐藏文件夹
        if os.path.isdir(path):
          folderList = os.listdir(path)
          for x in folderList:
            _loopFolder(path+"/"+x,cont)
        elif os.path.isfile(path):
          _verifyContent(path,cont)
    def _verifyContent(path,cont):
      if path.split('.')[-1].lower() in filterType:
        return
      global num
      fh = open(path,'r')
      fhContent = fh.readlines()
      fh.close()
      for index,x in enumerate(fhContent):
        if cont in x:
          num += 1
          print("%s  %s" % (path,index+1))
          break
      return
    if __name__ == "__main__":
      if len(sys.argv) < 3:
        print("invalid parameters")
      else:
        search(sys.argv[1],sys.argv[2])

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8