本文实例分析了Python字符串和文件操作常用函数。分享给大家供大家参考。具体如下:
# -*- coding: UTF-8 -*-
'''
Created on 2010-12-27
@author: sumory
'''
import itertools
def a_containsAnyOf_b(seq,aset):
'''判断seq中是否含有aset里的一个或者多个项
seq可以是字符串或者列表
aset应该是字符串或者列表'''
for item in itertools.ifilter(aset.__contains__,seq):
return True
return False
def a_allIn_b(seq,aset):
'''判断seq中的所有项是否都在aset里
seq可以是字符串或者列表
aset应该是字符串或者列表'''
for item in seq:
if item not in aset:
return False
return True
def a_containsAll_b(seq,aset):
'''判断seq是否包含aset里的所有项
seq可以是字符串或者列表
aset应该是字符串或者列表
任何一个set对象a,a.difference(b)等价于a-set(b),即返回a中所有不属于b的元素'''
return not set(aset).difference(seq)
import string
#生成所有字符的可复用的字符串
sumory_allchars=string.maketrans('','')
def makefilter(keep):
'''返回一个函数,此函数接受一个源字符串作为参数\
并返回字符串的一个部分拷贝\
此拷贝只包括keep中的字符,keep必须是一个普通的字符串\
调用示例:makefilter('abca ')('abcdefgh ijkal cba')\
在后面的字符串中保留前面出现的字符 abc a cba
'''
#按照sumory_allchars规则剔除sumory_allchars字符串中的keep里的字符
#这里得到keep在sumory_allchars的补集
deletechars=sumory_allchars.translate(sumory_allchars,keep)
#生成并返回需要的过滤函数(作为闭包)
def realdelete(sourseStr):
return sourseStr.translate(sumory_allchars,deletechars)
return realdelete
def list_removesame(list):
'''删除list中的重复项'''
templist=[]
for c in list:
if c not in templist:
templist.append(c)
return templist
def re_indent(str,numberofspace):
'''
缩进\
将字符串str中按换行符划分并在每句前加上numberofspace个space\
再组合成字符串'''
spaces=numberofspace*' '
lines=[spaces+line.strip() for line in str.splitlines()]
return '\n'.join(lines)
def replace_strby_dict(sourseStr,dict,marker='"',safe=False):
'''使用字典替换源字符串中的被marker包裹的相应值'''
#如果safe为True,那么字典中没找到key时不替换
if safe:
def lookup(w):
return dict.get(w,w.join(marker*2))
#w.join(marker*2)用marker包裹w
#如果safe为False,那么字典中没找到key时抛异常\
#若将dict[w]换为dict.get(w)则没找到时返回None
else:
def lookup(w):
return dict[w]
#根据marker切分源字符串
splitparts=sourseStr.split(marker)
#取出切分后的奇数项
#因为切分后,列表中源字符串中marker包裹的项肯定位于基数部位
#就算是'"first"s is one'这样的字符串也是如此
#分割后的第0项为空串,第1项为first
splitparts[1::2]=map(lookup,splitparts[1::2])
return ''.join(splitparts)
def simply_replace_strby_dict(sourseStr,dict,safe=True):
'''根据dict内容替换sourseStr原串中$标记的子字符串\
dict= {'name':'sumory','else':'default'}
$$5 -> $5
$else -> default
${name}'s method -> sumory's method
'''
style=string.Template(sourseStr)
#如果safe,在dict中找不到的话不会替换,照样保留原串
if safe:
return style.safe_substitute(dict)
#false,找不到会抛异常
else:
return style.substitute(dict)
##################################################
def scanner(object,linehandler):
'''用linehandler方法遍历object的每一项'''
for line in object:
linehandler(line)
def printfilelines(path):
'''读取path路径下的文件屏逐行打印'''
fileobject=open(path,'r')#open不用放到try里
try:
for line in fileobject:
print(line.rstrip('\n'))
finally:
fileobject.close()
def writelisttofile(path,ilist):
fileobject=open(path,'w')
try:
fileobject.writelines(ilist)
finally:
fileobject.close()
import zipfile
def listzipfilesinfo(path):
z=zipfile.ZipFile(path,'r')
try:
for filename in z.namelist():
bytes=z.read(filename)
print('File:%s Size:%s'%(unicode(filename, 'cp936').decode('utf-8'),len(bytes)))
finally:
z.close()
import os,fnmatch
def list_all_files(root,patterns='*',single_level=False,yield_folders=False):
'''列出目录(或者及其子目录下的文件)'''
#分割模式到列表
patterns=patterns.split(';')
for path,subdirs,files in os.walk(root):
if yield_folders:
files.extend(subdirs)
files.sort()
for name in files:
for pat in patterns:
if fnmatch.fnmatch(name, pat):
yield '/'.join(unicode(os.path.join(path,name),'cp936').split('\\'))
break
if single_level:
break
def swapextensions(root,before,after):
if before[:1]!='.':
before='.'+before
extensionlen=-len(before)
if after[:1]!='.':
after='.'+after
for path,subdirs,files in os.walk(root):
for oldfile in files:
if oldfile[extensionlen:]==before:
oldfile=os.path.join(path,oldfile)
newfile=oldfile[:extensionlen]+after
os.rename(oldfile, newfile)
希望本文所述对大家的Python程序设计有所帮助。
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8