Python3读取UTF-8文件及统计文件行数的方法

396次阅读  |  发布于5年以前

本文实例讲述了Python3读取UTF-8文件及统计文件行数的方法。分享给大家供大家参考。具体实现方法如下:


    ''''' 
    Created on Dec 21, 2012 
    Python 读取UTF-8文件 
    统计文件的行数目 
    @author: liury_lab 
    ''' 
    # -*- coding: utf-8 -*- 
    import codecs 
    # 对较小的文件,最简单的方法是将文件读入一个行列表中,
    # 然后计算列表的长度即可 
    count = len(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8').readlines())
    print(count) 
    # 对较大的文件,可循环计数 
    count = -1 
    for count, line in enumerate(codecs.open('d:/FreakOut.cpp', 'rU', 'utf-8')):
      pass 
    count += 1 
    print(count) 
    # 对于像windows结束标记有'\n'的,还可以有如下办法: 
    count = 0 
    the_file = codecs.open('d:/FreakOut.cpp', 'rb', 'utf-8') 
    while (True): 
      buffer = the_file.read(8192*1024) 
      if not buffer: 
        break 
      count += buffer.count('\n') 
    count += 1 
    the_file.close() 
    print(count) 

希望本文所述对大家的Python程序设计有所帮助。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8