Python抓取百度查询结果的方法

707次阅读  |  发布于5年以前

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:


    #win python 2.7.x
    import re,sys,urllib,codecs
    xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn;=100").read().decode('utf-8') 
    rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
    match = rc.finditer(xh)
    rcr = re.compile(r'<[^>]+>',re.I)
    f = codecs.open("xiaohei.txt", "w", "utf-8")
    for i in rc.finditer(xh):
      ss = i.group(0)
      s1 = rcr.sub('',ss)
      print (s1)
      f.write(s1)
    f.close()

希望本文所述对大家的Python程序设计有所帮助。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8