python分析网页上所有超链接的方法

1275次阅读  |  发布于5年以前

本文实例讲述了python分析网页上所有超链接的方法。分享给大家供大家参考。具体实现方法如下:


    import urllib, htmllib, formatter
    website = urllib.urlopen("http://yourweb.com")
    data = website.read()
    website.close()
    format = formatter.AbstractFormatter(formatter.NullWriter())
    ptext = htmllib.HTMLParser(format)
    ptext.feed(data)
    for link in ptext.anchorlist:
      print(link)

希望本文所述对大家的Python程序设计有所帮助。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8