本文实例讲述了python使用BeautifulSoup分析网页信息的方法。分享给大家供大家参考。具体如下:
这段python代码查找网页上的所有链接,分析所有的span标签,并查找class包含titletext的span的内容
复制代码 代码如下:
import urllib2
url = "http://www.python.org"
page = urllib2.urlopen(url)
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(page)
print soup.head
print soup.head.title
print len(page)
tags = soup.findAll('a')
print tags
titles = soup.findAll('span', attrs = { 'class' : 'titletext' })
for title in allTitles:
print title.contents
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8