使用Python保存网页上的图片或者保存页面为截图

865次阅读  |  发布于5年以前

Python保存网页图片
这个是个比较简单的例子,网页中的图片地址都是使用'http://。。。。.jpg'这种方式直接定义的。

使用前,可以先建立好一个文件夹用于保存图片,本例子中使用的文件夹是 d:\\pythonPath这个文件夹

代码如下:


    # -*- coding: UTF-8 -*- 
    import os,re,urllib,uuid 

    #首先定义云端的网页,以及本地保存的文件夹地址 
    urlPath='http://gamebar.com/' 
    localPath='d:\\pythonPath' 


    #从一个网页url中获取图片的地址,保存在 
    #一个list中返回 
    def getUrlList(urlParam): 
      urlStream=urllib.urlopen(urlParam) 
      htmlString=urlStream.read() 
      if( len(htmlString)!=0 ): 
        patternString=r'http://.{0,50}\.jpg' 
        searchPattern=re.compile(patternString) 
        imgUrlList=searchPattern.findall(htmlString) 
        return imgUrlList 


    #生成一个文件名字符串  
    def generateFileName(): 
      return str(uuid.uuid1()) 


    #根据文件名创建文件  
    def createFileWithFileName(localPathParam,fileName): 
      totalPath=localPathParam+'\\'+fileName 
      if not os.path.exists(totalPath): 
        file=open(totalPath,'a+') 
        file.close() 
        return totalPath 


    #根据图片的地址,下载图片并保存在本地  
    def getAndSaveImg(imgUrl): 
      if( len(imgUrl)!= 0 ): 
        fileName=generateFileName()+'.jpg' 
        urllib.urlretrieve(imgUrl,createFileWithFileName(localPath,fileName)) 


    #下载函数 
    def downloadImg(url): 
      urlList=getUrlList(url) 
      for urlString in urlList: 
        getAndSaveImg(urlString) 

    downloadImg(urlPath) 

保存的文件如下:

201635144749913.jpg \(755×329\)

网页的一部分保存为图片
主要思路是selenium+phantomjs(中文网页需要设置字体)+PIL切图


    def webscreen():
      url = 'http://www.xxx.com'
      driver = webdriver.PhantomJS()
      driver.set_page_load_timeout(300)
      driver.set_window_size(1280,800)
      driver.get(url)
      imgelement = driver.find_element_by_id('XXXX')
      location = imgelement.location
      size = imgelement.size
      savepath = r'XXXX.png'
      driver.save_screenshot(savepath)
      im = Image.open(savepath)
      left = location['x']
      top = location['y']
      right = left + size['width']
      bottom = location['y'] + size['height']
      im = im.crop((left,top,right,bottom))
      im.save(savepath)

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8