Python利用Beautiful Soup模块搜索内容详解

928次阅读  |  发布于5年以前

前言

我们将利用 Beautiful Soup 模块的搜索功能,根据标签名称、标签属性、文档文本和正则表达式来搜索。

搜索方法

Beautiful Soup 内建的搜索方法如下:

使用 find() 方法搜索

首先还是需要建立一个 HTML 文件用来做测试。


    <html>
    <body>
    <div class="ecopyramid">
     <ul id="producers">
     <li class="producerlist">
      <div class="name">plants</div>
      <div class="number">100000</div>
     </li>
     <li class="producerlist">
      <div class="name">algae</div>
      <div class="number">100000</div>
     </li>
     </ul>
     <ul id="primaryconsumers">
     <li class="primaryconsumerlist">
      <div class="name">deer</div>
      <div class="number">1000</div>
     </li>
     <li class="primaryconsumerlist">
      <div class="name">rabbit</div>
      <div class="number">2000</div>
     </li>
     </ul>
     <ul id="secondaryconsumers">
     <li class="secondaryconsumerlist">
      <div class="name">fox</div>
      <div class="number">100</div>
     </li>
     <li class="secondaryconsumerlist">
      <div class="name">bear</div>
      <div class="number">100</div>
     </li>
     </ul>
     <ul id="tertiaryconsumers">
     <li class="tertiaryconsumerlist">
      <div class="name">lion</div>
      <div class="number">80</div>
     </li>
     <li class="tertiaryconsumerlist">
      <div class="name">tiger</div>
      <div class="number">50</div>
     </li>
     </ul>
    </div>
    </body>
    </html>

我们可以通过 find()方法来获得

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8