python去除所有html标签的方法

1147次阅读  |  发布于5年以前

本文实例讲述了python去除所有html标签的方法。分享给大家供大家参考。具体分析如下:

这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容


    import re
    html='<a href="http://www.jb51.net">脚本之家</a>,Python学习!'
    dr = re.compile(r'<[^>]+>',re.S)
    dd = dr.sub('',html)
    print(dd)

运行结果如下:


    脚本之家,Python学习!

希望本文所述对大家的Python程序设计有所帮助。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8