PHP将HTML转换成文本的实现代码

6年以前  |  阅读数:905 次  |  编程语言:PHP 

核心代码:


    <?php
    // $document 应包含一个 HTML 文档。
    // 本例将去掉 HTML 标记,javascript 代码
    // 和空白字符。还会将一些通用的
    // HTML 实体转换成相应的文本。

    $search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
             "'<[\/\!]*?[^<>]*?>'si",      // 去掉 HTML 标记
             "'([\r\n])[\s]+'",         // 去掉空白字符
             "'&(quot|#34);'i",         // 替换 HTML 实体
             "'&(amp|#38);'i",
             "'&(lt|#60);'i",
             "'&(gt|#62);'i",
             "'&(nbsp|#160);'i",
             "'&(iexcl|#161);'i",
             "'&(cent|#162);'i",
             "'&(pound|#163);'i",
             "'&(copy|#169);'i",
             "'&#

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8