区空间 校空间 我的主页    照片   好友[文章  收藏   评论   留言   音乐       推荐文章 

教科院质量检测中心 |  工作日志 |  每日心情 |  教育活动 |  好文欣赏 |  网络 |  网上电脑咨讯 |  软件推荐 |  软件使用教程 |  编程心得 |  window系统 |  router os 路由器 |  ppc |  windows2008 |  数据库 |  Xamarin Android |  计算机阅卷 | 
本博客空间统计:    419 篇文章   295 个评论     


博主说明:教师
姓名:詹真纯
学校:罗湖区教育科学研究院
空间等级:38 >
现有积分:14219
距离下一等级:281分
空间排名:教师类 第58

 
最新文章
 
Iis导入ssl证书
正则表达式过滤所有的html
存储过程使用like
深圳中考新政公布!总分460变610,全.
《教育部关于加强初中学业水平考试命题工作.
教育质量监测工具的公平性研究
 
随机阅读
 
陈文卿老师《我们教了孩子什么》——预约幸.
薇薇公主的猫
百花儿选美
牛顿和苹果
水里的怪物
练习一解答
 
推荐文章
 
网站banner在线制作
罗湖区学校网站最新调用页面
在线“photoshop”
ppt转swf软件

2月
25 2020
 

正则表达式过滤所有的html


   作者:詹真纯 发表时间-11 :47:42  阅读( 29 )| 评论( 0 )

   string Htmlstring = html;
        Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "",
         RegexOptions.IgnoreCase);
        //删除HTML 
        Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"–>", "", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"<!–.*", "", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", "  ",
        RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase);
        Htmlstring = Regex.Replace(Htmlstring, @"&#(\d+);", "", RegexOptions.IgnoreCase);
        Htmlstring.Replace("<", "");
        Htmlstring.Replace(">", "");
        Htmlstring.Replace("\r\n", "");



上一篇文章:存储过程使用like    下一篇文章:Iis导入ssl证书



个人空间评论从2017年1月起采用实名制: