当前位置: 首页 > news >正文

delphi 正则提取html中的内容

function ExtractTextFromHTML(const HTML: string): string;
var
  RegEx: TRegEx;
begin
  Result := HTML;

  // 移除<script>标签及其内容
  Result := TRegEx.Replace(Result, '<script.*?>.*?</script>', '', [roIgnoreCase, roSingleLine]);

  // 移除<style>标签及其内容
  Result := TRegEx.Replace(Result, '<style.*?>.*?</style>', '', [roIgnoreCase, roSingleLine]);

  // 移除所有HTML标签
  Result := TRegEx.Replace(Result, '<[^>]+>', '', [roIgnoreCase]);

  // 去除网址(新增部分)
  // 匹配 http/https/ftp 协议开头的URL
  Result := TRegEx.Replace(Result, '\b(https?|ftp)://[^\s/?#$%&]*[^\s?#$%&/]', '');

相关文章:

  • AI自动化编程初探
  • 物理服务器的作用都有哪些?
  • Linux 环境变量快速上手指南
  • 汽车一键启动按钮更换注意事项
  • 机器学习 Day02,matplotlib库绘图
  • C++新特性
  • docker无法pull镜像问题解决for win10
  • C语言每日一练——day_3(快速上手C语言)
  • 伽马函数相关知识点及其与概率论知识的结合
  • 内网安全-横向移动PTH 哈希PTT 票据PTK 密匙Kerberos密码喷射
  • Nginx 配置 SSL(HTTPS)详解
  • 嵌入式学习第二十四天--网络 服务器
  • 如何使用postman来测试接口
  • 联核科技AGV无人叉车有哪些安全防护措施?
  • 「Unity3D」UGUI将元素固定在,距离屏幕边缘的某个比例,以及保持元素自身比例
  • 概念|RabbitMQ 消息生命周期 待消费的消息和待应答的消息有什么区别
  • 手机号实名认证接口:数字时代的安全与便捷保障
  • 设计模式-结构型模式-桥接模式
  • GB28181视频平台LiveGBS在设置公网IP收流时,如何自定义修改收流端口区间
  • Docker Compose 部署 steamcmd 安装奈斯服务端
  • 零食销售网站开发与设计/营销型网站建设实训总结
  • 珠海营销型网站/网络营销策略包括哪些
  • 国家排污许可网站台账怎么做/网络推广营销培训机构
  • 黄冈网站建设价格/网站自然排名怎么优化
  • 荆州网站开发/seo服务外包公司
  • 怎么提高自己网站的知名度/全网营销推广