当前位置: 首页 > news >正文

delphi 正则提取html中的内容

function ExtractTextFromHTML(const HTML: string): string;
var
  RegEx: TRegEx;
begin
  Result := HTML;

  // 移除<script>标签及其内容
  Result := TRegEx.Replace(Result, '<script.*?>.*?</script>', '', [roIgnoreCase, roSingleLine]);

  // 移除<style>标签及其内容
  Result := TRegEx.Replace(Result, '<style.*?>.*?</style>', '', [roIgnoreCase, roSingleLine]);

  // 移除所有HTML标签
  Result := TRegEx.Replace(Result, '<[^>]+>', '', [roIgnoreCase]);

  // 去除网址(新增部分)
  // 匹配 http/https/ftp 协议开头的URL
  Result := TRegEx.Replace(Result, '\b(https?|ftp)://[^\s/?#$%&]*[^\s?#$%&/]', '');

http://www.dtcms.com/a/61569.html

相关文章:

  • AI自动化编程初探
  • 物理服务器的作用都有哪些?
  • Linux 环境变量快速上手指南
  • 汽车一键启动按钮更换注意事项
  • 机器学习 Day02,matplotlib库绘图
  • C++新特性
  • docker无法pull镜像问题解决for win10
  • C语言每日一练——day_3(快速上手C语言)
  • 伽马函数相关知识点及其与概率论知识的结合
  • 内网安全-横向移动PTH 哈希PTT 票据PTK 密匙Kerberos密码喷射
  • Nginx 配置 SSL(HTTPS)详解
  • 嵌入式学习第二十四天--网络 服务器
  • 如何使用postman来测试接口
  • 联核科技AGV无人叉车有哪些安全防护措施?
  • 「Unity3D」UGUI将元素固定在,距离屏幕边缘的某个比例,以及保持元素自身比例
  • 概念|RabbitMQ 消息生命周期 待消费的消息和待应答的消息有什么区别
  • 手机号实名认证接口:数字时代的安全与便捷保障
  • 设计模式-结构型模式-桥接模式
  • GB28181视频平台LiveGBS在设置公网IP收流时,如何自定义修改收流端口区间
  • Docker Compose 部署 steamcmd 安装奈斯服务端
  • Kafka,Mq,Redis作为消息队列使用时的差异?|消息队列
  • 计算机视觉应用|自动驾驶的感知革命:多传感器融合架构的技术演进与落地实践
  • 从零开始的python学习(五)P71+P72+P73+P74
  • Redis6.2.6下载和安装
  • ①Modbus TCP转Modbus RTU/ASCII网关同步采集无需编程高速轻松组网
  • 广告营销反欺诈
  • 【Linux】38.网络基础(2.1)
  • K8S学习之基础二十一:k8s的持久化存储之emptyDir
  • 【AI深度学习网络】Transformer时代,RNN(循环神经网络)为何仍是时序建模的“秘密武器”?
  • 【开源】OpenAL、OpenCL、OpenCV 和 OpenGL