当前位置: 首页 > wzjs >正文

上海做网站的公司是什么seo基本步骤

上海做网站的公司是什么,seo基本步骤,精品课程网站设计代码,用wordpress做的外贸网站在当今信息爆炸的时代,如何从浩瀚的互联网中快速、准确地获取所需数据成为了一个重要的技能。网络爬虫技术应运而生,它允许我们自动化地访问网页并提取其中的信息。Java作为一门功能强大且拥有丰富生态的编程语言,在构建网络爬虫方面也表现出…

  在当今信息爆炸的时代,如何从浩瀚的互联网中快速、准确地获取所需数据成为了一个重要的技能。网络爬虫技术应运而生,它允许我们自动化地访问网页并提取其中的信息。Java作为一门功能强大且拥有丰富生态的编程语言,在构建网络爬虫方面也表现出色。

很多时候,我们并不需要网页的全部内容,而仅仅是对其中符合特定格式或特征的数据感兴趣,例如:电子邮件地址、电话号码、特定商品的链接或价格、或者像本例中将要演示的——身份证号码格式的字符串。这时,强大的**正则表达式(Regular Expression)**就派上了用场。它能帮助我们定义复杂的文本匹配规则,从而在抓取到的网页源码中精确地筛选和提取出目标数据。

本文将通过一个具体的Java代码示例,演示如何结合使用Java的网络编程API(URL, URLConnection)和正则表达式库(java.util.regex),实现以下目标:

  1. 连接到指定的网页URL。

  2. 读取网页的HTML源代码。

  3. 利用预定义的正则表达式,在源代码中查找并提取所有符合特定模式的数据(以提取类似身份证号码的18位数字串为例)。

让我们一步步深入代码,了解其工作原理。

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;public class RegexDemo7 {public static void main(String[] args) throws IOException {/* 扩展需求2:把连接中所有的号码都爬取出来。*///创建一个URL对象URL url = new URL("https://new.gugu**.com/sfz");//连接上这个网址//细节:保证网络是畅通URLConnection conn = url.openConnection();//创建一个对象去读取网络中的数据BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream()));String line;//获取正则表达式的对象patternString regex = "[1-9]\\d{17}";Pattern pattern = Pattern.compile(regex);//在读取的时候每次读一整行while ((line = br.readLine()) != null) {//拿着文本匹配器的对象matcher按照pattern的规则去读取当前的这一行信息Matcher matcher = pattern.matcher(line);while (matcher.find()) {System.out.println(matcher.group());}}br.close();}
}

http://www.dtcms.com/wzjs/295369.html

相关文章:

  • 包头市建设工程质量监督站网站网络营销自学网站
  • 宝安网站公司北京网站优化排名
  • 重庆工程网站建设百度发布信息怎么弄
  • 广州网站设计服务公司网站设计哪家好
  • 自己做网站 教程今日最新消息新闻报道
  • 如何做网站的教程视频北京最新疫情最新消息
  • 做网站推销自己的产品这可行吗长沙线上引流公司
  • 南通网站建设团队长春网站制作公司
  • 基础展示营销型型网站关键词分为哪几类
  • wordpress 站点网络营销工具体系
  • 即墨网站建设哪里有网页制作培训教程
  • 做羞羞的事情网站百度上怎么发布信息啊
  • 做淘宝客个人网站文章推广平台
  • 网站开发和软件开发北京seo报价
  • 保山企业网站建设郑州网络seo
  • 如何做网站的薪酬调查搜索排名广告营销怎么做
  • 网站如何做邮箱订阅北京seo培训机构
  • asp网站制作软件专业培训seo的机构
  • 下载网站的服务器文件网络营销推广方案步骤
  • 厦门建设局网站中标结果查询2345网址导航官方网站
  • java 做网站域名怎么做百度竞价优化
  • 辽宁建委(建设局)的官方网站昆明网站seo公司
  • 杭州网站设计建设安徽seo人员
  • 常德今日确诊名单seo服务公司怎么收费
  • 企业网站的重要性seo是搜索引擎优化吗
  • 2g网站空间百度提交入口网址在哪
  • 企业做网站方案网站搜索引擎优化主要方法
  • 辽宁省造价工程信息网seo排名怎么看
  • b s网站开发临沂森工木业有限公司
  • 网站商城设计方案百度收录提交网站后多久收录