当前位置: 首页 > wzjs >正文

万网网站建设市场调研的方法有哪些

万网网站建设,市场调研的方法有哪些,西安网站建设推广,做网站时管理员权限的页面一 XPath的概念 1 XPath是对XML进行查询的表达式 ① Axes(路径) / 及 //; ② 第几个子节点[1] 等; ③ 属性 ④ 条件 [] ⑤ 例如 /books/book/title //price para[type“warning”][5] 2 使用XPath ① XmlDocument docnew XmlDocument(); ② doc.LoadXml(strXml)…

一 XPath的概念

1 XPath是对XML进行查询的表达式

① Axes(路径) / 及 //;
② 第几个子节点[1] 等;
③ 属性@
④ 条件 []
⑤ 例如
/books/book/@title
//price
para[@type=“warning”][5]

2 使用XPath

① XmlDocument doc=new XmlDocument();
② doc.LoadXml(strXml);
③ XmlElement root=doc.DocumentElement;
④ XmlNodeList nodes=
root.SelectNodes(strXPath);
XmlNode node=root.SelectSingleNode(strXPath);
node的.NodeType .InnerXml及.Value;

3 使用Xlst进行转换

在这里插入图片描述

XMLDocument doc=new XMLDocument();
doc.Load(@".\BookList.xml");
XPathNavigator nav=doc.Createnavigator();
nav.MoveToRoot();
XslTransform xt=new XslTransform();
xt.Load(@".\BookList.xslt");
XmlTextWriter writer=new XmlTextWriter(Console.Out);
xt.Transform(nav,null,writer);
using System;
using System.Collections;
using System.Collections.Generic;
using System.IO;
using System.Linq;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;
using System.Threading;
using System.Threading.Tasks;namespace 网络爬虫
{public class Crawler{private WebClient webClient = new WebClient();private Hashtable urls = new Hashtable();private int count = 0;static void Main(string[] args){Crawler myCrawler = new Crawler();string startUrl = "http://www.cnblogs.com/dstang2000";if (args.Length >= 1)startUrl = args[0];myCrawler.urls.Add(startUrl, false);//加入初始页面new Thread(new ThreadStart(myCrawler.Crawl)).Start();//开始爬行Console.ReadKey();}private void Crawl(){Console.WriteLine("开始爬行了.....");while(true){string current = null;foreach(string url in urls.Keys)//找到一个还没有下载过的链接{if ((bool)urls[url])continue;//已经下载过的,不再下载current = url;}if (current == null || count > 10)break;Console.WriteLine("爬行" + current + "页面!");string html = DownLoad(current);//下载urls[current] = true;count++;Parse(html);//解析,并加入新的链接}Console.WriteLine("爬行结束");}public string DownLoad(string url){try{HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);req.Timeout = 30000;HttpWebResponse response = (HttpWebResponse)req.GetResponse();byte[] buffer = ReadInstreamIntoMemory(response.GetResponseStream());string fileName = count.ToString();FileStream fs = new FileStream(fileName, FileMode.OpenOrCreate);fs.Write(buffer, 0, buffer.Length);fs.Close();string html = Encoding.UTF8.GetString(buffer);return html;}catch{ }return "";}public void Parse(string html){string strRef = @"(href|HREF|src|SRC)[ ]*=[ ]*[""'][^""'#>]+[""']";MatchCollection matches = new Regex(strRef).Matches(html);foreach(Match match in matches){strRef = match.Value.Substring(match.Value.IndexOf('=') + 1).Trim('"', '\'', '#', ' ', '>');if (strRef.Length == 0)continue;if (urls[strRef] == null)urls[strRef] = false;}}private static byte[] ReadInstreamIntoMemory(Stream stream){int bufferSize = 16384;byte[] buffer = new byte[bufferSize];MemoryStream ms = new MemoryStream();while(true){int numBytesRead = stream.Read(buffer, 0, bufferSize);if (numBytesRead <= 0)break;ms.Write(buffer, 0, numBytesRead);}return ms.ToArray();}}
}
http://www.dtcms.com/wzjs/506245.html

相关文章:

  • wordpress在线建站seo排名赚app是真的吗
  • 自己做的网站用别的电脑怎么访问关键词seo优化排名
  • 专业的免费网站建设资源网站优化排名优化
  • 深圳企业网站建设公司seo专员岗位职责
  • 网站设置不拦截好搜搜索引擎
  • 买域名之后怎样做网站公司网络营销推广软件
  • 做网站诈骗互联网营销的方式有哪些
  • 搭建游戏服务器福州百度快照优化
  • 自助建站软件考证培训机构
  • 长宁区企业网站建设短视频seo推广隐迅推专业
  • 苏州网站建设网页设计制作网站教程
  • 做网站一定要学java吗app下载推广
  • 如何做百度秒收录网站提升排名
  • 网站vip怎么做百度一下官网首页登录
  • 龙华学校网站建设公司推广渠道有哪些
  • 什么网站做招聘效果好抖音seo优化系统招商
  • wordpress游客怎么发表文章360优化大师官方版
  • wordpress发视频教程搜索引擎关键词优化有哪些技巧
  • 广告联盟网站怎么做seo怎么提升关键词的排名
  • 讨论建设网站的心得自己怎么制作网页
  • 网站怎么做外链海外推广方法有哪些
  • 我的世界做披风网站网站买卖交易平台
  • 东营市住房和城乡建设局网站设计网站模板
  • 大型建筑网站设计公司详情外链工厂 外链
  • 4399小游戏网页版入口长沙网站优化对策
  • 海宁网站建设淘宝客seo推广教程
  • 做预约的网站杭州seo推广服务
  • 小程序代理推广seo网站关键词优化软件
  • 怎样添加网站地图网站seo优化有哪些方面
  • 那种做任务的网站叫什么电子商务专业就业方向