代码语言
.
CSharp
.
JS
Java
Asp.Net
C
MSSQL
PHP
Css
PLSQL
Python
Shell
EBS
ASP
Perl
ObjC
VB.Net
VBS
MYSQL
GO
Delphi
AS
DB2
Domino
Rails
ActionScript
Scala
代码分类
文件
系统
字符串
数据库
网络相关
图形/GUI
多媒体
算法
游戏
Jquery
Extjs
Android
HTML5
菜单
网页交互
WinForm
控件
企业应用
安全与加密
脚本/批处理
开放平台
其它
【
Asp.Net
】
读取html内容
作者:
lybwwp
/ 发布于
2014/1/26
/
638
#region 读取html页面内容 /// <summary> /// 读取html页面内容 /// </summary> /// <param name="uri">网址</param> /// <param name="xpath">xpath标签</param> /// <returns></returns> private string GetWellFormedHTML(string uri, string xpath) { StreamReader sReader = null;//读取字节流 StringWriter sw = null;//写入字符串 SgmlReader reader = null;//sgml读取方法 XmlTextWriter writer = null;//生成xml数据流 try { if (uri == String.Empty) uri = "http://www.ypshop.net/list--91-940-940--search-1.html"; WebClient webclient = new WebClient(); webclient.Encoding = Encoding.UTF8; //页面内容 string strWebContent = webclient.DownloadString(uri); reader = new SgmlReader(); reader.DocType = "HTML"; reader.InputStream = new StringReader(strWebContent); sw = new StringWriter(); writer = new XmlTextWriter(sw); writer.Formatting = Formatting.Indented; while (reader.Read()) { if (reader.NodeType != XmlNodeType.Whitespace) { writer.WriteNode(reader, true); } } return sw.ToString(); } catch (Exception exp) { writer.Close(); reader.Close(); sw.Close(); sReader.Close(); return exp.Message; } } #endregion 下面这个是参考的 /// <summary> private string GetWellFormedHTML_Handle(string uri) { StreamReader sReader = null; StringWriter sw = null; SgmlReader reader = null; XmlTextWriter writer = null; try { if (uri == String.Empty) uri = "http://www.ypshop.net/list--91-940-940--search-1.html"; HttpWebRequest req = (HttpWebRequest)WebRequest.Create(uri); HttpWebResponse res = (HttpWebResponse)req.GetResponse(); sReader = new StreamReader(res.GetResponseStream()); reader = new SgmlReader(); reader.DocType = "HTML"; reader.InputStream = new StringReader(sReader.ReadToEnd()); sw = new StringWriter(); writer = new XmlTextWriter(sw); writer.Formatting = Formatting.Indented; while (reader.Read()) { if (reader.NodeType != XmlNodeType.Whitespace) { writer.WriteNode(reader, true); } } StringBuilder sb = new StringBuilder(); XPathDocument doc = new XPathDocument(new StringReader(sw.ToString())); XPathNavigator nav = doc.CreateNavigator(); //XPathNodeIterator nodes = nav.Select(xpath); //while (nodes.MoveNext()) //{ // sb.Append(nodes.Current.Value + " "); //} return sb.ToString(); } catch (Exception exp) { writer.Close(); reader.Close(); sw.Close(); sReader.Close(); return exp.Message; } }
试试其它关键字
读取html内容
同语言下
.
gzip压缩
.
实现http多线程断点续传下载文件
.
实现多线程断点续传下载大文件
.
生成字符串的 CheckSum
.
根据 UserAgent 获取浏览器的类型和版本
.
根据 Agent 判断是否是智能手机
.
隐藏手机号中间四位为*方法
.
合并图片(二维码和其他图片合并)
.
ASP.NET CORE中判断是否移动端打开网页
.
ASP.NET(C#)实现页面计时(定时)自动跳转
可能有用的
.
C#实现的html内容截取
.
List 切割成几份 工具类
.
SQL查询 多列合并成一行用逗号隔开
.
一行一行读取txt的内容
.
C#动态修改文件夹名称(FSO实现,不移动文件)
.
c# 移动文件或文件夹
.
c#图片添加水印
.
Java PDF转换成图片并输出给前台展示
.
网站后台修改图片尺寸代码
.
处理大图片在缩略图时的展示
lybwwp
贡献的其它代码
(
17
)
.
获取RadiobuttonList的选中值
.
asp.net 页面关闭事件
.
定时刷新验证码
.
DevExpress gridControl1 列自动序号
.
读取html内容
.
获取Repeater, DataList中的索引号(行号,序号)
.
List 筛选条件符合项目
.
获取客户端浏览器,ip地址,操作系统信息
.
将2进制转化为单精度
.
枚举与int的互换
Copyright © 2004 - 2024 dezai.cn. All Rights Reserved
站长博客
粤ICP备13059550号-3