CSharp网页蜘蛛采集
作者:寂静之秋 / 发布于2013/3/1/ 634
这段代码有修改过比博客的新,对UTF-8和GB2312都能自动识别,对iso-8859-1无法判断需要手动选择编码方式,采集的HTML代码通过正则可以过滤成文本。 jQuery文件没有上传,下载后自己改一下地址就行,对程序没什么影响。
评论列表