页面爬虫(获取其他页面HTML)加载到自己页面示例

668 查看

 
//前台 
<div id="showIframe"></div> 
$(document).ready(function() { 
var url = "@Url.Action("GetPageHtml","Catalog")"; 
$.ajax({ 
url: url, 
type: "POST", 
dataType:"json", 
data: { url: "http://www.baidu.com" }, 
error: function () { 
alert("bbb"); 
}, 
success: function (data) { 
$("#showIframe").append(data); 
//$("#showIframe div").hide(); 
//$("#showIframe>#container").show(); 
//$("#showIframe>#container>#content").show(); 
//$("#showIframe>#container>#content>.cmsPage").show(); 
} 
}); 
}); 
//后台 
//爬虫本质，发送URL请求，返回整个页面HTML 
[HttpPost] 
public JsonResult GetPageHtml(string url) 
{ 
string pageinfo; 
try 
{ 
HttpWebRequest myReq = (HttpWebRequest)HttpWebRequest.Create(url); 
myReq.Accept = "image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-flash, application/vnd.ms-excel, application/vnd.ms-powerpoint, application/msword, */*"; 
myReq.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)"; 
HttpWebResponse myRep = (HttpWebResponse)myReq.GetResponse(); 
Stream myStream = myRep.GetResponseStream(); 
StreamReader sr = new StreamReader(myStream, Encoding.Default); 
pageinfo = sr.ReadToEnd().ToString(); 
} 
catch 
{ 
pageinfo = ""; 
} 
return Json(pageinfo); 
} 

最近更新的内容

Windows 10 内置管理员无法打开Metro应用方法
在IIS7.5中ASP.NET调用cmd程序拒绝访问决绝方法小记
写在MongoCola在Github上获得200个Star之后
MongoDB应用总结
[C#] 值与引用
在SSIS 中使用 Web Service 以及解析XML 数据
[C#] 委托与事件（4）
[C#] 委托与事件（3）
[C#] 委托与事件（2）
[C#] 委托与事件（1）

你可能感兴趣的文章

Winform开发中常见界面的DevExpress处理操作
基于MVC+EasyUI的Web开发框架形成之旅--界面控件的使用
macOS 下 ASP.NET Core 初体验
RDIFramework.NET-.NET快速信息化系统开发整合框架【开发实例 EasyUI】之产品管理（MVC版）
循序渐进开发WinForm项目（1) --数据库设计和项目框架的生成
C#开发微信门户及应用(14)-在微信菜单中采用重定向获取用户数据
基于Metronic的Bootstrap开发框架经验总结（1）-框架总览及菜单模块的处理
（1-1）文件结构的升级（Area和Filter知识总结） - ASP.NET从MVC5升级到MVC6
『.NET Core CLI工具文档』（十三）dotnet-publish
Mac OS 安装.NET Core

2025 - 快车库 - 我的知识库重庆启连科技有限公司渝ICP备16002641号-10
企客连连表单助手企服开发榜单123