RSS
热门关键字:  虚拟主机技术  vps团购  discuz架构  虚拟主机团购  curl
当前位置 :| 团购首页>网站编程>ASP>

ASP使用代理进行内容采集的代码

来源: 作者: 时间:2008-10-05 Tag: 点击:

做网站的内容不可能全部都是原创,有时候需要采集一点来使网站内容更丰富,有的网站对短时间大量访问进行屏蔽,防止采集现象,那么这时候我们就需要使用代理,那么如何实现呢:下面为大家介绍使用代理采集:

Function ProxyPage(url)
Set Retrieval = CreateObject("MSXML2.ServerXMLHTTP.5.0")
With Retrieval
.SetProxy 2 , "255.0.0.0:80" '代理ip:代理端口
.Open "Get", url, False, "", ""
.setRequestHeader "Referer","http://www.baidu.com/" '伪造referer
.Send
ProxyPage = BytesToBstr(.ResponseBody)
End With
Set Retrieval = Nothing
End Function
附BytesToBstr过程,你采集的时候可以定义网页是utf-8还是gb2312,utf="True"为 utf-8
Function BytesToBstr(body)
dim objstream
set objstream = Server.CreateObject("ad"&""&"odb.st"&""&"ream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
if utf="True" then
objstream.Charset = "utf-8"
else
objstream.Charset = "gb2312"
end if
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
代码解释:
如果你系统是win 2003 只能使用以下代码
CreateObject("MSXML2.ServerXMLHTTP.4.0")
若为xp
CreateObject("MSXML2.ServerXMLHTTP.5.0")
伪造referer用处很一般,不过对于一些站还是有用的,所以代码我加上了,可以注释掉,.

希望这个函数对大家有一点指导作用!
 


 


    由于各种原因,我们无法获知[ASP使用代理进行内容采集的代码]原创作者,如侵犯了您的版权,请您及时联系我们!
上一篇:ASP内容管理系统(CMS)横向比拼
下一篇:没有了
最新评论共有 0 位网友发表了评论
发表评论
评论内容:不能超过250字,需审核,请自觉遵守互联网相关政策法规。
用户名: 密码:
匿名?
注册