后台设置采集地址: 预览提示信息 没有内容 查看源码,系统中抓取目标网址的内容采用的方法是: function readfiletext($filepath){ $filepath=trim($filepath); $htmlfp=@fopen($filepath,r); //远程 if(strstr
后台设置采集地址: 预览提示信息 没有内容
查看源码,系统中抓取目标网址的内容采用的方法是:
function readfiletext($filepath){
$filepath=trim($filepath);
$htmlfp=@fopen($filepath,"r");
//远程
if(strstr($filepath,"://")){
while($data=@fread($htmlfp,500000)) {
$string.=$data;
}
}
//本地
else{
$string=@fread($htmlfp,@filesize($filepath));
}
@fclose($htmlfp);
return $string;
}
这个方法中远程 可以被目标服务器防止采集。
如是附加curl 方法:
function curl_get_html($url = ''){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //如果把这行注释掉的话,就会直接输出
$result=curl_exec($ch);
curl_close($ch);
return $result;
}
修改 readfiletext 函数的引用入口:提前判断 远程 与 本程 的区别
查看源码,系统中抓取目标网址的内容采用的方法是:
function readfiletext($filepath){
$filepath=trim($filepath);
$htmlfp=@fopen($filepath,"r");
//远程
if(strstr($filepath,"://")){
while($data=@fread($htmlfp,500000)) {
$string.=$data;
}
}
//本地
else{
$string=@fread($htmlfp,@filesize($filepath));
}
@fclose($htmlfp);
return $string;
}
这个方法中远程 可以被目标服务器防止采集。
如是附加curl 方法:
function curl_get_html($url = ''){
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //如果把这行注释掉的话,就会直接输出
$result=curl_exec($ch);
curl_close($ch);
return $result;
}
修改 readfiletext 函数的引用入口:提前判断 远程 与 本程 的区别
转载请说明出处
知优网 » 帝国cms采集后预览提示信息 没有内容?(帝国cms采集入库)
知优网 » 帝国cms采集后预览提示信息 没有内容?(帝国cms采集入库)