后台设置采集地址: 预览提示信息 没有内容 查看源码,系统中抓取目标网址的内容采用的方法是: function readfiletext($filepath){ $filepath=trim($filepath); $htmlfp=@fopen($filepath,r); //远程 if(strstr

后台设置采集地址: 预览提示信息 没有内容

查看源码,系统中抓取目标网址的内容采用的方法是:

 
function readfiletext($filepath){
    $filepath=trim($filepath);
    $htmlfp=@fopen($filepath,"r");
    //远程
    if(strstr($filepath,"://")){
        while($data=@fread($htmlfp,500000)) {
            $string.=$data;
        }
    }
    //本地
    else{
        $string=@fread($htmlfp,@filesize($filepath));
    }
    @fclose($htmlfp);
    return $string;
}
这个方法中远程 可以被目标服务器防止采集。

如是附加curl 方法:

 
function curl_get_html($url = ''){
     $ch = curl_init();
     curl_setopt($ch, CURLOPT_URL, $url);
     curl_setopt($ch, CURLOPT_HEADER, false);
     curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //如果把这行注释掉的话,就会直接输出
     $result=curl_exec($ch);
     curl_close($ch);
     return $result;
}
修改 readfiletext 函数的引用入口:提前判断 远程 与 本程 的区别
转载请说明出处
知优网 » 帝国cms采集后预览提示信息 没有内容?(帝国cms采集入库)

发表评论

您需要后才能发表评论