火车头伪原创插件

日期:2020-02-22 人气:257 来源:原创

今天给大家带来的福利是火车头采集伪原创源码

火车头的伪原创插件 可以用来采集的时候进行伪原创替换标题和内容  放到 \Plugins\LocoySpider  路径在最后配置的时候选下这个就可以



<?php

error_reporting(E_ERROR | E_WARNING | E_PARSE);

/*

*外部编程接口处理标签内容示范文件

*该文件内自动系统的三个参数$LabelArray $LabelCookie,$LabelUrl

*对任意采集的标签都适用请对标签内容处理后直接将该数组serialize($LabelArray)输出,

*采集器内部即可接收到该标签的内容,对比以前的接口规则,新规则可以实现标签之间的数据调用和处理

*参数说明:

  *$LabelArray    -  标签名及标签内容集合 结构如:Array('栏目id' => 2,'出处'=>  '新浪微博','内容'=>'<center><b>暴笑短信')  ##

  *$LabelCookie   -  对应采集中用到的Cookie值

  *$LabelUrl      -  当前采集的页面的Url地址 

  * 特别注意:如果是处理列表页,默认页,多页时会有以下两个标签

    $LabelArray['Html']       网页的源代码,没有经过采集器处理的,直接下载后的数据.修改这里的数据,请将新值赋予$LabelArray['Html']

    $LabelArray['PageType']   值可能为 List, Pages, Content 分别代表处理列表页,多页,默认页

*以上语句建议不更改,以下为用户操作区域  该区域只限对数组值进行操作,不得有打印输出产生,不得直接增加或删除相应标签名

*/

/*使用之前请修改下面的api链接地址*/

$url_api="http://wycapi.0907.org/wyc/api.php?token=200653131";


/*以下代码如果不懂请勿修改*/




function post_curl($url,$text){

    $ch = curl_init();

    curl_setopt($ch, CURLOPT_URL, $url);

    curl_setopt($ch, CURLOPT_POST, 1);

    curl_setopt($ch, CURLOPT_POSTFIELDS, array("info"=>$text));

    curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);

    curl_setopt($ch, CURLOPT_USERAGENT, "HCT");

    curl_setopt($ch, CURLOPT_TIMEOUT, 30);

    $output = curl_exec($ch);

    curl_close($ch);

return  $output;

}



if($LabelArray['Html'])

{

$LabelArray['Html']='当前页面的网址为:'.$LabelUrl."\r\n页面类型为:".$LabelArray['PageType']."\r\nCookies数据为:$LabelCookie\r\n接收到的数据是:".$LabelArray['Html'];

}

else

{

isset($LabelArray['内容']) && $LabelArray['内容'] = $LabelArray['标题'].$LabelArray['内容'];  //★★★★★★注意这句。V2009SP2版后可实现多标签之间的相互调用★★★★★★

isset($LabelArray['内容']) && $LabelArray['内容'] = post_curl($url_api,$LabelArray['内容']);//简单替换一下


isset($LabelArray['标题']) && $LabelArray['标题'] = post_curl($url_api,$LabelArray['标题']);


isset($LabelArray['时间']) && $LabelArray['时间'] =date('Y-m-d H:i:s',time()); //不用标签内容,直接获取time()函数得到的当前时间,用Y-m-d H:i:s格式输出,如2008-05-28 00:12:23

}

//#############以上为用户操作区域#############################################################################################################################

//#############以下语句必须保留,建议不更改###################################################################################################################

//ob_clean();

echo serialize($LabelArray);

?> 




PS:因为上传不了文件 所以以代码的形式呈现上来~

  • 上一篇: 暂无资料
  • 下一篇:
  • 更新文章