欢迎进入极速独立站群官方网! 咨询电话:13135381668 销售QQ:1000207
各种互联网项目,新手可操作,几乎都是0门槛
金秋十月,是收获的季节,不过一些做垃圾站的站长收获的不是排名和pr,而是无情的被K,从这次百度算法的调整可以看出,百度对于收录的标准更加的倾向于谷歌,那就是,内容的原创性检验更加严格了,一些采集的甚至是伪原创的文章,往往也会被摒弃,对于花心血用原创文章来充实自己站群网站的站长来说,这无疑是一个好消息。
是的,原创一篇文章往往需要的间很长,也许冥思苦想一个小时,也写不出来一篇像样的,而使用采集呢,采集一个小时,如果你的匹配规则写得够精准,可能已经有两千篇文章躺在你的数据库里了。而一些站长为了节省时间,就会选择采集,其实,这些站长不知道的是,选择了采集,就是种下了恶果,往往会短时间内开出艳丽的花朵,但是等到了收获的季节,只有原创,才会结出丰硕的果实,“乃有青松翠柏,虽死尤生,重于泰山,浩气长存!有的是国杰豪英,人杰地灵,干将莫邪,千锤百炼,拂钟无声,销铁如泥!”用这首诗来形容原创文章再合适不过了,就算你花一天的时间来原创一篇文章,那也是值得的!你要相信,只有经过千锤百炼,才有可能成功,干将莫邪炼剑如此,我们做站也应该是如此。
说了这许多,有的人问了,我花很多时间原创的文章,被别人采集了,我的站权重太低,采集我的那个站权重高,百度先收录了采集站的,那我这不是做了无用功么。这个其实不用担心,有方法让别人采集不了你的站,网上也提供了一些方法防止采集,像什么使用随机模板,安装防采集插件什么的,其实,这些方法只能对付一些低等级的采集者,一旦你碰上了写正则表达式的高手,那么这些方法将会是浮云,该被采还是被采,下面我分享一个方法来做到百分之百不会被采集,任你的正则表达式使用的出神入化,也拿我的站没辙。
这个方法就是进行网址加密,我们知道,正则表达式会匹配你列表页的超链接,然后通过超链接地址来获取你文章页的内容,而一旦你把列表页的超链接进行加密,这样就从源头掐断了采集者的路。加密函数如下:
function uc_authcode($string, $operation = 'DECODE', $key = '', $expiry = 0) {
$ckey_length = 4; //note 随机密钥长度 取值 0-32;
//note 加入随机密钥,可以令密文无任何规律,即便是原文和密钥完全相同,加密结果也会每次不同,增大破解难度。
//note 取值越大,密文变动规律越大,密文变化 = 16 的 $ckey_length 次方
//note 当此值为 0 时,则不产生随机密钥
$key = md5($key);
$keya = md5(substr($key, 0, 16));
$keyb = md5(substr($key, 16, 16));
$keyc = $ckey_length ? ($operation == 'DECODE' ? substr($string, 0, $ckey_length): substr(md5(microtime()), -$ckey_length)) : '';
$cryptkey = $keya.md5($keya.$keyc);
$key_length = strlen($cryptkey);
$string = $operation == 'DECODE' ? base64_decode(substr($string, $ckey_length)) : sprintf('%010d', $expiry ? $expiry + time() : 0).substr(md5($string.$keyb), 0, 16).$string;
$string_length = strlen($string);
$result = '';
$box = range(0, 255);
$rndkey = array();
for($i = 0; $i <= 255; $i++) {
$rndkey[$i] = ord($cryptkey[$i % $key_length]);
}
for($j = $i = 0; $i < 256; $i++) {
$j = ($j + $box[$i] + $rndkey[$i]) % 256;
$tmp = $box[$i];
$box[$i] = $box[$j];
$box[$j] = $tmp;
}
for($a = $j = $i = 0; $i < $string_length; $i++) {
$a = ($a + 1) % 256;
$j = ($j + $box[$a]) % 256;
$tmp = $box[$a];
$box[$a] = $box[$j];
$box[$j] = $tmp;
$result .= chr(ord($string[$i]) ^ ($box[($box[$a] + $box[$j]) % 256]));
}
if($operation == 'DECODE') {
if((substr($result, 0, 10) == 0 || substr($result, 0, 10) - time() > 0) && substr($result, 10, 16) == substr(md5(substr($result, 26).$keyb), 0, 16)) {
return substr($result, 26);
} else {
return '';
}
} else {
return $keyc.str_replace('=', '', base64_encode($result));
}
}
此函数会随机把地址加密成无序的字符串,而且每次都是不一样的,这样就无规律可言,也就无法用正则进行匹配
用法:如果你的列表页网址是$str=”http://www.xiaohao.net/list/1.html”,那么在php文件里,对变量进行加密$url = uc_authcode($url 'DECODE', '#$123');第三个参数是加入加密串而加大破解的难度,这样,在你的模板上的网址就是加过密的了,而当你要读取数据库的时候可以用uc_authcode($url 'ENCODE', '#$123');来进行解密,这样在php文件在进行读库操作的时候,就不会是加过密的地址,如此一来,就彻底解决了原创文章被采集的问题。