加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_丽江站长网 (http://www.0888zz.com/)- 科技、建站、数据工具、云上网络、机器学习!
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

文章被百度重复收录的原因及解决办法

发布时间:2021-12-27 13:59:00 所属栏目:优化 来源:互联网
导读:四个评论刚好对应四个replytocom,百度蜘蛛可能有一定的智能,四个replytocom网址中只收录了一个,但是又不够智能,没有区分出来评论链接和原文链接对应的文章内容是相同的。 comment-page-1网址同样是来源于评论链接,comment-page-1代表着评论页面的第一页
四个评论刚好对应四个replytocom,百度蜘蛛可能有一定的智能,四个replytocom网址中只收录了一个,但是又不够智能,没有区分出来评论链接和原文链接对应的文章内容是相同的。
 
comment-page-1网址同样是来源于评论链接,comment-page-1代表着评论页面的第一页。如果我的评论比较多,比如说有1000条评论,那么一页肯定是显示不下去的,就会出现comment-page-2,comment-page-3......这就是评论分页功能,这个功能本质上是防止评论过多时,网页会被拉的很长,导致网页加载速度慢和用户体验差。但是不巧的是,百度蜘蛛依然不能识别出来这和原文
 
解决方法:
 
1、对于comment-page-1重复收录,有两种方式解决
 
1)在wordpress后台关闭评论分页
 
文章重复收录comment-page-1与replytocom
 
2)修改robots.txt,加上一句项目的代码
 
Disallow: /comment-page-
 
robots.txt在网站根目录,使用 网址/robots.tx就可以看到设置的结果了。如果根目录下没有这个文件
 
wp-includes/funtion中有这么一段代码:
 
$output = "User-agent: */n";
$public = get_option( 'blog_public' );
if ( '0' == $public ) {
    $output .= "Disallow: //n";
} else {
    $site_url = parse_url( site_url() );
    $path = ( !emptyempty( $site_url['path'] ) ) ? $site_url['path'] : '';
    $output .= "Disallow: $path/wp-admin//n";
}
在 $output .= "Disallow: $path/wp-admin//n";  后面增加一句$output .= "Disallow: $path/comment-page-/n";
 
2、对于replytocom重复收录,设置robots.txt文件
 
Disallow:/*?replytocom=
 
或者是加上对于包含replytocom的所有链接都加上nofollow链接
 
add_filter('comment_reply_link', 'add_nofollow', 420, 4);
function add_nofollow($link, $args, $comment, $post){
  return str_replace("href=", "rel='nofollow' href=", $link);
}

(编辑:应用网_丽江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读