WordPress指定文章不让蜘蛛爬取的方法

前段时间在开发一个客户的网站中,客户需要让某一个指定的文章不让蜘蛛爬取,在这里找到了一段代码可以完成此功能,非常实用,有需要的朋友可以拿去用!

<?php
// 需要说明的是,如果你的WordPress站点开启了页面缓存,此功能无效
function hithemese_add_custom_box() {
  if (function_exists('add_meta_box')) {    
    add_meta_box('hitheme_allow_se', '搜索引擎', 'hitheme_allow_se', 'post', 'side', 'low');
    add_meta_box('hitheme_allow_se', '搜索引擎', 'hitheme_allow_se', 'page', 'side', 'low');
  }
}
add_action('add_meta_boxes', 'hithemese_add_custom_box');

function hitheme_allow_se() {
  global $post;
  
  //添加验证字段
  wp_nonce_field('hitheme_allow_se', 'hitheme_allow_se_nonce');
  
  $meta_value = get_post_meta($post->ID, 'hitheme_allow_se', true);
  if($meta_value)
    echo '<input name="hitheme-allow-se" type="checkbox" checked="checked" value="1" /> 屏蔽搜索引擎';
  else
    echo '<input name="hitheme-allow-se" type="checkbox" value="1" /> 屏蔽搜索引擎';
}

// 保存选项设置
function hithemese_save_postdata($post_id) {
  // 验证
  if ( !isset( $_POST['hitheme_allow_se_nonce']))
    return $post_id;

  $nonce = $_POST['hitheme_allow_se_nonce'];

  // 验证字段是否合法
  if (!wp_verify_nonce( $nonce, 'hitheme_allow_se'))
    return $post_id;

  // 判断是否自动保存
  if (defined('DOING_AUTOSAVE') && DOING_AUTOSAVE) 
      return $post_id;

  // 验证用户权限
  if ('page' == $_POST['post_type']) {
    if ( !current_user_can('edit_page', $post_id))
      return $post_id;
  }
  else {
    if (!current_user_can('edit_post', $post_id))
      return $post_id;
  }
  
  // 更新设置
  if(!empty($_POST['hitheme-allow-se']))
    update_post_meta($post_id, 'hitheme_allow_se', '1');
  else
    update_post_meta($post_id, 'hitheme_allow_se', '0');
}
add_action('save_post', 'hithemese_save_postdata');

// 对于设置不允许抓取文章和页面
// 禁止搜索引擎抓取,返回404
function do_hitheme_allow_se() {
  // 本功能只对文章和页面有效
  if(is_singular()) {
    global $post;
    $is_robots = 0;
    $hitheme_allow_se = get_post_meta($post->ID, 'hitheme_allow_se', true);

    if(!empty($hitheme_allow_se)) {
      // 下面是爬虫Agent判断关键字数组
      // 有点简单,自己优化一下吧
      $bots = array(
            'Baiduspider',
            'Googlebot',
            'sogou spider',
            'Sogou web spider',
            'YodaoBot',
            'Bingbot',
            'Slurp',
            'MSNBot',
            'yahoo-blogs',
            'psbot',
            'Yandex',
            'Yeti',
            'blogsearch',
            'EasouSpider',
            'Mediapartners-Google'
            );
    
      $useragent = $_SERVER['HTTP_USER_AGENT'];
    
      if(!empty($useragent)) {
        foreach ($bots as $lookfor) {
          if (stristr($useragent, $lookfor) !== false) {
            $is_robots = 1;
            break;
          }
        }
      }

      // 如果当前文章/页面禁止搜索引擎抓取,返回404
      // 当然你可以改成403
      if($is_robots) {
        echo '<meta name="robots" content="noindex,nofollow" />';
      }
    }
  }
}
add_action('wp_head', 'do_hitheme_allow_se');