wordpress的百度优化

加入百度ping

在wordpress后台,设置->撰写中,有一个更新服务,加入:http://ping.baidu.com/ping/RPC2

这样,当文章更新之后,就会主动通知百度

 

避免重复内容

WordPress的存档页和日历页等,对百度来说是多余的,因为这项页面内容在其他网页中都是有的,Google能很好的识别出来,不收录他们,但是百度会收录,而且会认为你的网页内容重复。

解决方案是在robots.txt中禁止这两类页面,示例如下:

User-agent: *
Disallow: /wp-*
Allow: /wp-content/uploads/
Allow: /wp-content/downloads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?
Disallow: /feed
Disallow: /*/*/feed
Disallow: /trackback
Disallow: /*/*/trackback
Disallow: /index.php?
Disallow: /index.php/
Disallow: /date/
Disallow: /page/

 

  • User-agent: * 表示对所有的搜索引擎都采用下面的规则;
  • Disallow: /wp- 不允许Google/百度spider抓取和索引wp-开头的文件及目录,如wp-login.php,wp-admin目录等均被阻止;
  • Allow: /wp-content/uploads/ 因为在上一条将wp-content目录屏蔽了,这样Google图片搜索和百度就无法访问放在/wp-content/uploads/目录下的图片,为了能使Google图片搜索收录图片等附件,将这个目录设置为Allow;
  • Disallow: /? 禁止搜索引擎spider索引以?开头的网址,也可以一条一条写:

    Disallow: /?p=       单独文章页面
    Disallow: /?cat=     文章分类页面
    Disallow: /?tag=     文章标签页面
    Disallow: /?m=       文章按月归档
    Disallow: /?r=       文章评论链接跳转地址
    Disallow: /?s=       文章站内搜索结果页面
    Disallow: /?paged=   固定页面
    Disallow: /?feed=    博客订阅feed
    Disallow: /?*        其他动态页面

    • Disallow: /feed 禁止Google,百度搜索引擎索引feed博客页面。博客都有一个订阅整站的feed,每个文章分类,每篇文章也分别有一个feed,feed页面和网站页面内容基本相同,如果feed页面没有被禁止访问,可想而知,这将会产生大量的重复页面。有博友反映将feed Disallow以后,从百度搜索引擎来的流量上升非常明显。这里请注意Disallow: /feed和最后加了反斜杠的Disallow: /feed/ 是完全不一样的。Disallow: /feed可以禁止的url包括:abc.com/feed,abc.com/feed.html,abc.com/feed/abc这三种形式,而 Disallow: /feed/只能禁止搜索引擎访问abc.com/feed/abc这种目录形式,所以我们应该用Disallow: /feed。
    • Disallow: /*/*/feed 这条规则禁止Google/baidu等搜索引擎访问文章分类和单独文章文章页面的feed。如本文的http://farlee.info /archives/wordpress-robots-txt-seo-google-baidu-difference.html/feed。注意这项根据每个博客固定链接结构的不同要采取不同的设置,如abc.com/1.html/feed,规则要改成Disallow: /*/feed
    • 后面两条trackback和feed一样。
    • Disallow: /index.php? 这条规则是为了防止搜索引擎收录abc.com/index.php这种url产生的动态网址
    • Disallow: /index.php/ 这条规则是为了防止搜索引擎收录abc.com/index.php这种url下的所有目录
    • Disallow: /*.php$ 这条规则是为了禁止搜索引擎访问和收录.php后缀结尾的url,包括abc.com/index.php,有效防止了首页权重被分散。
    • Disallow: /*.css$ 禁止搜索引擎访问css文件。
    • Disallow: /date/ 禁止搜索引擎访问日期存档页面
    • Disallow: /page/ 禁止搜索引擎访问博客文章翻页页面,这里设置后好处是减少了重复页面,坏处是Google和baidu的spider无法检索到老文章,因此这里要和网站地图Sitemap.xml配合使用。

 

禁用All in one seo插件

All in one seo插件是对google优化有效果,据说会影响百度收录。

 

百度sitemap插件

在wordpress后台直接搜索安装插件baidu-sitemap-generator

点击设置栏目下的Baidu-Sitemap选项进入插件设置页面。

生成的sitemap文件的文件名和格式分别是sitemap_baidu.xml、sitemap.html

在首页合适的位置加上这两个文件的链接,以方便百度蜘蛛访问。

也可放在robots.txt中:

  Sitemap: http://www.visualay.com/sitemap_baidu.xml

  Sitemap: http://www.visualay.com/sitemap.html

详细资料:http://liucheng.name/884/

Leave a Comment