加入百度ping
在wordpress后台,设置->撰写中,有一个更新服务,加入:http://ping.baidu.com/ping/RPC2
这样,当文章更新之后,就会主动通知百度
避免重复内容
WordPress的存档页和日历页等,对百度来说是多余的,因为这项页面内容在其他网页中都是有的,Google能很好的识别出来,不收录他们,但是百度会收录,而且会认为你的网页内容重复。
解决方案是在robots.txt中禁止这两类页面,示例如下:
User-agent: *
Disallow: /wp-*
Allow: /wp-content/uploads/
Allow: /wp-content/downloads/
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.js$
Disallow: /*.css$
Disallow: /?
Disallow: /feed
Disallow: /*/*/feed
Disallow: /trackback
Disallow: /*/*/trackback
Disallow: /index.php?
Disallow: /index.php/
Disallow: /date/
Disallow: /page/
- User-agent: * 表示对所有的搜索引擎都采用下面的规则;
- Disallow: /wp- 不允许Google/百度spider抓取和索引wp-开头的文件及目录,如wp-login.php,wp-admin目录等均被阻止;
- Allow: /wp-content/uploads/ 因为在上一条将wp-content目录屏蔽了,这样Google图片搜索和百度就无法访问放在/wp-content/uploads/目录下的图片,为了能使Google图片搜索收录图片等附件,将这个目录设置为Allow;
- Disallow: /? 禁止搜索引擎spider索引以?开头的网址,也可以一条一条写:
Disallow: /?p= 单独文章页面
Disallow: /?cat= 文章分类页面
Disallow: /?tag= 文章标签页面
Disallow: /?m= 文章按月归档
Disallow: /?r= 文章评论链接跳转地址
Disallow: /?s= 文章站内搜索结果页面
Disallow: /?paged= 固定页面
Disallow: /?feed= 博客订阅feed
Disallow: /?* 其他动态页面- Disallow: /feed 禁止Google,百度搜索引擎索引feed博客页面。博客都有一个订阅整站的feed,每个文章分类,每篇文章也分别有一个feed,feed页面和网站页面内容基本相同,如果feed页面没有被禁止访问,可想而知,这将会产生大量的重复页面。有博友反映将feed Disallow以后,从百度搜索引擎来的流量上升非常明显。这里请注意Disallow: /feed和最后加了反斜杠的Disallow: /feed/ 是完全不一样的。Disallow: /feed可以禁止的url包括:abc.com/feed,abc.com/feed.html,abc.com/feed/abc这三种形式,而 Disallow: /feed/只能禁止搜索引擎访问abc.com/feed/abc这种目录形式,所以我们应该用Disallow: /feed。
- Disallow: /*/*/feed 这条规则禁止Google/baidu等搜索引擎访问文章分类和单独文章文章页面的feed。如本文的http://farlee.info /archives/wordpress-robots-txt-seo-google-baidu-difference.html/feed。注意这项根据每个博客固定链接结构的不同要采取不同的设置,如abc.com/1.html/feed,规则要改成Disallow: /*/feed
- 后面两条trackback和feed一样。
- Disallow: /index.php? 这条规则是为了防止搜索引擎收录abc.com/index.php这种url产生的动态网址
- Disallow: /index.php/ 这条规则是为了防止搜索引擎收录abc.com/index.php这种url下的所有目录
- Disallow: /*.php$ 这条规则是为了禁止搜索引擎访问和收录.php后缀结尾的url,包括abc.com/index.php,有效防止了首页权重被分散。
- Disallow: /*.css$ 禁止搜索引擎访问css文件。
- Disallow: /date/ 禁止搜索引擎访问日期存档页面
- Disallow: /page/ 禁止搜索引擎访问博客文章翻页页面,这里设置后好处是减少了重复页面,坏处是Google和baidu的spider无法检索到老文章,因此这里要和网站地图Sitemap.xml配合使用。
禁用All in one seo插件
All in one seo插件是对google优化有效果,据说会影响百度收录。
百度sitemap插件
在wordpress后台直接搜索安装插件baidu-sitemap-generator
点击设置栏目下的Baidu-Sitemap选项进入插件设置页面。
生成的sitemap文件的文件名和格式分别是sitemap_baidu.xml、sitemap.html
在首页合适的位置加上这两个文件的链接,以方便百度蜘蛛访问。
也可放在robots.txt中:
Sitemap: http://www.visualay.com/sitemap_baidu.xml
Sitemap: http://www.visualay.com/sitemap.html