博客网站的各大搜索引擎(百度、必应、谷歌)推送已基本完成,因为之前的笔记本没带这,所以过阵子更新教程。

来咧,本篇记录一下收集整理关于博客被百度、谷歌等搜索引擎收录的过程,至于一些Hexo的知识操作,请自己百度,主要涉及sitemap自动提交和npm安装。
SEO(search engine optimization),搜索引擎优化,是一种通过了解搜索引擎的运作规则来调整网站,以及提高目的网站在有关搜索引擎内排名的方式。
先给大家看一下效果:

安装sitemap

Google:
hexo-generator-sitemap --save
Baidu:
hexo-generator-baidu-sitemap --save

sitemap:一种文件,通过改文件列出网站上的网页,将网站的内容框架告知Google等搜索引擎,Googlebot等抓取工具会读取此文件,以便更智能地抓取网站。

hexo配置文件

  1. 修改博客根目录_config.yml,修改以下配置以生成相应的xml文件:
    1
    2
    3
    4
    5
    # 站点地图
    sitemap:
    path: sitemap.xml
    baidusitemap:
    path: baidusitemap.xml
  2. 修改文章链接,找到permalink配置项,优化链接形式
    hexo默认的文章链接规则是按照年月日、标题来生成地。一旦文章标题或者发布时间被作者修改,对应页面地URL也会发生变化,那之前的文章地址就变成了404,而且URL层级很深,不太适合提交引擎收录。而且,如果页面的标题是中文地话,转码会很长很长(特别长地那种😅)。
    2.1 Hexo-abbrlink
    • 链接优化的教程很多,这里给出我自用的一种。

    npm install hexo-abbrlink --save

    • 修改permalink
      1
      2
      3
      4
      5
      6
      7
      8
      9
      url: https://boiledyakult.top
      permalink: archives/:abbrlink.html
      abbrlink:
      alg: crc32 # 算法:crc16(default) and crc32
      rep: hex # 进制:dec(default) and hex
      permalink_defaults:
      pretty_urls:
      trailing_index: true # Set to false to remove trailing 'index.html' from permalinks
      trailing_html: true # Set to false to remove trailing '.html' from permalinks
      不同算法和进制会生成不同的格式:
      1
      2
      3
      4
      5
      6
      7
      8
      9
      crc16 & hex
      https://post.zz173.com/posts/66c8.html
      crc16 & dec
      https://post.zz173.com/posts/65535.html

      crc32 & hex
      https://post.zz173.com/posts/8ddf18fb.html
      crc32 & dec
      https://post.zz173.com/posts/1690090958.html
    • 然后hexo三件套,clean—-generate—-serve,在每篇文章中fonter添加一条命令:
      8da2c4c2```建议添加在post配置里面。这个值我记不清楚是自动生成的还是每个人都不一样,建议自己查查资料哈。
      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      16
      17
      18
      19
      20
      3. 添加蜘蛛协议"robots.txt"
      在博客根目录```source```,添加协议文件,自己新建一个就可以
      ```yml
      User-agent: *
      Allow: /
      Allow: /categories/
      Allow: /tags/
      Allow: /archives/
      Allow: /about/

      Disallow: /vendors/
      Disallow: /js/
      Disallow: /css/
      Disallow: /fonts/
      Disallow: /vendors/
      Disallow: /fancybox/

      # 记得替换成你的域名
      Sitemap: https://boiledyakult.top/sitemap.xml
      Sitemap: https://boiledyakult.top/baidusitemap.xml

主动推送

新链接主动推送给百度,需要注册百度账号在百度站长工具拿到权限token

  1. 安装插件:
    1
    2
     # 会生成baidu_urls.txt目录
    npm install hexo-baidu-url-submit --save
  2. 在根目录_config.yml添加以下内容:
    1
    2
    3
    4
    5
    6
     # 主动推送百度,被百度收录
    baidu_url_submit:
    count: 100 # 提交最新的10个链接
    host: https://boiledyakult.top # 百度站长平台中注册的域名
    token: 8c..............GA # 秘钥,百度站长平台 > 推送接口 > 接口调用地址中token字段
    path: baidu_urls.txt # 文本文档的地址, 新链接会保存在此文本文档里,不用改
  3. 域名和token都可以在站长工具平台找到,站点信息

百度收录

站点管理——-> 添加网站———>属性———->认证

  • CNAME验证:在DNS添加一条解析记录
    主机记录 记录内容 记录值
    www CNAME CNAME验证值
  • 文件验证:下载认证文件,放在根目录,然后hexo d上传到服务器上,这里需要注意的是需要在文件中添加layout: false防止被转换。
  • HTML验证:

  • 最后在config_yml``````deploy:上添加以下内容:
    1
    - type: baidu_url_submitter

Googles收录

和百度大差不差,安装sitemap,生成sitemap.xml,在谷歌站长平台验证抓取域名,见上图HTML验证

Biying收录

可以先设置号谷歌配置之后,直接选Google验证链接:
也可以跟谷歌一样再走一遍。

Baidu Done 、Biying Done、Google Done

差不多这里就已经配置好了,谷歌大概两三周就可以搜到自己的文章了,必应也是,百度就不好说了。

添加完成以后建议手动去各大搜索引擎提交一下站点地图