提交sitemap

站点地图是一种文件,您可以通过该文件列出您网站上的网页,从而将您网站内容的组织架构告知 Google 和其他搜索引擎。Googlebot 等搜索引擎网页抓取工具会读取此文件,以便更加智能地抓取您的网站。
此外,站点地图能够提供与其中所列网页相关的宝贵元数据:元数据是网页的相关信息,例如此网页的上次更新时间、更改频率及其重要性(与相应网站中的其他网址相较而言)。

对于新建立的网站,Google和百度可能找不到,Googlebot或是百度的机器人必须先抓取到网站信息,才能把它收入到搜索索引中。创建sitemap并提交到Google或者百度,这是极其重要的一步。
提交sitemap之前首先要对网站进行验证,也就是所有者的证明。一般做法是下载官方验证文件,放在网站根目录下,就可以验证网站。对于hexo用户,在hexo编译过程中,会对下载的文件进行渲染,就会在页面内生成别的标签,不利于网站验证。所以需要在网站配置文件_config.yml中修改验证文件的渲染属性,比如我设置忽略渲染

1
skip_render: [google2b659428d9daf7b6.html, baidu_verify_65gIf28eKK.html]

另外2016年1月以后新建的GitHub Pages默认强制https,而百度站长工具不支持验证https的网站。错误信息为301:

1
2
不到一分钟前xxx.github.io使用文件验证验证失败,原因:未知原因:301。
问题分析&解决办法: 未知原因:301。

标题和元标签

标题是很重要的一部分,告诉用户和搜索引擎网页的主题,<title>标签通常包含在<head>标签内。当然标题会作为搜索结果的一部分出现,避免标题和网页无关,避免类似Untitled或者New Page 1这种默认标题。避免使用冗长没什么用的标题,更不要在标题里堆砌关键词。
<head>标签内还包含有<meta>标签,也就是元标签。网页的元标签可以由一两个词句或者段落组成。元标签不会出现在网页正文中,但是Google有可能会根据元标签来生成网页摘要。元标签应该精准的描述网页内容,而且最好为每一个网页创建不同的元标签(方便site: operator查询)。

优化URL

简单易读懂的URL能更有力的表达网页内容信息,有助于搜索引擎的抓取。应该避免冗长晦涩词语的出现,因为用户有可能会判断为不需要的信息,直接去掉一部分,导致URL失效。
避免多层子目录的嵌套,避免自动生成的类似page1这样和内容无关的页面名,避免大写。
另外还需要避免中文,有一些URL中的中文可能不被识别,导致失效。

有利于检索的网站结构

导航+层叠式的布局比较有利于用户和搜索引擎的检索。虽然Google返回的是一个特定页面,但是Google也会只能的去理解这一页究竟处在网站的什么位置。导航应该尽量精简有效,避免太过细分的网站结构,比如用户需要点击20次以上才能找到他们想要的内容。

其他

尽量使用文字链接,一方面是便于搜索引擎抓取,另一方面某些flash或者JavaScript可能不被所有的设备支持。
给图片加上特定的文字描述,提高被检索几率。如果图片作为连接使用,一定要加上alt文本。
设置rel=“nofollow”打击垃圾留言。


最后,出色的内容才是网站脱颖而出的关键!


Reference

[1] 了解站点地图
[2] 《谷歌搜索引擎优化初学者指南》