谷歌的爬虫索引我们的网站是最重要的一步,如果连页面都没有索引到,谈何排名。
谷歌是如何抓取网页的?
当我们更新网页之后,谷歌的爬虫会通过站内链接、读取站点地图或其他方式来发现网址,进而将其编入索引中。
如何检查网页是否被谷歌索引?
有两个方法:
1.在谷歌搜索框中使用“site:网址”命令,若结果中显示该页面,则网页已被谷歌索引。
加快索引?去GSC手动提交(但是索引速度依旧不可控),相对而言快一点
02
网站结构优化
网站结构优化-URL
使用简单的URL目录结构优点:
网站结构优化-导航功能
通常我们会根据首页规划整个网站的内容分类(一般来说首页是一个网站的根页面),应考虑如何从一个内容宽泛的网页转到内容更加具体的页面
面包屑的使用需注意:
网站结构优化-站点地图Sitemap
有两种类型的Sitemap:
1.供用户使用
用户找页面的时候遇到困难,使用网站地图可以一目了然的找到页面
2.供谷歌抓取
03
页面元标签、内容优化
元标签优化:
Title、Description、H标签
内容相符、包含核心关键词(禁止堆砌)、禁止使用千篇一律的描述(为每个页面都创建特有的标题描述及H标签)
为什么TD重要?
因为放在页面HTML文档的里,谷歌会首先爬虫到这部分内容。Title写得好的页面,就像一本书的目录一样,可以让爬虫更快更精准的知道这个页面的主要内容。如果一个页面的Title可以写成这种形式,那对爬虫来说是相当友好的:
页面内容优化:
1.促进网页收录
相当于引导谷歌进行爬虫。对于合理分布了锚文本内链的页面,相当于给页面建立了导航,对搜索引擎抓取会比较友好
2.提升排名、传递权重
3.提升用户体验
图片优化
好处:
1.在HTML中标记图片,帮助谷歌识别抓取
2.使用简短而有描述性的图片名和alt属性
避免做法:
1.使用image1.jpg、pic.png这类无描述性的图片命名
2.文件名过长
3.若使用图片作为链接(内链的作用),此时的Alt就相当于内链的锚文本
4.使用标准的图片格式:JPEG、GIF、PNG、BMP和WebP这种大部分浏览器支持的格式
5.图片不宜过大,会拖慢网页加载速度
04
页面抓取原理
robots.txt和noindex标签的使用
什么是robots.txt文件?
“robots.txt”文件主要用来告知搜索引擎它们是否有权抓取您网站的特定部分,在robots.txt文件中设置”Disallow”就可以告知谷歌不用爬虫该部分页面。
什么是noindex标签?
区别:禁止谷歌索引和禁止谷歌抓取的方式
禁止谷歌索引:谷歌可以爬虫到此页面,但不收录在搜索结果中
禁止谷歌索引方式:使用noindex标签,如
例Wordpress网站设置有这个选项的:
注:
robots不是规避敏感信息的方法,它只是为了帮助谷歌爬虫更友好,如果想禁止谷歌收录页面,更妥善的做法是用“noindex”标签(但用户仍可访问)或引用.htaccess文件(加密)
nofollow标签的使用
什么是nofollow标签?
nofollow是HTML页面中a标签的属性值。这个标签的意义是告诉搜索引擎"不要追踪此网页上的链接,这条链接也不会传递权重"
为什么使用nofollow?
页面直接互相链接会有一个权重的传递,谷歌也会顺着一个页面的链接爬虫访问到链接过去的页面,而当使用rel=“nofollow”标签的时候你相当于告诉谷歌不要去访问链接的页面,也不希望自己页面的权重传递过去。
作用:
打击垃圾留言和外链(一般博客的留言设置都会自动nofollow用户的留言)
获取方式:
社交平台(如Facebook、Twitter、YouTube等)
论坛(Quora、Reddit等)
新闻发布网站(PressRelease这类型)
留言板
维基百科(所有人都可以编辑的页面)
拓展:dofollow标签的使用
与nofollow标签意义相反,dofollow标签告诉谷歌需要去爬取标记的链接内容。
05
网站推广
注意:
原因:2003年开始谷歌就在打击付费推广的行为,它希望链接是“获取”而不是“购买”得来的。
自然的外链方式应该是多样的,如果一个站点只有dofollow链接,或者占比很高,那这个现象就非常可疑了,所以我们偶尔需要去检查回网站dofollow和nofollow的链接比例。
2.含sponsored字样的链接最好使用nofollow标签
3.域名多样性
4.锚文本多样性
在大多数情况下,人们在链接到网站时,不会使用完整匹配的锚文本。这就是为什么完整匹配的锚文本链接可能意味着外链作弊。
06
移动端搜索引擎优化
如何让网站适应移动端设备
自适应设计(谷歌自动适配移动端页面,不需更改HTML内容,用户只需访问统一网页地址),需使用”viewpoint”标签
动态提供内容(谷歌根据使用设备的不同,向用户提供不同的HTML页面内容),需使用”VaryHTTP”标签
单独的网站(为PC端和移动端页面配置不同的URL地址),不同设备的页面需要配置检测User-agent并进行正确的重定向。
需要借助rel="canonical"和rel="alternate"元素的标记去做页面区分
07
技术搜索引擎优化
技术SEO的3个核心指标(CoreWebVitals)
观测指标:页面最大元素的载入速度
谷歌在页面加载时会去抓取可视范围内人最大元素,在加载过程中抓取的最大元素会随时变动,直至页面完全加载完成。
LCP通常检测的项目:
LCP指标判定标准
如何优化?
通常造成InputDelay的原因:
链接点击或按钮载入内容延迟
文字对话框无法立刻输入文字
打开下拉式菜单的画面延迟
无法勾选对话框
...
FID指标判定标准
观测指标:累计版面配置转移(页面稳定性)
可预期的版面配置转移(ExpectedLayoutShifts)
这种需要用户点击而产生的收合功能是可预期的,因此谷歌不会判定这个行为是页面的不稳定性
不可预期的版面配置转移(Un-xpectedLayoutShifts)
不可预期的版面配置转移通常是因为页面的元素载入顺序不同导致。比如右图,”ClickMe“按钮是最后才载入的,导致用户阅读一半出现了内容位移的情况,这种情况就会影响CLS的指标分数
CLS指标判定标准
08
一些SEO插件推荐
1.SEOMinion
特点:操作简单,适合简易的On-pageSEO检查,如TD、H标题、Canonical标签检查;缺失Alt的图片检查。
2.ViewImageInfo
特点:方便检查具体一张页面图片的情况
3.METASEOinspector
特点:更全面的on-pageSEO元素检查,并且会给出一些优化建议
4.CheckMyLinks
特点:检查页面的链接情况,可以用来发现一些brokenlinks,便于移除这些链接。