Google质量评分指南简介
上星期google medic更新的帖子预告了,今天开始聊一下google的人工质量评估指南。由于这个指南很长,长达164页,所以分3个帖子聊:
google质量评分指南简介
什么样的内容才是高质量的?
什么是e-a-t?
即使分成3个帖子,也只是简要介绍和写点感想,指南中的大部分内容都忽略了。有读者建议我把指南翻译成中文,还是不翻译了,原因是:
指南太长了
大部分内容和seo关系不是很大
没有授权
指南是给google的人工评估员做培训用的,很多seo熟悉的内容没必要提了,比如怎样分辨页面主题内容、辅助内容、广告之类的。占最大篇幅的是让评估员明白,怎样判断搜索结果是否满足了用户查询的需求,和seo的关系并不大。
google质量评分指南有哪些内容?整个指南分3部分:
页面质量评分指南 – 这个是seo真正关心的,包括理解页面创建、存在的目的,评估页面内容质量,网站和创作者背景调查、声誉调查。
理解移动用户需求 – 只有理解用户需求,才能判断搜索结果是否满足了需求。这部分是为第三部分做准备。
满足需求评分 – 针对某个查询词,评估员怎样判断搜索结果在多大程度上满足了用户需求,应该打什么分
后两部分占了100多页,虽然对seo直接帮助不大,但为了全面了解google质量评分指南,还是在第一篇帖子介绍一下。
理解移动用户需求整个指南是比较偏向移动搜索的,貌似评估任务是要在移动设备上完成,但背景调查等可以到pc上做。
所以指南花了很大篇幅介绍移动用户需求问题,不过我觉得这部分主要是用来训练评估员们理解用户搜索意图、地理位置对搜索意图的影响、判断搜索结果是否满足了搜索意图、以及一些特殊情况的处理,和seo该怎样提高页面和网站质量分数关系不大。
下面只简单介绍一下这部分内容。
理解查询意图:透过查询词,理解用户查询意图。正确理解查询意图是判断搜索结果是否满足需求的前提。有的时候查询意图是很直观明显的,有时候要思考一下,比如搜索“天气”,用户绝大部分情况下是想知道最近几天的气温,是否会下雨,不是想了解专业知识。
本地特征:包括语言和地理位置。本地特征有时候会影响查询意图,因此影响搜索结果相关性。比如,上海和武汉的用户同样搜索“天气”,最相关的搜索结果应该是不一样的。英国和美国人搜索“football”,想了解的不是一种运动,在美国,“football”指的是橄榄球,不是足球。
带有明确地点的查询:查询词里带有明确地点,比如搜索“北京 酒店”,即使用户是在上海搜索,他还是想了解北京的酒店。
多义查询:同一个查询词可能有多种意义和意图。比如搜索“苹果”,多数人的意思是指苹果公司,常见意思是水果,少数意思是人名、城市名之类的。
查询词意义随时间改变:搜索“美国总统”,在不同年份指的是不同的人。通常要假设用户想了解的是最新意思。
用户意图:用户查询时的意图可以分为4种。
1)了解信息。有时候是明确简单的信息,比如“姚明 身高”,这种查询需要完整、正确的回答,很多时候是由第0位结果回答了。
2)做事情,比如购物、下载、娱乐。有时候是让设备自己做事情,比如通过语音设置闹钟。
3)网址查询,用户就是想找特定网站或网址。
4)亲自访问,很多日常生活服务相关的词有这种意图,比如搜索“附近 海底捞”。
有些查询有多种意图的可能性,比如搜索“北大”,可能是用户在附近,想到北大看看,也可能是找北大官网,也可能是想了解北大。
评估员要完成的评估任务种类很多,但最主要的是两种:页面质量评分和满足需求评分。
页面质量评分页面质量评分, page quality rating,评估员在理解页面存在目的的前提下,根据页面在多大程度上达到了这个目的,给予5个级别的质量打分:最低,低,中等,高,最高。
页面质量评分是和用户的查询词无关的,打分时不用考虑用户搜索什么词。页面质量评分就是页面本身的特征。评估系统给出一个页面,评估员使用滑动条打分,大致是这个样子:
也可以有high+之类的介于两个级别之间的打分。
给页面质量打分时主要考虑的因素有:
页面的目的
专业度、权威度、信任度
主体内容质量和数量
网站背景信息、主体内容创作者信息
网站和主体内容创作者声誉
这部分是指南对seo最有用的内容,帮助我们理解在搜索引擎眼里,什么样的内容是高质量的。下篇帖子再详细介绍。
满足需求评分满足需求评分,needs met rating,评估员以移动用户需求为标准,判断搜索结果对用户有多大帮助,在多大程度上满足了用户需求。
评分系统平台会给出查询词,和正常搜索结果页面差不多的搜索结果,每个结果下面或旁边有打分用的滑动工具条,大致是这个样子:
评估员可以给结果打几个级别的分:
完全满足需求(fullym, fully meets):用户需求被完全、完美满足,不用再看其它结果了。通常,查询词有明确答案的才会有完全满足需求的评分,比如搜索“亚马逊”,亚马逊官网就是fullym。
很满足需求(hm, highly meets):对大部分用户来说非常有帮助。有小部分用户可能还想看看其它结果。通常是质量高、有权威度、最新的内容。一个查询可以有很多“很满足需求”的结果。比如用户搜索“海底捞”,标出附近海底捞地点的地图结果是个hm,但不是fullym,因为可能有小部分用户想看的是海底捞官网,所以海底捞官网是另一个hm。
中等满足需求(mm, moderately meets):对很多用户有帮助,或者对一些用户很有帮助。有些或很多用户可能还想看看其它结果。能回答查询,但没那么全面、及时、权威,同时不是低质量、过时、不准确的内容通常属于mm。
有点满足需求(sm, slightly meets):对部分用户有帮助。很多或大部分用户还得看其它结果。可能是质量较低、过时、不大准确、太宽泛或太狭隘的内容。标题有误导性或太夸张的也属于sm。
不满足需求(failsm, fails to meet):完全不满足移动用户需求。几乎所有用户都得看其它结果。经常是与查询无关、事实错误、很低质量、很过时的内容,或者在手机上完全没办法用的功能。在页面质量评分中被评为“最低质量”的页面也应该被归为“不满足需求”。
打分工具条下面还有几个标签,可以给结果打上,包括:色情网站,外语,打不开,冒犯性内容。
不过,被打上这些标签的网站不一定就不满足用户需求,比如用户就是在搜索色情内容,色情网站是满足需求的。再比如,用户搜索“baidu”,百度首页应该被标为外语网站,但完全满足需求。所以,满足需求评分和这几个标签是互相独立的。
如果用户不需要点击搜索结果,比如第0位结果,想要的答案已经显示在搜索结果页面上了,根据显示在页面上的结果信息就可以打分了。如果大部分用户还得点击搜索结果页面,如普通的搜索结果,那么显示在搜索结果页面的信息(标题、url、说明文字)和获得排名的页面内容都是打分依据。
结合页面质量评分和满足需求评分,综合评估任务大致是这个样子:
页面质量评分和满足需求评分既是独立的,又有一定联系。通常满足需求的结果也应该是质量高的页面。
关于重复内容在某些评估任务中,比如needs met类,评估员需要鉴别和标注出重复内容。这里有个知识点是我以前没想到也没听说的:是否算重复内容是取决于查询词的。即使来自不同网站的两个页面主体内容相同,也不一定就要被标注为重复内容。标注为重复内容还要满足另一个条件:用户不希望在搜索这个查询词时看到两个结果都被返回。
什么时候用户会希望看到两个主体内容相同的页面都被返回在搜索结果中呢?这就取决于查询词。用户在搜索明确的特定内容时,比如某首歌的歌词,或者某篇特定文章,来自不同网站的多个内容相同的页面可能对用户是有帮助的,有助于用户相互比对、验证信息。这种页面,在这个查询词下,不应该被标注为重复内容,是应该被同时返回的。
查询词比较宽泛时,返回同样内容的多个页面就没什么用了。包括主体内容稍作微小改动的。
100多页的内容就被浓缩为这一篇帖子了。想更仔细了解的,请参考指南原文。(不清楚是否需要*)
作者: zac@seo每天一贴