Google指南:什么样的页面才是高质量的?
本帖子是google人工质量评估员指南介绍的第二篇:
google质量评分指南简介
什么样的页面才是高质量的?
什么是e-a-t?(下一贴)
在讲解页面质量评估和满足需求评估之前,google指南详细介绍了一个以前seo行业比较少提到的概念:有益目的(beneficial purpose)。后面对页面和搜索结果质量的评估都是基于这个概念的。
页面存在的目的一般来说,页面被创建或存在都是有目的的。从用户角度,这个目的可能是好的,也就是有益目的(beneficial purpose),也可能是有害处的,比如钓鱼页面。
有害页面,比如意图伤害、欺骗用户,只是为了赚钱而没有试图帮助用户的页面,直接被评为最低质量页面,不再进行进一步评估。这类页面比较明确,不是指南的重点。
如果页面具备有益目的,也就是对用户有帮助,页面质量评分的标准就是看页面在多大程度上达到了(帮助用户的)目的。所以评估员们要打分,就需要先理解页面存在的目的。
页面目的没有贵贱之分。只要页面是为了帮助用户而存在,一种目的或种类的页面并不比另一种目的的页面天生更高质量。也是就是说,页面目的或种类与质量并没有直接关系,没有哪种页面天生就高级,比如,百科全书页面并不一定比笑话页面质量更高。做低俗点内容的seo可以放心了,低俗内容也是可以高质量的,只要很好地满足了部分低俗的搜索需求。
google举了个例子,是这个网站:http://www.omnomnomnom.com/ ,闲得无聊的读者可以访问一下:
网站让用户提交mspaint编辑过的照片,使照片里的东西看起来像是张大嘴,正在吃掉别的什么东西。刷新一下页面就换一张照片。就这么一个功能,怪无聊的。但这样的页面同样有其目的:幽默,让用户乐一下。
另外,页面是否有广告和页面质量也没有必然关系,有广告不一定意味着页面质量低。包括google adsense等文字或品牌广告,我相信也包括联署计划这类赚钱方式。所以网站要赚钱,也不是个问题,不必然就导致质量低。
每种目的的页面都有高质量的,也都有低质量的。评估员需要理解页面存在的目的,才能更好地给出相应的评分。
常见页面存在目的包括:
分享某个话题信息
分享个人或社交信息
分享图片、视频或其它媒体信息
表达意见或观点
娱乐
卖产品或服务
用户可以提交问题,别人来回答
用户可以分享文件或下载软件
ymyl页面有一类比较特殊的页面,ymyl页面,your money or your life页面的缩写,我称之为“要么要钱,要么要命页面”,指的是可能影响用户未来的快乐、健康、财政稳定、安全等的页面。如:
购物网站,以及可以线上转账、付账单等交易的页面
提供有关投资、税务、退休计划、买房、大学学费、买保险等方面建议或信息的页面
提供健康、药物、疾病、精神健康、营养等方面建议或信息的页面
提供重要公众信息的官方或新闻页面,如涉及到当地/国家*政策、流程、法律、灾难应急服务等信息的页面,涉及重要国际事件、商业、政治、科技等的新闻页面。这部分需要评估员运用自己的知识和判断力,不是所有新闻页面都属于ymyl页面。
ymyl页面的质量评分标准是非常高的,不然可能影响用户的健康、安全、财务等。
网站和内容创作者背景和声誉页面的质量不仅仅取决于页面本身,也要参考网站及页面内容创作者的背景和网上声誉情况。评估员不仅需要看页面内容,还得看整个网站,研究网站所有人,甚至到第三方网站调查网站和创作者情况。
这两点需要非常清楚:
谁(公司、机构、个人)是网站拥有者?谁对这个网站负责?
谁(公司、机构、个人)是当前页面内容创作者?不一定是网站拥有者,比如用户产生内容的网站。
指南比较详细地讲解了怎样在网站本身和网上做调查。
联系方式问题
联系方式或客服信息需要完备。尤其是和钱打交道的网站,这点非常重要,如商城、银行、信用卡服务等。所以,seo们先检查一下自己网站的“联系我们”页面有没有?是不是空的?我在给客户做seo服务时,都会把“联系我们”、“关于我们”、“隐私权政策”、“服务条款”这四个页面作为必须做好的基本页面,有时候客户不理解,这和seo有什么关系?其实,是否显得正规是搜索引擎挺看重的事情。
联系方式或客服信息需要具体到什么程度视网站类型而定。比如一个笑话网站就不像电商网站那样要求很细的联系方式。
购物网站还需要一些特殊的客服信息:付款、换货、退货政策。
一些网站有合理理由不显示联系信息,如个人网站不显示住址、电话,用户产生内容的页面可以选择匿名。这不属于可疑范围。
网站和创作者声誉调查
网站和创作者声誉应该基于真实用户的体验和行业专家的意见,而不仅仅是看网站自己怎么说。
网站背后经常是公司或机构,所以声誉调查要包括网站背后的实体公司或机构。
调查要以外部、独立可信信息源为主。如果网站本身和可信的外部信息源说的不一样,以外部信息源说法为准。对网站自己声称的内容要带着怀疑的眼光来看。
可以寻找并参考真实用户或专家写的评论、推荐、新闻。购物网站用户评分也在参考之列,大量正面评论代表正面声誉。这两点存疑,尤其是中文网站,四处刷评论现在太常见了。指南中也强调了这点,要求评估员正面和负面信息都要看,而且要真的读一下这些评论。
在新闻、百科、博客帖子、文章、论坛等地方寻找真人写的信息,而不是统计数字。还有其它信息源,如获奖信息、专业协会的推荐等。
google要求评论员必须做调查,不要假设,自己常用的网站也不一定就声誉好。
指南花了不小篇幅讲解怎样在google寻找这些信息源,简单说,无非是搜索“网站/公司名 -site:domain“,或者”公司/网站名 评论“之类的,中文的可以加上”公司/网站名 怎么样“、”好不好“、”骗子“之类的。也可以在特定网站搜索一下网站或公司名称,如*、yelp,中文的可以考虑贴吧、知乎等地方。
最后,调查不到什么信息,不说明页面质量就一定低。有的小公司,小机构确实在网上没什么动静,但不意味着他们质量不高。
看来,网上名誉管理并不只是事后补救的时候需要seo,seo本身就需要网上名誉管理。第三方网站的评论、打分、新闻等对网站和页面本身的质量分数就是有影响的。我猜想,这部分是人工智能发挥作用的地方。网上貌似正常的正面评价大量是刷出来的,经典算法靠文字和语义很难区分真实评论和刷出来的评论,但人工去研究一下,刷的评论显而易见。经过人工打标签的数据交给ai系统学习,ai可能会找出更精确判断评论真实性的方法。
页面质量分数如前面说的,给页面质量打分首先要理解页面存在的原因。没有所谓“有益目的”的页面,如意图伤害、欺骗、误导用户的页面,只是为了赚钱而没有试图帮助用户的页面,传播仇恨、暴力的页面,应该被评为最低质量页面,不用再进一步评估了。
其它有“有益目的”的页面,根据页面在多大程度上达到了这个目的,给予5个级别的质量打分:最低,低,中等,高,最高。
给页面质量打分时主要考虑的因素有:
页面的目的:高质量和最高质量页面要求很好和非常好地达到页面目的。
专业度、权威度、信任度:所谓e-a-t,expertise, authoritativeness, trustworthiness的缩写。显然,这三个度越高,质量越高。e-a-t这个提法最近在英文seo行业是很流行的,有的seo说自己的网站就是因为按照e-a-t标准检查、优化过,才在medic更新中获得流量增长。这个话题比较重要,下篇帖子再单独写。
主体内容质量和数量:内容包括文字、图片、视频、功能。除了质量,还要求合适的数量。
网站背景信息、主体内容创作者信息:前面所提到的网站和作者背景调查,包括网站本身描述的和其它信息来源的。
网站和主体内容创作者声誉:主要依据独立信息来源判断。
下面只以高质量页面为例,看看什么样的页面被google认为是高质量的,其它如最高、低质量等依此类推。
什么样的页面是高质量页面?高质量页面应该有“有益目的”,并且很好地达到了这个目的。另外,还要有这些特征:
e-a-t高
下次在e-a-t帖子再讨论。
足够量的高质量主体内容
实际上除了主体内容,这个要求也包括清楚、有效的title。
创作高质量内容需要相当大量的时间、努力、专业、才能、技巧,这在内容中会体现出来。除了信息,页面功能也要测试,确认能用。
不同行业、类型的页面可能会有不同要求,如:
新闻、信息类页面首先要事实准确,文字清晰易懂
游戏页面首先要能玩
视频页面要能看
购物页面要能加入购物车,完成购买
笑话网站要有娱乐性,事实准确就没那么高要求了
多少量才是足够量?这取决于页面的目的。一般来说,宽泛的主题需要的内容量比狭窄的主题多。用户搜索“马航失联“,几千字也介绍不清楚。用户查询“姚明多高”,就没必要写几千字了。
网站负责人信息完善
了解谁对网站负责是评估网站、页面质量的重要部分。高质量页面至少要有清楚的背景信息,使用户建立信任。
不同类型网站需要的信息量可能不同。如ymyl网站要建立极高的信任,需要的背景信息就更多。
如果是购物或涉及交易的网站,还要有足够的客服信息。
页面主体内容负责人、创作者有正面声誉
声誉是被评为高质量页面的重要条件之一。
一个页面在没有声誉信息的情况下有可能被评为高质量。但一个网站如果有令人信服的负面名誉,就不能被评为高质量了。当然,负面评论要看具体内容是否合理,不能只看评分。
高质量页面的例子上面的说明可能还不够直观明确到底什么样的,或者达到什么程度的页面可以被评为高质量,所以指南用几页的篇幅举了不少例子,评估员,还有我们seo,可以有个直观感受。下面列几个例子,简单标出来我看到的页面所达到的程度,基本上涵盖了常见页面类型,读者可以参考一下:
报纸首页:典型媒体首页,新闻内容丰富。网站7次获普利策奖。
报纸文章页:主体内容丰富,篇幅挺长。报纸10次获普利策奖。页面有广告,但标注清晰。
美国海军观测局主时钟显示页面:非常简单的页面,以文字显示7个时区的当前时间,但完美达成页面目的。海军观测局本身(指的是这个机构,不是网站)高度权威及受信任。
某幽默网站文章页面:就是一篇搞笑文章。网站以搞笑闻名。
某饭馆的“关于我们”页面:篇幅不长,大致200多单词。清楚介绍了饭馆历史,开张时间,环境等。地址、菜单、联系方式其它页面有。
博客帖子:应该在2000词左右,帖子所在域名是获100多次普利策奖的报纸。帖子作者是行业专家,为多个媒体长期供稿。
购物网站分类页面:就是正常的产品列表,列出了60个产品。网站有一定知名度,客服信息完备。
购物网站产品页面:产品说明丰富,图片清晰,用户评论、付款、退换货信息完备。
视频直播页面:一个挺受欢迎的电视节目视频直播页面。
视频页面:一个youtube幽默视频页面,650万播放量,数千评论。(注意:不一定youtube页面就是高质量页面)
游戏页面:没什么文章内容,但游戏能玩几个小时。网站在儿童教育领域有知名度。
q&a页面:关于癌症病人存活时间的问答页面。很多人分享了实际经验,有的写得挺感人。基本没有治疗方面的建议。这个页面有个微妙的地方说明一下。页面的目的是回答“癌症病人存活时间”这个问题,所以普通人的实际经验是很好达成目的的,并不需要专业知识。但如果是癌症治疗的问题,普通人的讨论就不能被认为是高质量的了,创作者背景就会成为关键因素。
百科页面:典型的百科页面。篇幅很长很长。
论坛帖子:典型的论坛帖子页面,用户、专家互动热烈,并且有用。基本没有“顶起来”、“同意”这种发言。
可以感觉到,要达到高质量页面评分并不是一件简单的事,除了页面本身内容外,经常还要求网站有权威度、知名度,在新闻领域,是获得普利策奖级别的,其它领域可以类比一下。购物、博客、论坛之类的网站,要求没那么高,但也不会降低太多。
下星期再继续聊e-a-t和内容质量的话题。
作者: zac@seo每天一贴
上一篇: MacBookPro下docker的安装与使用教程
下一篇: asp.net 网站监控方案