浏览量: | 发布时间:

大程度上满足了用户需求。这个评分是和查询词有关的,评估的更多是Google算法是否合理。

  评分系统平台会给出查询词,和正常搜索结果页面差不多的搜索结果,每个结果下面或旁边有打分用的滑动工具条,大致是这个样子:

  评估员可以给结果打几个级别的分:

  完全满足需求(FullyM, Fully Meets):用户需求被完全、完美满足,不用再看其它结果了。通常,查询词有明确答案的才会有完全满足需求的评分,比如搜索“亚马逊”,亚马逊官网就是FullyM。 很满足需求(HM, HIghly Meets):对大部分用户来说非常有帮助。有小部分用户可能还想看看其它结果。通常是质量高、有权威度、最新的内容。一个查询可以有很多“很满足需求”的结果。比如用户搜索“海底捞”,标出附近海底捞地点的地图结果是个HM,但不是FullyM,因为可能有小部分用户想看的是海底捞官网,所以海底捞官网是另一个HM。 中等满足需求(MM, Moderately Meets):对很多用户有帮助,或者对一些用户很有帮助。有些或很多用户可能还想看看其它结果。能回答查询,但没那么全面、及时、权威,同时不是低质量、过时、不准确的内容通常属于MM。 有点满足需求(SM, Slightly Meets):对部分用户有帮助。很多或大部分用户还得看其它结果。可能是质量较低、过时、不大准确、太宽泛或太狭隘的内容。标题有误导性或太夸张的也属于SM。 不满足需求(FailsM, Fails to Meet):完全不满足移动用户需求。几乎所有用户都得看其它结果。经常是与查询无关、事实错误、很低质量、很过时的内容,或者在手机上完全没办法用的功能。在页面质量评分中被评为“最低质量”的页面也应该被归为“不满足需求”。

  打分工具条下面还有几个标签,可以给结果打上,包括:色情网站,外语,打不开,冒犯性内容。

  不过,被打上这些标签的网站不一定就不满足用户需求,比如用户就是在搜索色情内容,色情网站是满足需求的。再比如,用户搜索“baidu”,百度首页应该被标为外语网站,但完全满足需求。所以,满足需求评分和这几个标签是互相独立的。

  如果用户不需要点击搜索结果,比如第0位结果,想要的答案已经显示在搜索结果页面上了,根据显示在页面上的结果信息就可以打分了。如果大部分用户还得点击搜索结果页面,如普通的搜索结果,那么显示在搜索结果页面的信息(标题、URL、说明文字)和获得排名的页面内容都是打分依据。

  结合页面质量评分和满足需求评分,综合评估任务大致是这个样子:

  页面质量评分和满足需求评分既是独立的,又有一定联系。通常满足需求的结果也应该是质量高的页面。

  人工评分会影响页面排名吗?

  虽然Google使用人工给页面质量打分,但所打的分并不直接影响页面排名。人工评估员所打的这些分只是用来评估Google算法是否准确。如果人工给某页面打的分很低,但算法给的分高,Google并不会直接修改算法对这个页面的打分,而是收集大量数据后修改算法本身,使算法得出的结果更接近人工打分。

  所以如果有人说自己是Google人工评估员,这个是存在的,我就认识几个。他们通常是通过第三方公司雇用的兼职人员,其中不少是站长,也有就是做SEO的。但如果有人说自己能在人工评估过程中给特定网站提权或降权,那就是在骗人了。

  关于重复内容

  在某些评估任务中,比如Needs Met类,评估员需要鉴别和标注出重复内容。这里有个知识点是我以前没想到也没听说的:是否算重复内容是取决于查询词的。即使来自不同网站的两个页面主体内容相同,也不一定就要被标注为重复内容。标注为重复内容还要满足另一个条件:用户不希望在搜索这个查询词时看到两个结果都被返回。

  什么时候用户会希望看到两个主体内容相同的页面都被返回在搜索结果中呢?这就取决于查询词。用户在搜索明确的特定内容时,比如某首歌的歌词,或者某篇特定文章,来自不同网站的多个内容相同的页面可能对用户是有帮助的,有助于用户相互比对、验证信息。这种页面,在这个查询词下,不应该被标注为重复内容,是应该被同时返回的。

  查询词比较宽泛时,返回同样内容的多个页面就没什么用了。包括主体内容稍作微小改动的。