搜索引擎100次不返回相关结果的原因

  虽然搜索引擎的代表和光帽匠(最白的白色帽匠的),说是有很大的,链接的价值内容和链接,就足以获得高排名,有很多网站使用的是没有得到上市的话此事这些特质(即发送严重交通的那些)。如果它是那么容易,每一个值得高网页排名了吧,就没有需要我们 – 上市公司增发。

  现实情况是,搜索引擎是远远不够完善。他们面临的挑战显著试图破译我们的意图,找到页面最符合我们的查询。

  下面是一些为什么搜索引擎不会返回100%的相关结果所有的时间的原因:

  1。相关性是主观的。这是最大的问题。你可以在加拿大做“咖啡”搜索,并找到蒂姆·霍顿的网站,作为最相关。是有道理的,因为这是加拿大最流行的咖啡连锁店,但对于西雅图人,星巴克可能是最相关的结果。您可以为“49人”做一个搜索和寻找的足球队,但历史学家可能会寻找加州的研究材料。你甚至可以做一个搜索今天“骨头”试图找到在哪里买你的狗请客,但明天你做同样的搜索寻找电视连续剧“骨头”的情节,你错过了前一天晚上。

  如何才能搜索引擎消除歧义,例如搜索? 读心将是一个很好的办法:-)

  到目前为止,最好的方法搜索引擎已经拿出是使用人体质量评价者和个性化搜索。更好的搜索引擎配置文件中的搜索,更高的生产相关的结果的可能性。这种方法显然引起了很多隐私问题。

  2。自然语言搜索。 一个MySQL数据库引擎能够精确地返回给查询所有相关的记录“选择第一个,最后从员工那里最后=‘史密斯’;”。有一个正式的语法和没有歧义。搜索引擎,而另一方面,受到“谁拥有史密斯在芝加哥姓”或“史密斯姓氏芝加哥”。 查询是自然语言 – 我们的语言。有许多不同的方式说同样的事情 – 有背景,有人类的特质,等等。搜索引擎的搜索组件必须消除歧义查询和索引查找它之前把它翻译成一个更正式的方式。

  3。可怜查询。许多搜索者不知道如何表达自己想在现实世界中的东西,甚至是更坏试图问一个搜索引擎时。他们所谓的真空吸尘器“吸盘”,并无法找到保洁服务在线。更糟糕的是,他们拼错的单词,并针对搜索引擎的问题更“有趣”。

  4。同义。这是另一个挑战。有句话说具有相同的含义,如“汽车”和“汽车”。当你搜索你想获得包含你的准确用词的网页,并包含意味着同样的事情。换句话说页面,只要他们是您的搜索有关。比方说,你做“猴”的搜索。你希望你的结果,包括含有猴的网页,但也许还写着“黑猩猩”或“猿”。如果你是一个有点更加严格,你不会希望包括黑猩猩说页面,因为,尽管黑猩猩是灵长类动物,它是不是猴子。这些细节不通过大多数搜索的头脑,但搜索引擎有一个困难时期,因为它。

  五。一词多义。有迹象表明,改变根据上下文其含义在其中使用它们的话。例如,如果你做“木”的搜索您可能希望的是在谈论一棵树件页面,或者你可能是说,有许多树木的地理区域。如果没有正确的背景下,这是很难人告诉。想象一下,这是一个搜索引擎有多难!

  6。不完美的性能。要在我以前的帖子关于相关反馈跟进,让我介绍一些相关的概念,以便更好地解释这个问题:精度和召回。

  精度和召回指标使用信息检索的研究,以评估搜索引擎的性能。没关系排名算法的先进程度,在这一天真正重要的是用户是否喜欢该结果或不结束。精度是搜索引擎的效率如何在仅返回搜索的相关结果的度量。更不相关的结果,较低的精度。回想一下,在另一方面,措施有多好,搜索引擎在返回所有相关结果。(当然,这是假定研究人员知道有多少相关的结果有。)从搜索失踪的更相关的结果,将降低召回。

  理想情况下,搜索引擎应确定所有相关文件,而无需返回任何不相关的(100%的精度和100%的召回)。在实践中,这已经被证明是不可能的,因为精度和召回率成反比。

  检索绩效实证研究表明,精密的倾向下降,因为召回的增加。精确度和召回之间的权衡

  幸运的是,大多数搜索都比较关心的精度,尤其是在十大结果。我们几个搜索过去的第一对夫妇的结果页(SERP中)。通过质量评估者相关反馈是提高精度的非常好的方法。质量评估者可以选择最相关的搜索的文件,且该信息可用于细化原来的搜索和产量为大部分用户更好的结果。

  7。垃圾邮件。搜索引擎通过的“信号质量”或度量手段,可以从网页通过自动方式可以推断识别相关网页。搜索引擎所面临的挑战是,一旦黑帽SEO的识别这些信号,就可以开始他们的假。我认为,随着时间的推移它会越来越难伪造质量的信号,但它永远不会是不可能的。对于人类来说它很容易被发现的垃圾邮件,但对电脑困难得多。

  为什么是重要的是知道这一切?

  这个主题是很重要的,因为它证明了一个有趣的问题。虽然搜索引擎并不想承认这一点,他们需要我们的服务商(SEO)。正如我上面提到的,相关性是主观。你想承担质量评估者被动的做法,并希望晋级您的网站,他们认为相关的搜索? 或者,相反,你要采取积极的作用,并确定最佳的关键字,它们包括在内容和导入链接,并仔细研究那些排名高(网络部门)网站,看看你如何能做到同样的? 就个人而言,我更喜欢积极的作用。

发表评论

滚动至顶部