中国军事迷网常见问题:所有关于谷歌RankBrain算法

  谷歌使用?通过其搜索结果中被称为“RankBrain”,以帮助解决一个机器学习人工智能系统。想知道如何在与谷歌的整体排名系统,该作品与配合? 下面是我们所知道的RankBrain。

  以下信息覆盖?来自三个原始来源,并已随着时间的推移更新,其中更新发生笔记。下面是这些来源:

  首先是彭博社的故事,爆料RankBrain的消息(参见我们写了吧)。其次,谷歌现在已经直接提供给Search Engine Land的其他信息。第三,我们自己的知识和最好的假设,在谷歌没有提供答案的地方。当其中这些资源用于我们将明确,?认为必要时,除了一般的背景信息。

  RankBrain是谷歌的名称,这是我们用来帮助处理其搜索结果的机器学习人工智能系统,如报道彭博社也由谷歌向我们证实。

  机器学习是其中计算机教自己如何做,而不是被人类教导或以下详细规划。

  真正的人工智能,或AI的简称,就是一台计算机可以像智能作为一个人,至少在获取两个被教导和建设什么它知道,并建立新的联系的知识的意义。

  真正的AI只存在于科幻小说,当然。在实践中,AI被用来指那些旨在学习和进行连接的计算机系统。

  怎么样从机器学习AI不同? 在RankBrain方面,在我们看来,他们是相当?代名词。你可能会听到他们两人交替使用,或者您可能会听到机器学习用来描述人工智能方法的类型使用。

  没有。RankBrain是谷歌的整体搜索“算法,”这是用来排序通过数十亿它知道页面,并找到那些被认为最相关的特定查询的计算机程序的一部分。

  这就是所谓的蜂鸟,正如我们在过去报告。?多年来,整个算法没有一个正式的名字。但在2013年年中,谷歌检修该算法并赋予它一个名称,蜂鸟。

  这是我们的理解。蜂鸟是整体的搜索算法,就像汽车有一个整体的发动机在它。发动机本身可以由各种部件组成,例如油过滤器,燃料泵,散热器等。以相同的方式,蜂鸟包含各种部件,具有RankBrain是的最新的一个。

  特别是,我们知道RankBrain是整个蜂鸟算法的一部分,因为彭博社的文章明确指出RankBrain不处理所有搜索,因为只有整体算法将。

  蜂鸟还包含一个名字熟悉那些在SEO领域的其他部分,如?

  PageRank是整体的蜂鸟算法的一部分覆盖给予基于从他们指向其他网页的链接的网页信贷以特定的方式。

  PageRank是特殊的,因为它是,谷歌曾经给其排名算法的组成部分之一的名字,早在当时的搜索引擎开始,于1998年。

  信号事情谷歌使用,以帮助确定如何排名的网页。?例如,它将读取网页上的话,那么字是一个信号。如果有的话是大胆的,这可能是公司指出另一个信号。作为PageRank的一部分的计算给出一个页面,其中的二手作为一个信号PageRank得分。如果一个页面被标注为适合移动设备访问,这是其注册的另一个信号。

  所有这些信号得到由蜂鸟算法内的各种零件加工图在应对各种搜索出来的页面显示谷歌。

  谷歌已经相当一致说具有进行评估,反过来,可能有多达10000种变化或子信号超过200个主要的排名信号。它更通常只是说的因素,“数百名”,因为它昨天彭博社的文章中做了。

  如果你想要一个更视觉引导排名的信号,看到我们的元素周期表SEO的成功因素:

  这是一个相当不错的指南,我们认为,该搜索像谷歌应用引擎帮助排名的网页一般的东西。

  那就对了。从从哪儿冒出来,这个新系统已经成为是谷歌说的是第三最重要的因素?对于排名的网页。来自彭博社的文章:

  当这个故事最初写,谷歌将不告诉我们。我们的假设是这样的:

  我个人的猜测是,链接仍然是最重要的信号,方式,谷歌计数了中票的形式,这些链接。这也是一个非常老的系统,因为我已经覆盖在我的?

  至于第二个最重要的信号,我猜想那将是“的话,”在那里的话将包括一切从网页上的字怎么谷歌的解释人进入的话到RankBrain分析的搜索框外。

  这被证明是非常正确的。在2016年3月,谷歌陶醉前两个因素是内容和链接。或链接和内容,因为它不会说这是第一次。如需更多信息,请参阅我们的文章:

  现在我们知道:这是谷歌的前3名的搜索排名因素

  从与谷歌电子邮件,我收集RankBrain主要用作一种方式来解释搜索,人们提交?发现可能没有网页?确切的词?进行搜索的结果。

  是的,谷歌已经发现超过确切条款很长一段时间有人进入页面。例如,前几年和几年,如果你输入的东西,如“鞋,”谷歌可能没有发现所说的网页“鞋”,因为这些都是技术上的两个不同的词。但“词干法”,允许谷歌获得更聪明,明白鞋子鞋的变化,就像“跑”是“运行的变化。“

  谷歌也得到了同义词的智慧,因此,如果您搜索“运动鞋”,它可能会明白,你也意味着“跑鞋。“它甚至获得了一些概念性的智慧,了解有关于页”苹果“的技术公司,与”苹果“果。

  知识图谱,在2012年推出,是一种方式,谷歌有关的单词之间的连接变得更聪明。更重要的是,它学会了如何搜索“事情不是字符串,”作为谷歌已经将其形容。

  字符串手段只为字母串,如符合奥巴马的”的拼写搜索页面。“事情意味着相反,谷歌明白有人搜索时为”奥巴马“,他们可能意味着美国总统奥巴马,实际的人与其他人,地点和事物的连接。

  知识图谱是世界上的事情的事实和它们之间的关系数据库。这就是为什么你可以不喜欢“的时候是奥巴马的妻子生”的搜索和获取有关米歇尔·奥巴马如下的回答,从来没有使用她的名字:

  方法?谷歌已经用来优化查询一般都回流到一些人的地方做工作,既可以采用具有创造所产生的列表或同义词列表或者使事物之间的数据库连接。当然,还有一些涉及自动化。但在很大程度上,?这取决于人类的工作。

  问题是,谷歌处理每天的三个十亿搜索。2007年,谷歌表示,这些查询的是20%到25%的人?从未被看见。在2013年,它带来了数下降到15%,再使用昨日彭博社的文章中和谷歌重申我们。但三十亿的15%,仍然是一个巨大的不被任何人搜索输入的查询数量 – 4.5亿,每天。

  在这些可能是复杂的,多字查询,也被称为“长尾”查询。RankBrain旨在帮助更好地解释这些查询,有效地翻译它们,在某种程度上幕后,找到搜索的最佳网页。

  随着谷歌告诉我们,它可以看到看似无关的复杂的搜索模式之间要了解他们是如何实际上是彼此相似。?这种学习,反过来,使得它能够更好地理解未来复杂的搜索,以及他们是否会与特定主题。?最重要的是,从什么谷歌告诉我们,它可以那么这些群体的搜索结果与它认为关联搜索将最喜欢的。

  谷歌没有提供搜索组的例子,或者提供RankBrain如何猜测什么是最好的网页细节。但后者是?可能是因为如果它可以更翻译暧昧搜索到的东西?具体的,它可以再带回更好的答案。

  虽然谷歌并未给出的搜索组,彭博社的文章确实有一个搜索的一个例子,其中RankBrain据推测帮助。这里是:

  什么是消费者在食物链的最高层次标题

  要像我这样的外行,“消费者”喜欢的人一个参考的声音谁买东西。然而,它也是东西科学术语,消耗的食物。也有在食物链的消费者水平。消费者在最高水平? 标题 – 这个名字 – 是“捕食者。“

  进入该查询到谷歌提供了很好的答案,即使查询本身听起来很奇怪:

  现在考虑的结果如何类似的像一搜“食物链的顶层,”如下图所示:

  试想一下,RankBrain是连接该原始漫长而复杂的查询?这短得多之一,这可能是更常见的做。据了解,他们是非常相似的。其结果是,谷歌就可以利用它知道为较常见的查询,以帮助获取解决方案提高它提供了一个罕见。

  我要强调,我不知道是RankBrain连接这两个搜索。我只知道,谷歌给了第一个例子。这是一个简单的RankBrain如何我来少见的搜索连接到一个普通的一种,改善事物的方法的说明图。

  早在2005年,微软开始使用自己的机器学习系统,被称为RankNet,为后来成为今天其Bing搜索引擎的一部分。事实上,RankNet的首席研究员和创建者,最近荣幸。但这些年来,微软几乎没有谈到RankNet。

  你可以打赌,可能会有改变。它也有趣的是,?当我把给出的伟大谷歌的RankBrain如何就是一个例子以上为必应搜索,兵给了我很好的效果,其中包括上市,谷歌也恢复:

  一个查询并不意味着Bing的RankNet一样好,因为谷歌的RankBrain反之亦然。不幸的是,它真的很难拿出一个名单做这个类型的比较。

  谷歌没有给我们一个新的例子:

  我试图在谷歌搜索来测试这个。COM与谷歌澳大利亚。我没有看到太大的区别,我自己。即使没有RankBrain,结果常常是这种方式,因为从有利于澳大利亚著名网站使用谷歌澳大利亚这些搜索页面的“老式”的意思只是不同。

  尽管我上面是不到迫不得已的见证RankBrain的伟大两个例子,我真的相信,它可能正在产生巨大的影响,因为谷歌是声称。该公司是什么进入它的排名算法相当保守。它做小测试,所有的时间。但只启动大的变化时,它具有的信心很大程度。

  整合RankBrain,以它的所谓第三个最重要的信号的程度,是一个巨大的变化。这不是一个,我认为谷歌会做,除非它真的相信这是帮助。

  谷歌告诉我们,有RankBrain的逐步推出,2015年年初,它一直过着充实的生活和全球几个月现在。

  在2015年10月,谷歌告诉彭博社说的查询的15%的“很大一部分”,它通常不会看到前就RankBrain处理。总之,15%或更少。

  在2016年6月,消息传出,目前正在使用的每个查询RankBrain,谷歌手柄。看到我们的故事:

  谷歌使用RankBrain为每个搜索,他们的“手”的影响排名

  所有的学习是RankBrain确实不在线,谷歌告诉我们。它给的历史搜索,并学会批次进行从这些预测。

  这些预测进行测试,如果被证明好,那么RankBrain的最新版本正式上线。然后学习,离线和测试周期重复。

  通常情况下,查询是如何提炼 – 无论是通过词干,同义词或现在RankBrain – 还没有被认为是排名因素或信号。

  信号一般因素?到绑定的内容,如在页面上的话,在一个页面指向,一个页面是否是一个安全的服务器等上的链接。它们也可以被绑定到用户,如?其中,搜索者位于或他们的搜索和浏览历史记录。

  所以当谷歌约RankBrain会谈作为第三最?重要的信号,它的真正含义作为一个排名信号? 是。谷歌再次确认我们存在这样的情况RankBrain直接某种程度上助长页面是否行列组件。

  究竟如何? 是否有某种类型的“RankBrain分数”可能评估质量? 也许吧,但它似乎更可能多,RankBrain基于它们所包含的内容以某种方式帮助谷歌更好的分类页面。RankBrain也许能更好地概括一个网页是关于比谷歌现有的系统做了什么。

  或不。谷歌没有说以外的任何其他有参与排名组件。

  谷歌告诉我们谁想要了解“载体”人字 – 词和短语可以用数学的连接方式 – 应该看看这个博客文章,其中关于系统(这是不是在后命名RankBrain)如何学到的概念会谈国家的首都城市刚刚通过扫描的新闻文章:

  有一个较长的研究论文,这是基于这里。你可以用自己的机器学习项目中使用谷歌的word2vec工具甚至可以玩。此外,谷歌已经与它的人工智能和机器学习论文的整个区域与微软一样,。

  此外,一定要看看我们的文章,如何机器学习作品,所解释的谷歌。

  注意:这个故事已经从当它最初发表于2015年10月修订,以反映最新信息。

发表评论

滚动至顶部