本周早些时候,有消息传出有关谷歌的?RankBrain,?机器学习系统?即,与其他算法因素一起,帮助确定最佳的结果会是怎样的特定查询集。
具体而言,RankBrain似乎与对查询处理和改进中,使用图案识别?把复杂的和/或模棱两可的搜索查询,并将它们连接到特定的主题。
这使得谷歌?服务更好的搜索结果给用户,尤其是在搜索引擎从来没有见过的亿万每天的搜索查询的情况下,。
不要掉以轻心,谷歌曾表示,?这RankBrain是其中最重要的?的?该?几百个?排名的信号的算法考虑。
RankBrain是信号“数百名”即进入以决定什么样的结果出现在谷歌搜索页面上,并在那里他们的排名算法中的一个,科拉多说。在已经部署了数个月,RankBrain已成为促进搜索查询的结果,第三最重要的信号,他说:。
(注意:?RankBrain?更可能“查询处理器”不是一个真正的“排名因素。“它?目前尚不清楚究竟是如何RankBrain?职能?作为排名信号,因为这些通常依赖于内容以某种方式。)
这不是在最近的记忆搜索的唯一重大的改变,但是。在过去的几年里,谷歌已经向搜索的工作原理相当一些重要的变化,从算法更新,搜索结果页面布局。谷歌已经发展壮大,变成一个非常不同的动物比它预先企鹅和预熊猫。
这些变化不会止步于搜索,无论是。该公司已经改变了它的结构。随着新的独立的“字母”伞,谷歌不再是一个有机体,甚至是主要的一个。
从谷歌到SEO和网站管理员即使通讯已经在很大程度上消失了渡渡鸟的方式。马特·卡茨不再是“谷歌的走向,”可靠的信息已成为难以获得。在这么短的时间这么多的变化。?看来,谷歌正在推进。
然而,RankBrain与以往的变化太大区别。RankBrain是细化谷歌的知识的查询结果的努力图形为基础的?实体搜索。虽然实体搜索是不是新的,增加了一个完全转出的机器学习算法,这些结果是只有大约3个月大。
那么,什么是实体搜索? 如何与RankBrain这项工作? 谷歌是去哪儿?
为了了解情况,我们需要回去几年。
此次推出的蜂鸟算法进行了大刀阔斧的变革。它是整个道路大修谷歌处理的有机查询。一夜之间,搜索从寻找“弦”去(我。?。,在搜索查询字母)发现的“东西”的字符串(我。?。,实体)。
蜂鸟是从哪儿来? 新蜂鸟算法诞生了谷歌的出?努力把?语义搜索到它的搜索引擎。
这被认为是谷歌进军不仅机器学习,而是理解和自然语言处理(NLP或)。没有更需要那些讨厌的关键字 – 谷歌只会明白你的,你输入的内容是什么意思?在搜索框中。
语义搜索力图通过了解搜索者的意图和术语的语境意义,以提高搜索准确度,因为它们出现在搜索的数据空间,无论是在网络还是一个封闭的系统内,以产生更相关的结果。语义搜索系统考虑不同点包括搜索的情况下,位置,意图,字,同义词,广义和专业的查询,概念匹配和自然语言查询变化提供相关的搜索结果。像谷歌和Bing主要网络搜索引擎包括语义搜索的一些元素。
然而,我们是在两年内,任何人都谁使用谷歌知道语义搜索的梦想一直未能实现。这并不是说谷歌没有满足的标准,但谷歌相差甚远完整定义的。
例如,它使用的数据库定义和关联实体。然而,语义引擎能够理解上下文如何影响的话,然后能够评估和解释意义。
谷歌没有这样的认识。事实上,根据一些,谷歌简直是?导航搜索?- 和导航搜索不被定义被认为是自然界中的语义。
因此,虽然谷歌可以理解通过数据定义,距离和机器学习已知实体和关系,也没有理解自然(人)语言。它也不能轻易地解释属性关联而不当谷歌的存储库的关系是弱相关补充说明或不存在。此澄清常常是附加的用户输入的结果。
当然,谷歌可以学到许多这些定义和关系随着时间的推移,如果足够多的人搜索一组术语。这是机器学习(RankBrain)进入混合。取而代之的是用户细化查询台时,机器会根据用户的最佳猜测的感知意图。
然而,即使有RankBrain,谷歌是不是能够解释这意味着作为一个人会,这是语义定义的自然语言部分。
因此,通过定义,谷歌是不是一个语义搜索?发动机。那这是什么?
[W] e’ve一直在研究一种智能模型?-?在怪胎说话,一“图” – ?一个了解真实世界的实体和他们一对一的关系另:事情,而不是字符串。谷歌官方博客
如前所述,谷歌现在是非常好的?堆焊?具体数据。需要天气报告? 交通状况? 餐厅评论? 谷歌可以提供这样的?信息?而不需要你甚至访问一个网站,就在显示它?在搜索结果页面的顶部。?这样?展示位置?经常?基于?知识图谱?并?谷歌的从“字符串”转会“事情的结果。“
从“串”到“事”的举动?一直?非常适合基于数据的搜索,特别是当它把数据的那些位在知识图谱。这些数据位是那些通常回答谁,什么,何地,何时,为何以及如何谷歌的自定义的“微时刻的问题。“谷歌可以为用户提供他们可能根本不会知道他们此刻想要的信息,他们希望。
然而,这种推向实体并非没有不利的一面。虽然谷歌已经擅长堆焊简单的,基于数据的信息,它没有被这样做,以及再被恢复为复杂的查询集合高度相关答案。
在这里,我用“复杂的查询”?参考?简单地对查询不容易映射到实体,一块已知的数据和/或数据属性的 – 从而使得这样的查询难以谷歌“理解。“
其结果是,当你搜索了一套复杂的术语,有一个很好的机会,你会得到只有几个相关的结果,并不一定高度相关的人。其结果是更多的可能性厨房水槽不是一套直接的答案,但为什么?
想在行动中看到的复杂查询? 围棋键入搜索到谷歌,你通常会。现在,检查结果。如果你使用一种不常见的或不相关的一套术语,你会看到谷歌抛出了结果的厨房水槽未知或未映射项目。为什么是这样?
谷歌搜索是针对已知谷歌项目和使用机器学习(RankBrain)创建/理解/推断关系时,他们不容易得到的。基本上,当实体或关系是不知道,谷歌是无法推断上下文或意义非常好 – 所以猜测。
即使在实体已知的,无法确定相关的搜索项减少时相关性还不知道。还记得搜索谷歌在那里你表现的话并没有在搜索中使用? 它的工作原理类似,我们只是没有看到那些删除搜索词更多。
但是,不要把我的话。
我们可以看到这个动作,如果你再次输入查询?-?但是当你键入下拉框,看看,看看会出来什么结果。这一次,而不是您最初搜索,挑选下拉项中的一个查询的是最接近你的意图。
请注意,结果如何更准确的是,当你使用谷歌的话? 为什么? 谷歌无法理解的语言不知道这个词是如何定义的,如果没有足够多的人已经告诉它,它无法理解的关系(或不知道以前)的属性是相关的。
这些都是简单的术语实体搜索是如何工作的。
此外,虽然,究竟什么是实体?
一般来说,名词 – 或人/地点/创意/物联网?- 就是我们所说的实体。实体称为谷歌,和他们的意思是在数据库中定义,谷歌引用。
我们知道,谷歌已经在告诉你所有关于天气,电影,餐厅和什么昨晚的比赛的比分正好是成为真正优秀的。它可以给你的定义和相关术语,甚至像数字百科全书。它在各地的实体理解基于拉回数据点是伟大的。
有谎言擦。事情谷歌的回报以及已知的和已经知道,映射或推断的关系。但是,如果该项目不容易映射或项目不互相映射,谷歌已经在了解查询难度。正如前面提到的那样,谷歌基本上猜测你是什么意思。
谷歌现在要变换出现在页面上为实体意味着什么,并有相关属性的话。这就是人的大脑自然的做法,但对于电脑,它被称为人工智能。
这是一项艰巨的任务,但工作已经开始。谷歌是“创造的实体是一个多么巨大的,内部的理解和什么实体在世界上应该怎么知道这些实体的存储库,” [谷歌软件工程师阿米特]阿密特说:。
举个例子,“冰茶”,“柠檬”和“玻璃”是所有实体(的东西),而这些实体有一个已知的关系。这意味着,当您搜索这些物品 – [冰红茶,柠檬,玻璃] – 谷歌可以轻松地拉回来许多高度相关的结果。谷歌?“知道”你想要什么。用户意图是非常明确的。
如果有什么,但是,我改变查询 。。。
冰红茶,路易波士,玻璃
谷歌仍然大多是明白这一点的搜索,但它不是最清晰理解。
为什么? 博士茶不常用冰茶,即使它是一个茶。
现在,如果我们改变一下这个查询 。。。
冰茶,枸杞,玻璃
现在,谷歌已经开始在厨房水槽扔。有些项目是死的。有些项目只对枸杞茶有关,而不是冰茶。
谷歌是迷茫。
现在,如果我为最终改变 。。。
冰茶,溶糖,玻璃
谷歌失去的是什么这个查询设定手段几乎任何理解。? 虽然这些是在配方甜茶的成分,你会看到(烟雨几甜茶食谱)一些化学相关的网页。
为什么? 谷歌不知道如何准确地映射关系。
但是,如果我看的意思相同的,以我作为一个人时,谷歌不再能确定这些实体和它们的关系其他条件下拉? 如果我搜索下拉提示结果?
含糖冰茶玻璃
唯一改变的有意义的话是“糖”到“含糖”和单词?“溶解”滴入。?然而,这使我们有一整套完善的甜茶结果。
谷歌有什么可以做的是了解该实体冰茶,事实上,被称为冰茶的事。它可以告诉大家,一个玻璃的确是一个玻璃。
然而,在最后一个例子,它不知道如何处理做修改?溶解?相对于冰茶,糖和玻璃。
由于此查询可能指的是冰茶或(在谷歌的“记”)在实验室中使用的糖溶液的糖,它可以让你有冰茶结果。然后,它可以让你没有冰茶在他们但有溶解糖结果。然后,你有一些结果与这两个项目,但他们没有明确相关制作冰茶。
我们所看到的是网页?最有可能RankBrain的结果,试图破译意图。它试图确定了恋爱关系,但必须返回的可能结果的厨房水槽,因为它不知道你的意图。
所以我们现在拥有的是一组查询词,谷歌必须评估对已知的“东西”(实体)。然后,这些东西之间的关系进行了分析与已知的关系,当时它希望能有你的意图有清晰的认识。
当它有这个意向缺乏了解,但是,它可能?利用RankBrain列出你可能的结果集为您查询。简单地说,当他们无法比拟的意图的结果,他们使用一台机器来修正该查询概率。
那么,是谷歌会?
虽然谷歌已经与RankBrain实验,他们已经失去市场?份额 – 不是很多,但尽管如此,他们在美国的人数下降。事实上,谷歌已经失去了份额约3%,自蜂鸟推出,如此看来,这些结果没有收到更相关的或改进的(在某些情况下,你可以说他们差)。
谷歌可能要决定是否回答引擎或搜索引擎,也许它会分开这些和一举两得。
无法产生语义引擎,谷歌建立了基于一个事实。RankBrain现在已经加入到帮助细化搜索的结果,因为实体搜索不仅需要了解什么在搜索平均名词,而且它们是如何相关的。
随着时间的推移,RankBrain会得到更好的。它会学习新的实体,它们之间的关系可能。比今天它会出现更好的结果。然而,他们运行针对称为用户共享一个滴答作响的时钟。
只有时间会证明一切,但时间限制。
在这篇文章中所表达的意见是那些客人笔者并不见得搜索引擎土地。作者的工作人员在这里列出。