语言的不同方面
在我们可以进入语言学方法搜索引擎优化,我们首先要了解什么是语言。语言由许多不同的方面组成。想想看:我们发出语音或书写字母,它们一起构成单词。我们把这些单词按特定的顺序排列,这样它们就可以组成句子和短语。这些句子对我们来说很有意义。
有时我们也想用语言来达到一些目的。例如,当我们说“it ‘s cold in here”时,我们可能不仅想表达我们很冷,还可能意味着请求关闭窗口。为了研究所有这些方面,我们在语言学领域区分不同层次的语言。
语言的语言水平
最基本的层次是声音和字母的层次,我们称之为音系学(当我们谈到语音时)和笔体学(当我们谈到书写时)。然后是形态学层面,研究这些声音和字母如何共同构成单词和不同的单词形式。例如,单词“house”可以和“tree”组合成“treehouse”,和“dog”组合成“doghouse”,但是我们不能把它和“banana”组合在一起。
下一层,句法,描述了我们创造句子的规则。有一百万个单词可供我们选择,我们可以用来形成无限个可能的句子。但是这些语法规则只允许我们使用少数几种方式来组合这些单词。
语义学研究的是语言中不同成分的意义。当我们说某句话时,我们的意思是什么?我们如何理解他人?最后,语用学着眼于上下文中的意义。例如,某人可以说:“我热了,你能把门打开吗?”从语义上来说,“裂缝”意味着“打破”,但从实用主义上来说,我们知道他们实际上并不想让我们打破门;他们要我们开门让新鲜空气进来。
语言学领域的语言水平
音韵学(语音)和笔体学(书写)
单词和单词构成形态学
句子与规则句法
意义的语义
语境和语言使用语用学
来源:Crystal (1987), Hickey (2005)
谷歌能理解哪些层次的语言?
好吧,但这和搜索引擎有什么关系呢?搜索引擎正试图像人类一样理解语言。他们做得越来越好。几年前,搜索引擎只能理解语言的基本元素:它们可以识别你内容中的关键词。正因为如此,通常只针对关键字进行优化。
但时代变了。搜索引擎变得越来越聪明,它们在理解更多层次的语言方面也越来越好。谷歌现在正在尝试从句法、形态学、语义甚至语用学的层面来理解语言。如何?让我们找出答案。
理解高质量内容的特征
每一次更新,谷歌都试图像人类大脑一样更接近理解语言。Panda更新(2011)处理了瘦内容和关键字填充。人们再也不能在充斥着关键词的低质量页面上排名靠前了。这次更新之后,谷歌尝试在语义和语用层面理解语言。他们想知道人们认为什么是高质量的内容;真正提供有关他们使用的搜索词的信息的内容。
阅读更多:谷歌熊猫
理解短语的意思
几年后,随着Hummingbird的更新(2013),谷歌对语义进行了更深入的研究。这次更新的重点是识别搜索查询之间的关系。这使得谷歌更加关注搜索查询中的每个单词,确保考虑到整个搜索短语,而不仅仅是特定的单词。他们希望能够理解你输入搜索查询时的意思。
谷歌更进一步。自从他们在2015年推出RankBrain算法以来,他们可以解释新词(还没有被主流语言完全接受的词,比如“冠状词”),口语(非正式交流用语,比如“ain ‘t”和“gonna”),还可以处理对话。
阅读更多:谷歌算法更新简史»
理解不同的单词形式
谷歌在理解单词或短语的不同形式方面也变得更好了。你不再需要填塞你的文章与相同的关键字一遍又一遍。如果你在写一篇关于[阅读]的文章,谷歌会识别出这些词的不同形式,如[read]、[reads]和[book]。此外,谷歌还能理解同义词。写关于[小说],[编年史]和[卷],谷歌仍然会把你列为[书]。在你的措辞上使用一些变化可以让你的文本更容易阅读,这也是谷歌发现的重要之处。