搜索引擎分词算法的秘密!
做seo优化离不开的核心问题是关键词,特别是针对大型网站,以内页来参与排名的页面,当然首页去参与排名的也非常需要懂得分析关键词,而之所以搜索引擎能够控制好这一点,主要还是搜索引擎的分词算法!
1、搜索引擎同义词的识别
我们经常可以看到,当在搜索某个关键词的时候,发现其网站根本就没有主关键词,只是有同类的关键词。
比如上图所示,负面消息实际上和负面信息属于同类词了,而我在搜索负面信息的时候,可以看到这个站点没有包含关键词负面信息,但seo排名依然是在首页的。因此这是百度分词算法的一种识别技术。
2、拼音关键词识别
那么第二种技术识别的就是当用户输入拼音的时候,搜索引擎推荐出的结果是中文汉子的结果,这是搜索引擎在用户输入拼音搜索识别出来的。
同样可以从上图看得出,咱们在搜索jiuwenwang拼音的时候,搜索结果中出现了久闻网的拼音,但为了满足更多用户的需求,因此同样会推荐用户可以直接搜索拼音的结果,但默认的是中文搜索结果,这是分词算法中的第二强大技术!
3、屏蔽关键词算法
部分不合法的词搜索引擎会通过技术来屏蔽,当然这不可能是人工操作的,而是机器识别的,因为搜索引擎的数据非常庞大,人工来干预工作量会非常大,所以需要通过机器来识别关键词再屏蔽。
比如说上图这类的词,可以说这类词流量非常大,商家价值非常高,又没有百度竞价,如果能够做,很多人会去操作这类词的排名,但是由于搜索引擎的屏蔽,因此才会导致我们看到的结果没有任何广告。
当然这类词其实非常之多,包含医疗、美容保健等行业的关键词也做了隐形的屏蔽,这是搜索引擎为了维护法律而使用的算法。
4、关键词分开后的识别
有的网站关键词并没有包含在一起,又或者部分长尾关键词搜索的结果中也可以看到一些没有关键词的站点,其实并非没有,只是这一部分网站的设置的关键词给分开了,但效果依然是可以保持的!
上图是小编站点seo报价的一个文章页面,可以看得出搜索这个关键词,发现seo和报价这个词压根就是分开的,但是搜索结果却依然排名在首页。其实这是搜索引擎在识别的时候,可以将分开的内容整合到一起,因此这也断定,只要是标题吸引人去点击,哪怕给关键词分开也并没有太大影响!
5、域名作为关键词的识别
大家购买域名的时候都购买与自己行业有一定相关性,其一是为了让用户更加方便的记住,但实际上有更容易被用户记住的域名,但大家依然会购买与行业相关的域名,主要就是搜索引擎可以识别域名作为关键词。
比如说搜索小编的站点,可以发现从标题到描述没有然后小编域名信息,至少没有出现飘红现象,但依然排名在第一,细节上可以看到,域名上是给我的域名加粗了。是因为搜索引擎可以识别到域名作为关键词。
再者大家可以去搜索相关的英文关键词,可以看到,及时搜索中文,而英文的域名一样给加粗的,当然中文的url中同样也会被加粗。这就是搜索引擎分词算法中的强大技术!
总结:其实搜索引擎的分词不仅仅包含的是这些,还有更多的,而这些是我们在优化的时候比较常见,也比较常用的。