搜索引擎“相关性”计算原理

经过搜索引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。匹配文件相关性计算最主要的就是页面权重,由于所有匹配文件都已经具备了最基本的相关性,因为这些文件都包含所有查询关键词。当匹配页面数目巨大时,搜索引擎不会对这么多页面进行计算,而必须选出页面权重较高的一个子集,再对子集中的页面进行相关性计算。

 

影响搜索引擎相关笥因素

 

那做SEO优化的人,相关性计算是搜索引擎算法最另SEOer感兴趣的部分,今天就和大家总结一下;

到底影响相关性的主要因素包括哪些?

 

1、关键词常用程度。

越常用的词对搜索词的意义贡献越小,越不常用的词对搜索词的意义贡献越大。不常用的词加权系数高,常用词加权系数低,排名算法对不常用的词给予更多关注。

 

2、词频及密度。

一般认为在没有关键词堆积的情况下,搜索词在页面中出现的次数多,密度越高,说明页面与搜索词越相关。当然出现频率及密度只是因素的一部分,而且重要程度越来越低。

 

3、关键词位置及形式。

页面关键词出现的格式和位置都被记录在索引库中。关键词出现在比较重要的位置,如标题标签、黑体、H1等,说明页面与关键词越相关。这一部分就是页面SEO所要解决的。

 

4、关键词距离。

切分后的关键词完整匹配地出现,说明与搜索词最相关。

 

5、链接分析及页面权重。

除了页面本身的因素,页面之间的链接和权重关系也影响关键词的相关性,其中最重要的是锚文字。页面有越多以搜索词为锚文字的导入链接,安庆龙泊学认为页面的相关性越强。

    A+
发布日期:2017年04月11日  所属分类:外贸SEO
最后修改时间:2017-03-28 17:30
付杰

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: