首页 | 建站资讯 | 建站问答 | 建站帮助 | 服务电话:021-61984272
suriel. 2017-06-21 网站建设

济宁做网站的公司是如何预处理搜索引擎排名规则的

每个搜索引擎对于网站排名都有一套自己的规则,搞清楚各个搜索引擎的规则,无疑会让优化做起来更加的事半功倍,济宁做网站的公司总结了一些搜索引擎的一些排名规则:
       关键词提取:
  1)在每一章网页,包含了大量的和主题内容无关的内容,像版权说明等等,关键词提取的任务,就是要提取出网页源文件的内容部分所含的关键词。提取的方法:一般类似与切词,将内容切成多个词组成的数组,再取出“在”“的”等无意义的词组,确定最终的关键词。(关键词密度,关键词加粗,定向锚文本就是更具这一原因出现,方便搜索引擎更加简单的判断关键词) 
 
  链接分析:
  1)链接分析中有提到两个概念,词频(TF):该关键词在关键词提取之后的关键词集合中的出现频率;
  2)文件频率(DF):该关键词在所有文件中的出现频率,在所有文件中,该关键词在多少文件中出现;
  3)搜索引擎可以通过HTML文本标签,来确定关键词的重要性(博主联想:<h1>标签的使用就是通过这个得来);指向其他文件的链接,来判断(定向锚文本的使用)
 
  网页重要程度的计算:
  1)搜索引擎需要将用户索引的结果,以列表的形式,展示给客户,并且在展示中满足用户的搜索需求,因此“网页重要程度”的概念出现了。
  2)判定重要性的方法:人们通过参考文献重要性的评估方式,其核心就是–“被引用的最多的就是最重要的”。这种方式,恰好在HTML中超文本链接完美体现,谷歌的PR值(引用该页面的页面概述和引用该页面的页面重要程度)就是完美展现(发外链就是该算法的完美体现)。(PageRank算法)
  3)和第二点出现的不同的地方在于,某些页面是被大量的指向其他页面,某些页面被其他页面大量引用,形成对偶的关系,于是HITS算法出现。(HITS算法)
       部分名词介绍:
      “倒排文字:利用文档(已经采集到的网页)中所包含的关键词作为索引,文档则作为索引的着陆页(目标文档),常见的,就像纸质书籍中,索引就是文章关键词,书籍的具体内容或者说页面就是索引目标页。
 
       镜像网页:网页内容一模一样的,未做任何的修改
  转载网页:主要内容基本相同,但是多了少量的编辑信息
 
  HITS算法:简单介绍,在HITS算法中,存在两种页面Authority(权威)页面和Hub(目录)页面,对于Authority页面A,指向A页面的Hub页面H页面越多,那么A页面的质量越高,同样的Hub页面H指向的Authority页面A的数量越多,质量越高,则H页面的质量也就越高

文章评论:
客服图标
咨询电话
021-61984272

欢迎您给我们来电,已有13835人通过电话进行免费业务咨询,您也可以