拨开云雾见青天,优化也是要懂点搜索原理的

发布时间:2010-05-05 发布者:新锐传媒 查阅 [1663] 评论 [0]

  大多数seoer对网站优化基本知识的学习都是混论坛,看高手的博客,个人认为这里面存在三个你可能会犯的错误:一是容易人云亦云,二是容易被一些错误的观点误导,三是只知其然,不知其所以然。

  上面两段是很多人学习网站优化的不太好的方法,而问题的根本则是在于,这些人不了解搜索引擎的基本原理,不能站在搜索引擎的角度来思考seo。下面我从搜索引擎的角度对影响排名的几个因素进行解释,看你是否会“知其然,更知其所以然”,并留下较深的印象。

  一、传统IR的相关性排序:

  在web搜索引擎出现之前,传统的IR(信息检索)系统被用来检索科技文献等纯文本文档,对检索的结果也涉及到相关性排序问题。解决方法基于共 有词汇假设 (即一篇文档的内容可以用它所包含的词汇的集合来表示),采用经典的TF-IDF加 权算法。TF就是一个词在文档中出现的频率,它描述该词在一篇特定文档中的重要性;IDF是倒排文档频率,它描述的是该词在所有文档中出现的频率,即该词 的普遍重要性,如“我”,“什么”这些词几乎在所有的文档中都会出现,所以这些词即使在一篇特定的文档中出现的频率很高,也不是很重要。总的来说就是,一 个词在一篇特定文档的重要性,和TF成正比,和IDF成反比。

  二、web搜索引擎的检索对象——网页,和传统IR的检索对象——文献等相比又有什么不同呢:

  1、HTML标签。和纯文本文档不同,网页的文本被HTML标签所包围,这也给搜索引擎了解一个网页上什么内容更重要提供了丰富信息。搜索引擎会给出现 在title标签中的词以最高的权重,H标签,strong等等标签中出现关键词也会有较高的权重。另 外网页编辑会利用HTML标签对网页进行排版,所以出现在网页开始部分的内容被搜索引擎认为是更重要的。

  2、超链接。网页和网页之间的链接是一种“参考”和“推荐”的关系。一个网页被很多网页所链接,那这个网页很可能是重要的。(链接的数量)并且搜索引擎会 参考相互链接的一个网页内容和链接的锚文本来判断另一个网页的内容。(链接的相关性)

  三、在现在的web查询模式下,搜索引擎通过用户行为挖掘系统搜集用户行为,加入到搜索引擎排名算法中。比如,在搜索引擎中你那个关键词的查询 结果页面, 用户更多地点击了你的页面而并非排在你前面的,或者用户在你网站浏览的时间远大于你的同行网站,则说明你更受欢迎,搜索引擎会给予更高的权重。

  听我说完以上这些,你是否能够理解,Direct Hit 公司的Gary Cullis 在搜索引擎1999 年年会上将搜索引擎使用的四种技术,即:1.根据网页本身信息(Author);2. 根据超链链接关系(Other Author);3.人工编辑产生的目录系统(Editor);4. 根据用户行为(User)这其中的三种呢?

相关阅读:
        青岛网站优化揭开算法的神秘外纱
        搜索引擎蜘蛛的两种工作方式

      免责声明 | 新锐观点 | 网站运营 | 网站推广 | 联系我们 | 网站地图