读百度《浅谈网页搜索排序的投票模型》有感
时间:2012年05月30日 内容来源: 互诺科技 浏览量:0

  百度搜索研发部官方博客的那篇《浅谈网页搜索排序中的投票模型》不知道大家有没有仔细看过,如果没有看过,建议大家可以认真的看一下,个人觉得这篇文章的观点对于我们SEO工作者来说,是一个比较靠谱的深入网页排名研究方向,里面谈到关于选举投票的很多困境,每种选举办法都有自己的弊端,作者再结合这些选举的方法,谈到在网页搜索排名投票原理中需要注意的问题。下面仔细的跟大家谈谈我读完这篇文章的一些感悟。

  1、哪些网页的特征是受搜索引擎喜欢的?

  文章中谈到搜索引擎网页排序的时候会根据n个网页中的m个特征(页面质量、页面内容丰富度、页面超链、文本相关性等)的不同得分来确定网页的排序,那么这m个特征就显得非常重要了,其中页面质量,页面的丰富度,页面超链,文本相关性是文章中提到的四个影响因素,其他不知道的因素先暂时不管,单只看这四个因素你就会发现他们的确是比较重要的,也是大家常谈的SEO内部优化的四因素。

  A、页面质量其实在我的理解当中应该是包含有这四个方面的,但是这里百度研发部将这一块单独拿出来,那么说明页面质量可能指的其中某一块,例如网页代码的精简度,是否利于搜索引擎抓取,是否有高的网页信价比。但是我们具体结合这一因素操作的时候就要综合考虑,相关性,内容丰富度,受众人群,和是否利于搜索引擎抓取等。

  B、网页内容的丰富度我觉得可以从两个方面来说,一个当然是内容信息量,大篇幅网页信息,一般很多都是独一无二的,原创的可能性就更大了,而丰富的网页信息给用户也能更详实的感觉,虽然可能会造成一些疲劳感,但是如果是内容资讯类网站将显得特别有优势,另外一个是多样的内容,如文字,图片,文字的展现形式也可以采用问答,采访,故事等多样性。

  C、页面超链是搜索引擎分析页面重要性的一个非常重要因素。例如如果一个页面在很多其他的页面有入口,那么这个页面会得到更多蜘蛛爬取的可能,收录的可能性就更大,有更多的页面支持,网站的重要性就凸显出来。从用户的角度来说,我们给用户推荐可能对他有帮助的外链,不仅提高用户体验,还能增大网站内部的粘度。

  D、文本的相关性其实大家都是非常重视的,只要是采用白帽seo,我们都要求网站内部做到相关性,其中对于单个的页面也要注意单个页面的相关性,例如介绍的是发外链的技巧,那么页面中相关文章的链接最好还是介绍发布外链的一些技巧和注意事项。有很多的朋友追求原创度,会在文章中增加一些不相关的文本信息,看似增加了信噪比,但是其实也有可能降低,因为信噪比个人感觉和网页的关键词相关有关。

  2、搜索引擎要做公平公正的排序任道而重远

  了解了各种选举的困难和弊端,我们才能深刻的感受到搜索引擎的“悲惨世界”,对于每一种有优点的投票方式,搜索引擎都是想去采用,但是又担心其搜索结果容易出现偏差的,例如“赢者通吃”法则在网页排序中显然不行,不可能划区域的将一个特征的网页先进行排序,排不上去就要全部给排在第一的网页,也不能以偏概全的将某个或者几个特征表现好的网页排到前面,或者表现不好的排在后面,当然,对于使用黑帽SEO手法的网页我们是需要也必须采用这类“以偏概全”的方法让他排在后面,甚至消失。

  非常认同百度搜索研发部提出的一个观点:最合适放在首位的网页不一定是在每个特征上都最好,而应该是能够兼顾所有特征,综合表现最好的那个。一个完美的网页往往是不那么容易出现的,而能够兼顾很多的优质特征的网页很好做,例如前面4399产品经理提出的关于产品聚合页面的想法,例子是搜索“iPhone 4S”有时候用户的需求不一样,有的用户想知道购买的信息,有的用户想知道售后服务的信息,有的甚至只是想了解下基础的信息,如果只针对一类用户,那么可能丢失其他的客户,所以如果我们能够综合所有,并不一定信息要多好多全,但是能够满足大部分用户的需求,那么这个页面肯定会受到推荐。当然,要获得好排名,还要综合权重高的网站支持,页面代码的精简等。

  搜索引擎要保证排名的公正公平需要考虑太多因素,他们要做的工作太多,为了给搜索用户和站长更好的排序结果,排序算法路上任道而重远。

  3、搜索点击行为不合理如何区分?

  最近比较火热的一个话题是关于百度排名点击器的。首先百度算法中认为搜索引擎使用者对搜索结果的点击行为,可以看成是对搜索结果进行的“投票”,这样的“投票”信息的使用方式有很大的参考价值,但是百度搜索研发部也注意到要考虑这样的结果是否会带来选举过程中出现的种种不合理,例如百度排名点击器对于网页排序的影响,这应该是后面百度需要调整算法中一个比较重要的版块,如降低用户点击算法因子权重,或者找出限制机器或者不寻常的点击影响因素,加以控制。

  4、尽量不存在必然的“独裁者”!

  百度搜索研发部承认在网页排序问题上,真的存在这样一个“独裁特征”,这个“独裁特征”从目前看来,大家都觉得最适合的应该就是“用户满意度”,按照用户的满意程度来排序网页,就是最合理的网页排序,但是衡量用户满意度是一个很难的过程。如果用户满意度从机器或者百度蜘蛛来看只是用户点击,那么会陷入百度点击器的死循环,所以在算法上的改进还需要加入其他的因素进去,例如点击的页面停留,用户在页面内的动作等。如果这个独裁特征不是用户满意度,而是其他的,例如大站优先,大的网站他的权重会通过之前的优势快速获得好的排名,这对于小行业的网站将是毁灭性的,百度要做的就是改进算法,尽量不存在这样的必然“独裁者”。

  本文由化妆学校(http://www.szniweiya.com)网编发表,欢迎大家转载,转载时请保留此链接,谢谢合作!