三、检索与排名
在整个检索与排名中,会体现出最常用的两个搜索引擎原理,一个就是倒排索引,另外一个就是TF-IDF算法,首先我们来了解下倒排索引的更新策略,如下图所示(来自百度百科-倒排索引):
在整个倒排索引结构中,最常见的有四种更新策略,而上述的案例中就用到了其中两种,如果大家仔细的去观察我的每一个文章,就不难发现即使我的页面是纯抄袭文章,但是我抄袭的每一个标题和原来标题不相同,并且标题会更加的去符合页面内容,提升页面词频需求(TF-IDF)。其次则是抄袭的文章不会直接复制粘贴,我会进行重新排版,重构页面从而达到页面并非采集的作用。
在搜索引擎里面。有一个算法叫做TF-IDF算法,简单来说,TF-IDF算法(详细公式参考:
http://www.cnblogs.com/biyeymyhjob/archive/2012/07/17/2595249.html))是用来检索页面文档关键词出现的频次。并且可以通过该算法计算一个文件集合里面的词频出现的次数从而来评定一个页面的重要程度。而该重要程度是结合页面TITLE来计算,也就是大家常说的文章内容要符合页面标题的主题相关性(类似作文写作中的紧扣主题)。
看到这里,我相信很多朋友就会理解为何蜘蛛池程序可以快速提升收录并且有部分页面进行参与排名,很大的一个特点就是蜘蛛的频繁抓取,从而建立了索引,在短时间内让页面“权重”提升,并且促进排名,而新闻站点的原理也是因为蜘蛛抓取频繁的特点,几乎无需发布任何的外链即可有很好的排名。
现在我们再来分析和思考整个页面的抓取到最终的检索排名我一共操作了哪些:
第一、大量的不定时更新,让蜘蛛抓取频繁抓取(建议给百度提交站点地图,定时更新站点地图)
第二、大量采集文章通过修改标题与布局重构让页面变得更新有新鲜度(满足更符合页面的用户需求)
第三、每天保持大量的更新让蜘蛛抓取形成习惯
第四、由于该站是老域名,加上站点原始数据积累,可保持站点的权威度,从而相对新域名来说站点更加具备抓取优势。
总而言之,虽然最后只给大家留下了4点,当然也有很多SEO同学会觉得我说了一堆没用的,但是如何你真正的去领悟到我所提到的一些核心要点,那么你就不难发现SEO建立索引的奥妙所在,做SEO,思路决定出路,我更加建议seo同学们可以多去了解搜索引擎的一些基础算法和百度官方优化指南文档,如果能够把里面的任何一个核心点通过实战的方式去吃透他,那么比你看任何的所谓的SEO文章都要有价值!
|
SEO实战干货:独家揭秘内页快速收录排名(3)
发布时间:2016.12.15 浏览:
次
1
赞一个
预约SEO顾问服务请联系:185-1018-8870(手机微信同步) 领取免费VIP内部课程
文章来源:北京SEO技术服务中心
文章标题:SEO实战干货:独家揭秘内页快速收录排名(3)
本文地址:http://www.zhizheseo.com/SEOjishu/SEOjiaocheng/319.html
版权所有 © 北京SEO技术服务中心(微信/QQ:zhizheseo/2052048546),欢迎分享本文,转载请保留出处!
上一篇:干货| html的优化分析方法 下一篇:新站如何优化才能加快收录?