2009年4月26日星期日

» 搜索引擎如何提取网页核心内容

这篇文章已经超出简单seo的范围了,但碰到的许多问题令人不得不进行深入的思考。尽管查阅了许多资料,但本文仍然只是对搜索引擎如何提取网页核心内容的简单思考,不当之处请朋友们指正。
无论Blog、CMS、BBS,都是基于模板(主题)生成网页内容的。以wordpress为例,我的这个简单seo博客根据模板可划分为如下图所示的header、content、sider、footer三大板块,header和footer的内容基本是固定的,sider侧边栏一般是些相关文章,最新文章,分类目录,友情链接等方便用户浏览的内容,同时也起到提高网站内容互联性的作用。搜索引擎的蜘蛛(spider)爬行网页的时候会自辨别,而content部分则是网页的核心内容。
那么搜索引擎理所当然地会把content当作网页核心内容,从而进行关键字密度地计算,从而给予一定的网页权重,并编入数据库以供用户检索。
所以,我们在进行搜索引擎优化的时候,应该着重优化content部分的内容。如有针对性的提高关键字出现的频率、在开头、当中、结尾处使用关键字、使用H标签和Blod加粗等。这个原理也很好地解释了为什么有些网站的关键字密度达到20%以上,却不被搜索引擎封杀的原因。网上有许多免费提供的计算网页关键字密度的工具,所以大家在使用的时候,最好只针对content的内容进行计算,以免被误导。
上述内容供学习SEO的朋友参考,只有理解了搜索引擎如何提取网页核心内容的问题后,网页的优化的效果才会更加明显。

没有评论:

发表评论