搜索引擎的工作一般分为以下的几个阶段:
第一:爬行:
搜索引擎爬虫会通过跟踪链接爬行站点内的网页;
第二:抓取:
爬行过的站点的HTML代码存入搜索引擎数据中;
第三:索引处理:
索引程序对抓取的页面数据进行提取文字、分词、重复页面、垃圾页面等处理,以供排名使用。
第四:排名显示:
当用户输入了某个关键字后,排名程序使用索引中的数据,计算其相关性等,按照一定格式生成搜索结果的页面。
搜索引擎的工作一般分为以下的几个阶段:
第一:爬行:
搜索引擎爬虫会通过跟踪链接爬行站点内的网页;
第二:抓取:
爬行过的站点的HTML代码存入搜索引擎数据中;
第三:索引处理:
索引程序对抓取的页面数据进行提取文字、分词、重复页面、垃圾页面等处理,以供排名使用。
第四:排名显示:
当用户输入了某个关键字后,排名程序使用索引中的数据,计算其相关性等,按照一定格式生成搜索结果的页面。
关于作者