课程咨询 :15874024893
qq:2416540879

长沙网络营销培训 > 达内新闻 > 垂直搜索引擎更专、更精、更深
  • 垂直搜索引擎更专、更精、更深

    发布:长沙网络营销培训      来源:达内新闻      时间:2016-08-18

  • 随着Web的普及和发展,互联网己成为一个并放性的全球性资源,其集中了海量的以网页文本形式存储的信息,改变了人们的工作、学习、娱乐等方式。近年来随着Web2.0、移动互联网的兴起,网页作为信息的载体,以爆炸性的速度增长, 前已有上亿个网站,数十亿个用户,并且这个数量在不断的增长。互联网的兴起加快了人们的生活节奏,越来越多的人们在互联网里搜索信息,在如此海量的信息里精确获取用户所要查找的信息越来越难,这个时候,搜索引擎就诞生了

    搜索引擎是指计算机程序按照指定的策略从网络中抓取HTML等网页信息,然后将信息抽取、去重、分词、存储,然后按照一定的方式做排序,之后再创建索引,为广大用户提供检索服务的程序,当用户在搜索界面搜索信息时,该程序对搜 结果进行一些处理后,然后从数据库中返回信息,并按照一定的算法,按照用户查询相似性显示出来。

    网络爬虫模块是搜索引擎里最重要,也是最基础的模块,它根据规定的算法规则,以某个初始URL开始抓取HTML文档、音乐、视频等网页信息,它是与搜索引擎其他部分紧密相连的自动化抓取部分。随着互联网的发展,特别是移动互联网 高速发展,依靠传统的通用搜索引擎,用户很难发现特定主题有价值的信息了,此时人们研究了一种只面向特定主题的搜索引擎,其被称为垂直搜索引擎。

    通用搜索引擎广泛被接触,平常说到的搜索引擎,如百度、Google之类的指的就是通用搜索引擎。与垂直搜索引擎相比,通用搜索引擎包含的资源更多、范围更广,主要原因是没有经过主题判断,只是尽可能的抓取更多的HTML页.面,其优点 是用户可以通过通用搜索引擎查询到各种主题以及形形色色的资源。

    但是从其采集原理来看,这是有许多缺点的,虽然通用搜索引擎收录的资源范围广,但是它会消耗更多的系统资源和网络带宽,同时相关度网页出现的概率低、死链接较多,通用搜索抓取网页一般都是信急出来后几天到几周,甚至可能 会收录一些网页,所以其也不能及时展现信息,即信息时效性低,缺点本文就不一一叙述了,为了解决这种问题,人们发现面向单一主题的垂直搜索引擎可以很好的解决这个问题。

    通用搜索引擎存在一些问题,比如资源浪费,面向特定主题的相关度较低、死链多、重复率高等,为了解决这个问题,垂直搜索引擎慢慢的走向人们的视线,垂直搜索引擎一般都是针对特定主题的,比如博客,购物等等,技术特点与通用搜 索引擎相比,差别不是太大,但是其更专注于某一主题,并且对此主题的资源应该包括更广,应该将其看成通用搜索引擎特定主题的细分,所以与通用搜索引擎比起来,其面向特定主题,更专、更精、更深。

    推荐文章

上一篇:语义 Web 的新型搜索技术

下一篇:长沙网络营销培训机构:Alexa世界网站排名规则

最新开班日期  |  更多

网络营销型网站班

网络营销型网站班

开班日期:10月31日

SEO搜索引擎优化班

SEO搜索引擎优化班

开班日期:10月31日

SEM搜索引擎推广班

SEM搜索引擎推广班

开班日期:10月31日

百度搜索推广综合班

百度搜索推广综合班

开班日期:10月31日

  • 网址:http://cs.so.tedu.cn      地址:长沙市芙蓉中路一段479号建鸿达现代城27楼
  • 课程培训电话:15874024893
    qq:2416540879    全国服务监督电话:400-827-0010
  • 服务邮箱 ts@tedu.cn
  • 2001-2016 达内国际公司(TARENA INTERNATIONAL,INC.) 版权所有 京ICP证08000853号-56