搜索引擎的发展变化

一、搜索引擎的发展变化

搜索引擎(Search Engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的相关信息展示给用户的系统。

(一)搜索引擎的构成与发展

搜索引擎一般主要由四部分组成:搜索器,索引器,检索器,用户接口。

搜索器的功能是在互联网中发现和搜索信息。它需要以最快的速度和最大的量搜集各种类型的信息,同时还要定期更新已有信息,避开死链接和无效链接。

索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表,建立起自己的物理索引数据库。一个搜索引擎的有效性在很大程度上取决于索引的质量。

检索器的功能是根据用户的查询在数据库中快速检出信息,进行信息与查询的相关度评价,对将要输出的结果进行排序,实现相关性反馈。

用户接口的作用是供用户输入查询内容、显示查询结果,提供根据用户的需要作出的相关性反馈。

在互联网环境下,搜索的典型实现是基于关键词匹配的检索机制。目前,计算机信息检索功能已经从基本的布尔检索、截词检索、邻近检索、短语检索、字段检索发展为高级的加权检索、自然语言检索、相关信息反馈检索、模糊检索和概念检索。

(二)搜索引擎的使用率与影响

搜索引擎在很长时间里都是网民使用最多的互联网服务,即便随着微信的兴起,成为使用率第二的应用,但是根据CNNIC发布的第42次《中国互联网络发展状况统计报告》,截至2018年6月,我国搜索引擎用户规模达6.57亿,使用率为81.9%,用户规模较2017年年末仍增加1 731万,增长率为2.7%;手机搜索用户数达637亿,使用率为80.9%,用户规模较2017年年末增加1 342万,增长率为2.2%。[11]

搜索引擎稳居互联网应用使用率前列的原因主要有以下几个方面[12]

1.信息爆炸使高效的信息检索功能成为必需。随着互联网的飞速发展,网络中的内容和资源日益丰富,而各类新型的网络应用更是让互联网内容呈几何级数式增长。面对这样的信息过载,网民只能通过搜索引擎这种过滤方式更高效地找到需要的内容和资源。

2.网络与现实的结合拓展了检索信息的需求。随着互联网向现实社会的渗透,网民利用网络寻找信息的需求变得更加旺盛。除了以往查找网站和互联网内容资源以外,利用互联网辅助购物、查找本地消费信息等需求更加旺盛,这些需求都促进了网民对搜索引擎的使用。

3.搜索服务商对服务的细分和优化增强了搜索的价值。为了更好地满足网民在互联网搜索方面的需求,搜索服务商不断推出软件搜索、翻译搜索、位置搜索等垂直服务。垂直搜索引擎服务模式的行业性、专业性及其精准性的优势,使人们可以更加方便、准确地在互联网中找到真正需要的内容,进而提高了用户满意度,增加了用户黏性,吸引了更多新用户。

一方面,对于已经接触过的网站和服务,网民慢慢倾向于不记忆网址,而通过搜索引擎搜索的方式进入;另一方面,对于未使用过的网站和服务,网民也是通过模糊搜索的方式来进行查找,进而由搜索引擎引导到相应的网站或服务。这种入口型应用的定位,也保障了搜索引擎稳居互联网应用使用率的前列。

(三)百度——全球最大的中文搜索引擎

百度的核心价值观是“简单可依赖”“让人们最平等便捷地获取信息、找到所求”。除网页搜索外,百度还提供音乐搜索、图片搜索、视频搜索、地图搜索等多样化的搜索服务。为了让那些对同一个话题感兴趣的人们能汇聚一堂,方便地交流和互助,百度“贴吧”“知道”“百科”等围绕关键词服务的社区化产品也应运而生。如“百度知道”是一个基于搜索的互动式知识问答分享平台,它的模式是鼓励用户自己根据具体需要有针对性地提出问题,通过积分奖励机制发动其他用户来解决该问题。这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,达到分享知识的效果。“百度知道”的最大特点,就在于和搜索引擎的完美结合,让用户所拥有的隐性知识转化成显性知识,用户既是“百度知道”内容的使用者,同时又是“百度知道”的创造者,通过用户和搜索引擎的相互作用,实现搜索引擎的社区化。

“框计算”是由百度首先提出的一种语义搜索概念。所谓“框计算”,是用户只要在框中输入服务需求,系统就能明确识别,并将该需求分配给最优的应用或内容资源提供商处理,最终返回给用户相匹配的结果。在“框计算”之前的语法搜索阶段,用户只能搜索到包含搜索词的网页信息,但是在“框计算”的语义搜索中,由于可以进行“需求识别”,具体包括语义分析、行为分析、智能人机交互、海量计算处理,因此它可以做到识别后进行大数据对接,实现规模化、同步化、标准化的指令匹配。只要在这个“框”里输入文字,看新闻、网上购物、杀计算机病毒、计算、查日历、查地图、买卖股票等几乎所有信息都可以找到,并被相对精准地推送。这种新的搜索能力因为几乎做到了“即搜即得,即搜即用”,使得用户的搜索体验更佳。