搜索引擎
我们的编辑器将检查你提交并决定是否修改这篇文章。
搜索引擎,计算机程序找到答案查询收集的信息,可能是图书馆目录或数据库但是是最常见的万维网。Web搜索引擎生成一个文件列表的“页面”-电脑文件列在万维网——承载包含或与在用户输入的查询条件字段称为搜索栏。大多数搜索引擎允许用户加入与等限定符和,或,不完善的查询。他们也专门为图像搜索、视频、短语,问题,或新闻文章的名字网站。
操作方式
网络搜索引擎包含三个主要部分:一个机器人(或“机器人”),一个索引,一个接口。机器人,或爬虫是数据收集项目,参与寻找数据的重复性任务比人类更快。这些项目探索Web遵循超文本的链接页面,记录所有的页面上(称为缓存),或部分的页面。这些信息,连同一些专有的标签内容的方法,用于建立一个加权指数,搜索引擎的第二个组件。用户访问索引来查找他们所需的Web页面使用第三个组件的搜索引擎搜索界面和相关性软件。这个软件梳子通过指数任何用户输入关键字或短语。结果提供给用户作为一个超链接的页面地址列表软件发现,排名,他们假定相关用户的查询。
该指数的相关性的判断提出了最大的挑战一个Web搜索引擎。网络在很大程度上是无组织的,信息的页面质量大大不同,包括商业信息,国家数据库,研究参考集合,集合的个人材料。词在搜索栏输入的任意组合可能会产生数百,数千甚至数百万的页面地址。搜索引擎试图识别出可靠的页面权重,或者排名,根据指向其他页面的数量,通过识别“当局”,许多页面引用,并通过识别“枢纽”,是指许多页面。例如,一个Web搜索“美国总统”应该提供用户提供的链接白宫的官方网站很久以前就提供了一个链接的博客阴谋理论家。每个搜索引擎完成这一壮举的优先级通过自己的专利算法。这些技术可以工作得很好,但是用户必须仍然运动技能在选择合适的搜索词的组合。搜索银行可能返回数亿页(“点击率”),许多来自商业银行。搜索河岸可能仍然返回数以百万计的网页,很多从银行机构河在这个名字。只有进一步细化等河岸流可以减少点击页面的最著名的河流和河岸的担忧。
考虑页面的复杂性增加了许多网站所有者的企图操纵搜索引擎的算法页面,吸引更多的流量。网站可以包括自己的索引标签页,这通常被认为只有通过爬虫,为了提高搜索和网站之间的匹配。故意将元素添加到一个Web页面(例如,特定的词)来吸引搜索引擎的注意被称为是一种实践搜索引擎优化(SEO)。为了继续为用户提供最好的结果,搜索引擎背后的公司试图解释这些技术,反过来导致的发明新的战术。搜索引擎和搜索引擎优化专家之间的猫捉老鼠的游戏也在不断地演变。
同样,用户应该认识到是否一个特定的搜索引擎关键字拍卖,尤其是网站支付优惠分别放置不表示。在某些情况下,网站所有者将付出他们的页面出现在顶部结果尽管这些发现经常被标记为广告。
即使是最广泛的通用搜索引擎谷歌(迄今为止最受欢迎的搜索引擎),必应(也权力雅虎搜索)、俄罗斯Yandex和中国人百度不能跟上的扩散网页,并且每个叶子的大部分网络发现。
历史
已知最早的概念化的东西像现代搜索引擎出现在1945年。美国工程师Vannevar Bush写一篇文章《大西洋月刊》哀叹“出版的科学发现已经延长远远超出我们目前的能力真正的使用记录。“布什敦促科学家创建一个数据存储和检索系统更像人类brain-i.e运作。协会。他称这一理论体系“麦克斯存储器”。
在1960年代杰拉德的索尔顿海康奈尔大学-现在被称为“信息检索”的父亲和其他类似titles-effectively接受了布什总统的挑战。领导团队的计算机科学家哈佛大学和康奈尔,萨尔顿创造了“系统的力学分析和检索文本”(聪明的)。突破观察,让聪明的成功是编程算法寻找英语语法是难上加难——海盗少要实用编程简单搜索语义(也就是说,文档中的词搜索是很重要的,但不是他们的舌相互关系)。这种认识导致索尔顿海开发实践,今天仍在使用的搜索引擎,如分类、索引、计数、和估值的单词。
尽管如此,直到1990年,三个计算机科学学生在麦吉尔大学在蒙特利尔,艾伦•Emtage比尔Heelan,彼得Deutsch-created第一个搜索引擎,阿奇(简称存档)。阿奇没有寻找网页,因为万维网不会存在一年,但托管在文件的名称FTP(文件传输协议)服务器。甚至,有那么一些的,阿奇不需要索引。其结果列表总是短的,足以让一个人读。
第一个搜索引擎来搜索网页爬虫和目录索引出现在1993年6月,当马修灰色了万维网流浪者同时麻省理工学院的(麻省理工学院)。灰色发明了万维网流浪者的大小来衡量,一个任务执行直到1995年底。
JumpStation由乔纳森在苏格兰斯特灵大学的弗莱彻,1993年12月。考虑到包括一个新的网络搜索工具用户界面,记得今天是第一个将所有三个主要组件(抓取、索引和搜索),现在弥补现代搜索引擎。然而,JumpStation缺乏资源来做超过搜索网页的标题和标题,使得用户很难找到具体的结果,除非他们知道他们想要的页面。
这是布莱恩·平克顿WebCrawler,为数不多的几个搜索引擎的时间依然活跃在第一季度的21世纪,第一次允许用户搜索词在任何Web页面索引。于1994年4月20日,该工具变得如此受欢迎,它在白天达到用户容量。一度是第二个最受欢迎的网站互联网,尽管它的受欢迎程度下降过多竞争对手的搜索引擎很快进入市场。
1996年8月拉里•佩奇和谢尔盖•布林测试他们的搜索引擎,名字叫“BackRub”的斯坦福大学的网络。两人改变了工具的名字谷歌并在1998年推出。有一个整洁的设计公司只允许文本广告优越算法命名网页排名,搜索引擎的人气迅速上升。公司还指出的道路为行业盈利能力通过出售广告协会与特定的搜索词。今天谷歌是世界的主要搜索引擎,占大约9的搜索。