当前位置:经济频道首页 > 正文

两位斯坦福天才,如何创造出改变世界的谷歌?(4)

2017-07-13 17:01:50    第一财经APP  参与评论()人

要把整个万维网记录下来可不是一件易事。即使是在1996 年1 月的时候,全世界已经有10 万个网站,这些网站总共含有1000万个文档,它们之间的链接有近10 亿条,而且这些数字每年都会呈现指数级增长。在当年初夏,佩奇设计了一个网络爬虫工具,它会从佩奇的个人主页出发,一直跟踪它遇到的所有链接。这只在万维网上迅速移动的蜘蛛会保存每条超链接的文本和来源,以及它们对应网页的标题。他将这个项目命名为“Back Rub”。

1996年7 月15 日,他已经收集了2400万条网址和超过1 亿条链接。“虽然我当时只保存了大概15% 的网页,不过情况看起来非常乐观。”

佩奇这个大胆而复杂的项目吸引了拥有数学头脑的谢尔盖•布林的注意,后者当时正在寻找一个合适的博士论文题目。他兴致勃勃地加入了自己好友的工作当中:“这是最令人兴奋的一个项目,不仅因为它与代表人类知识的万维网相关,也因为我喜欢拉里这个人。”

BackRub 项目在当时的目标仍然是收集万维网的反向链接,为将来可能实现的注释系统和引用分析功能打下基础。“现在想来不可思议的是,我当时完全没有想过要建立一个搜索引擎。”佩奇说道,“这个想法甚至不在我们的考虑范围之内。”随着这个项目的逐步推进,他和布林想出了一些更为复杂的网页价值分析方法,这些方法采用的依据是指向每个网页的链接的数量和质量。这时候,他们逐渐认识到这个按照重要性排名的网页索引可以成为一个高质量搜索引擎的基础。这就是谷歌诞生的由来。

“当一个伟大的梦想出现的时候,”佩奇后来说道,“你要马上抓住它!”这个经过改进的项目最初被称为“Page Rank”,因为它会对Back Rub 索引收集到的每个网页进行排名。当然,这个名字还体现了佩奇的讽刺幽默感和小小的虚荣心。“不好意思,它确实是指我自己。”他后来羞怯地承认道,“我其实对此感到有点难为情。”

网页排名的目标还会引出另外一个复杂的问题。佩奇和布林意识到除了对指向网页的链接数量进行汇总以外,他们还可以尝试确定每条进入链接的价值。例如,来自《纽约时报》的链接应该要比贾斯汀•霍尔在斯沃斯摩尔学院宿舍发出的链接有更高的价值。这样就建立了一个由多个反馈循环形成的递归过程:每个页面的排名依据是进入链接的数量和质量,而这些链接的质量是由生成它们的页面的数量和质量来决定的,以此类推。“整个过程都是递归的,”佩奇解释道,“这是一个巨大的循环。不过数学的力量是很强大的,它可以帮助我们解决这个问题。”