>

篮球世界杯篮球彩票谷歌学术走过风雨十年 听创

- 编辑:美洲杯足球彩票 -

篮球世界杯篮球彩票谷歌学术走过风雨十年 听创

微软学术搜索“年久失修”

作者:闫洁 来源:中国科学报 发布时间:2014/11/24 8:52:28 选择字号:小 中 大 谷歌学术走过风雨十年 听创始人畅谈苦辣酸甜

篮球世界杯篮球彩票 1

Anurag Acharya 图片来源:Amit Basu

距其问世已有5年,微软启用的免费学术搜索引擎已经进入“年久失修”的状态,自2011年起甚至无法查找已发表的论文。该产品的幕后团队表示,他们正将目光转移到一个即将发布的新一代版本的服务上。

11月18日,针对学术文献的免费搜索引擎谷歌学术迎来了它的十周岁生日。通过利用网页爬虫抓取数以百万计的学术论文文本,谷歌学术改变了研究人员在网上查阅文献的方式。

篮球世界杯篮球彩票,几年前,微软学术搜索和谷歌学术搜索互相竞争,都想成为免费学术搜索引擎的领跑者。两大产品都为数以千万计的学术文件编了索引,追踪其被引用情况,为专业学者创建个人资料页面。MAS的定位是一项研究计划兼免费搜索工具,在某些功能上具有优势。例如能使各研究领域间的联系可视化。两种产品开始了一场文献计量方法领域的战斗。

在今年《自然》杂志开展的一项调查中,60%的科学家表示自己经常使用该项服务。日前,《自然》杂志对话谷歌学术共同创始人Anurag Acharya,畅谈谷歌学术的过去和未来。

但这场战争从未真正打响。由西班牙研究人员组成的团队决定比较谷歌学术搜索和MAS。该团队由格兰纳达大学科学传播专家Emilio Delgado Lopez-Cozar领导。他们惊讶地发现,从2011年开始,微软的产品已经无法有效检索学术文献。去年,其仅成功检索约8000个文献。研究人员在4月28日发表于arXiv预印本服务器的工作文件中表示:“微软学术搜索已经被宣判死刑了吗?”

问:你如何知道哪些文献需要检索?

其他人也关注到这一问题。去年开始,该产品的留言板上出现了大量用户投诉,而微软给出的唯一答复是“我们致力于研发搜索引擎的其他功能”。

:我们通过爬虫抓取所有网页。以一篇新发表的博客为例,我们会判断它和其他学术文章存在何种联系。如果很多人引用它,或者它引用了很多人的文章,那么它可能具有学术价值。这里面并没有神奇的公式可以套用,只能从很多特性中寻找证据。

现在,该产品有了起死回生的迹象。当被问及产品弊端时,微软研究院的一名发言人拒绝直接回答问题,但在一封邮件中表示:“MAS仍是微软研究部门的一个主要研究项目。多年来,我们一直把MAS作为一个重要机制以应对和学术搜索有关的多个挑战,包括文献内容的歧义,出版物的相对影响和相关图表等。”

问:创建谷歌学术的想法从何而来?

他补充说:“在目前的模式下,微软研发的MAS已经开创了新一代学术搜索引擎的先河。MAS一直专注于提高用户体验,我们希望MAS不仅是一个研究项目,更是一个包含微软特色的多个服务的组合。尽管现在处于过渡期,微软仍努力维持自身特色和功能,并试图将新的内容注入到现有搜索引擎中。现在我们已经将绝大部分精力转移至这个新计划中。”该发言人还表示,即将问世的新一代搜索引擎仍是免费的。

:我在2000年来到谷歌,之前则在加州大学圣芭芭拉分校从事学术工作。很明显,假如继续从事学术研究,我不可能产生比呆在谷歌还大的影响,使世界各地的人们都可以找到信息。因此,我放弃了学术道路,花了4年时间管理谷歌网页检索团队。那是一段异常忙碌的日子,整个人可以说是心力交瘁。

《中国科学报》 (2014-05-22 第3版 国际)

Alex Verstak和我决定休假半年,并试图利用这段时间让学术文章的搜索变得更加方便快捷。当时的想法并不是创建谷歌学术,而是想提高谷歌在用户利用网页搜索学术文章时的排名。不过,随之而来的问题是如何判定搜索用户的意图:他们需要学术性的结果或者只是个门外汉?我们据此建立了一个内部原型,谷歌学术变成了一种非常有用和重要的服务。

问:这个想法很快就取得了成功吗?

:很快就广受欢迎。谷歌学术启用后,使用量呈指数级增长。一个重要的差别在于我们按照与用户请求的相关性排列搜索结果,这是此前的学术性搜索服务无法做到的。它们采用的是倒序方式,即首先提供最新的结果。我们还通过爬虫抓取到研究论文的全部文本,尽管在一开始并未将所有出版商的全部文本包括进来。

本文由科技中心发布,转载请注明来源:篮球世界杯篮球彩票谷歌学术走过风雨十年 听创