为什么Technorati感觉很慢 - 彭博社
bloomberg
在过去的几周里,我发现 Technorati 令人沮丧地慢。因此我打电话给公司询问情况。副总裁兼首席工程师亚当·赫兹给了我详细情况。简而言之,Technorati 正在努力跟上博客的爆炸性增长。他说,调整就像“在行驶的汽车上换轮胎”。网站上的新服务增加了更多的复杂性。这些挑战没有减缓的迹象。结果是?虽然 Technorati 是博客搜索的领先品牌,但它正处于一场令人生畏的技术竞赛中。这为其他人提供了机会,从 谷歌 到 PubSub,如果他们能掌握机器和算法来征服博客圈。
在过去的一年里,随着博客圈的规模翻了一番,Technorati 不得不重新设计其系统。赫兹说,最初它处理所有数据在一个庞大(且不断扩展)的池中。在过去的九个月里,工程师们将数据重新安排在不同的部分。同时,他们使其能够更智能地浏览数据,排序每一部分,以便进行交叉引用。例如,这篇文章可以与我作为博主、与 Blogspotting、与 BW、与 Technorati、与搜索行业以及与任何链接到它的你们相关联。这些关系每一个都有意义和价值。但提供所有这些维度为博客搜索增加了一层又一层的复杂性。“一般来说,我们的流量并不是主要的限制因素,”他说。“而是我们管理的新数据量。”
新服务将继续增加复杂性。未来,赫兹表示,Technorati将根据博主的专业领域进行组织,甚至可能对他们在某些主题上的权威性进行排名。(想象一下这将引发的争议:一位博主写了一篇文章抨击英特尔的新芯片,而另一位在Technorati中排名更高的半导体博主则对此进行反驳。) 对于许多人来说,面对大量博客数据时,第一反应可能是增加服务器。这是最简单的部分,赫兹说。“这里的关键是当我们必须将事情拆分成小块,或者发明全新的系统来进行数据管理时。”
更重要的是,博客搜索引擎与谷歌不同,必须不断更新这些数据。它们提供了时间流逝的视角。昨天,随着伦敦爆炸事件的发生,流量激增,给Technorati系统带来了压力。Technorati昨天处理的新帖子数量预计将达到120万,而不是通常的80万。
我将在这里附上笔记,供想要阅读更多的人。下载文件