Friday, December 14, 2007

 

人工搜索Mahalo.com研究

--James Qi(讨论) 2007年10月25日 (四) 15:29

  为了准备我们未来的关键词搜索Wiki想法,最近找了一些相关搜索网站来研究,我会陆续把研究记录放在日志中。

  先来看看人工搜索的新贵Mahalo.com,这是我目前在网上找到与我们的想法最接近的项目。

简介

  Mahalo是夏威夷语“谢谢你”的意思(Wiki也是夏威夷语,现在网络上世道真是变了,夏威夷语这么流行 Image:Face-005.gif)。

  它是由业内知名的搜索引擎专家Jason Calacanis创建,此人把以前创办的Weblogs Inc以2500万美元的价格出售给AOL,这次在2007年5月30日推出了号称第一人工搜索引擎的Mahalo,引起VC界的关注,刚开始就获得不少 投资。在网上搜索到的一些中文介绍都是6月初发布的,我到10月才开始关注、看到,真是落伍了!Image:Face-018.gif

  下面摘录一点报道中的内容:

  Mahalo 是世界上第一个台人肉搜索引擎,他们由一些热心人提供动力,这些人废寝忘食地将自己的青春花费在搜索上面,帮你过滤掉垃圾信息,手工编辑最佳的搜索结果,而且如果没有你需要的结果,还可以向他们提交搜索申请 ……

  Mahalo 不收录的网页:

  Mahalo 收录的网页:

  上面是他们自己介绍的,虽然翻译得不好,但它其实是一个严肃的项目,创建人是搜索领域赫赫有名的 Jason Calacanis。这一项目的原动力在于,虽然搜索词是不可限定的,但事实上有一万个搜索词占据了所有搜索 24% 的份额,人工编选的结果和机器搜索其实是很容易很出来的,而那 76% 的“长尾”,就留给 Google 好了。

  CNET 对它的评介是,搜索结果匹配度非常地高。

Mahalo首页

平台

  打开他们网站 http://www.mahalo.com 看看,因为我成天接触Wiki用的MediaWiki软件,所以马上就发现该网站所用平台与MediaWiki惊人相识,同样有Category、 History等,今天上午再仔细看看,确实就是用的在开放源代码软件MediaWiki基础上修改过的系统做为平台(这点上与WikiHow相同),不过他们修改的幅度比较大,主要是适应他们的一些特点,例如不允许浏览用户编辑但可以推荐和讨论,也增加了很多插件来实现他们需要的功能和界面。

  页面打开特别快,不像其它一些国外的英文网站打开很慢。我故意打错一个链接,看到Squid出错的提示,看来也是用了与MediaWiki配合做缓存的Squid服务器。

  使用MediaWiki平台来做各种网站项目确实是个好的办法,上面的两个例子网站都是很知名的了,我们自己现在也是这样做,但我们现在还没有找人来进行针对性开发,以后是需要的。

内容

  该项目目前是全英文的。

  首页上有一个搜索框,然后下面是分类及热点文章。

  5月30日推出的时候有4000个关键词,当时说到今年年底准备做10000个关键词。

  我在页面底部看到“Mahalo's goal is to hand-write the top 20,000 search terms. ”,也就是他们准备做20000个搜索量最大的关键词出来。

  从已经做好的文章内容来看,质量是没有话说的,远比通用搜索引擎(例如Google, Yahoo!等)给出的结果好,到底是人脑厉害!Image:Face-002.gif

页面

  进入一个典型的关键词Paris Hotels页面后,看到:

Mahalo例子Paris Hotels

上方

  包括:

左侧

  包括:

右侧

  包括:

下方

  包括:

组织

  他们招聘有40位专职的编辑人员,另外通过 Greenhouse 招收业余兼职编辑,每篇符合要求的文章付费10-15美元。对编辑人员进行分级别。

  按照他们自己的说法,写一篇文章一般需要几个小时。然后还有定期的后续维护。

  给编辑人员的帮助我重点看了看,包括编辑内容的质量要求、格式的编排、准备的模板等,准备得还是很充分的。

其它

  其它的一些了解到内容:

Labels: ,


Comments: Post a Comment



<< Home

This page is powered by Blogger. Isn't yours?