2005 搜索引擎会议的幻灯片发布了

Presentations from the 2005 Search Engine Meeting are Now Available Online(via WebLeon

Yahoo的Jan Pedersen的Internet Search Engines: Past and Future,在What's New中提到说是垂直搜索,这包括了图片搜索,产品搜索,地方搜索,还有个人(化)搜索和、桌面搜索,还有一个就是Y!Q代表的那个什么搜索来着?

如果再往远点想,是不是还应该有音频/视频搜索?

微软的Susan Dumais谈的是Personal Information Retrieval: Helping Finders become Keepers。其中说道信息的重用很重要,但是发现信息的工具不少,而keeping信息的工具却鲜有;现在的信息技术的发展让个人信息库越来越庞大,种类也越来越多。

伊介绍了SIS解决方案。听上去像是桌面搜索,不过和它的最大差别在于,这个SIS对于每个数据内容有着丰富的元数据描述,因此除了全文搜索之外,还有更灵活的元数据的搜索方式。

演示片里面还提供了SIS试用的用户数据调查,其中的用户查询行为特征很有意思,平均用的关键词是1.6个,只有约7%的人用到高级搜索。看来人们都是倾向于用最简单的方式直接获得结果,有趣的是,似乎目前的搜索技术也能让人们达到这个目的(为什么呢?)。调查还发现,用户在使用SIS后,明显减少了对Web、电邮和文档的非SIS搜索方式。

在搜索结果的排序选择上,用户更多的是使用时间线索,对于metedata,重要性看上去随着文档类型的不同而不同。

演示片中对比了Timeline和landmarks两种方式。然后强调了contextuilazed搜索和一个叫implicit queries的搜索,后者看上去是发送电子邮件给相关的人请求协助,似乎是将搜索延伸到人/专家/社会网络中。

文中提到的不少东西应该已经应用到MSN的桌面搜索了。

我的问题是,像我这样,既有本地资料,又有网络Web服务中的资料的用户,这些搜索服务如何能够统一桌面搜索和Web搜索呢?比如同时能够从Gmail、Blog、Furl、Del.icio.us还有搜索引擎以及本地的各种资料管理程序和文档中获得结果?

还有,有了这些搜索工具,用户自身对信息的整理是否就不必进行了?或者反过来,这些工具对于我来说,在个人信息的管理上有没有什么值得我去反思和改进的?

Scirus/Elsevier的Ammy Vogtlander做的演示稿:Structuring the Unstructured Web for Specialized Searching。伊说搜索引擎收录的内容中,目前大约有1.6亿的学术性的网页,3000多万份来自valuable源的文档。对于这些结构性很强的内容的搜索服务,是个颇有潜力的市场。