两个新的搜索服务站:Teein和8fang

Google、Baidu之类的搜索引擎能够搜索海量的信息,但在时效性方面往往不如人意,一个事件出来,往往需要两天左右才能看到许多来自民间网站的相关内容,而且还不够全面。

在这方面,新闻搜索、Blog内容搜索和论坛内容的搜索就有很强的替代性。但是新闻搜索绝大多数来自主流的商业媒体,内容大同小异而且无味。还不如Blog和论坛中来自民间的大量信息便捷有趣。因此,可以想象得出,如果能有这两方面动态内容的搜索,那是让人多么惬意的事情。我可以订阅某些关键字的搜索结果,那么,这方面的新的动态就可以随时掌握(取决于服务商抓取信息的频度)。

骆逸在中文Blog心得集发布的针对RSS内容的八方搜索引擎和最近在网上出现的号称搜索1000个中文论坛版面的30,000,000篇帖子的Teein就给人们带来了这种方便。

不过,Blog内容(不包括一些商业媒体提供的新闻RSS摘要)的搜索和论坛的搜索又有些不同。前者的搜索把用户带到一个人/Blogger那里,从那里了解信息的同时也可以认识到这个人。而论坛的搜索把用户带到一个公共的讨论地方,带到信息那里。这方面,我个人更喜欢Blog的搜索。不过这种情况可能随着RSS来源范围的扩展而被稀释。

其次,论坛中的信息良莠不齐,搜索的结果很多没用。而在Blog搜索中很少会有这种情况,因为几乎没有人会在自己的Blog上制造垃圾。在Teein和在Feedster那里搜索Gmail,感觉质量上就有些差异。

-------------
尝试了在8fang中搜索,有个奇怪的问题:用“的”字搜索的结果是1319项,用“如果”搜索的结果是2672项。很有趣。该服务只提供300个搜索结果。

继续阅读两个新的搜索服务站:Teein和8fang

[ 学习]为什么要分类

KMWorld,Why categorize? Susan Feldman 。

文中说道分类之所以重要的原因:

- 浏览和搜索是两种不同的信息搜寻的方式。在任何一个好的信息存取系统中,这两种方式应该得到协调。

- 改善搜索的准确性。通过添加主题标注、主要人、事、地等信息到元数据中,这无疑为搜索引擎提供了额外的信息提升搜索结果的关联度。

- 搜索引擎能够使用分类来判断所搜索的具有多义的关键字的准确含义。

- 将搜索结果按照主题分类呈现。用户能更快的根据自己的兴趣找到需要的内容。

三种分类形式:

- 人工分类。
- 计算机自动分类
- 混合分类

后两种分类中用到的技术:

- 群集(Clustering)。代表:Vivisimo

- Rule writing(??)。代表:Factiva

- 机器学习系统。

- 语言或语义基础系统。

- Faceted navigation(??)。Endeca and Siderean

提供分类产品或者技术的公司:

Access Innovations Autonomy ClearForest Convera
Copernic Documentum EasyAsk Endeca Entopia
Factiva Fast Search and Transfer InMagic InQuira
Interwoven Inxight Language and Computing Lexalytics
Mercado Nstein OneSource Recommind
Siderean Stratify Verity Vivisimo Zylab

继续阅读[ 学习]为什么要分类

Wetaste 推介

Isaac正式介绍了Wetaset项目。这是一个很有趣的应用,使用它,人们可编辑并保存自己的文摘,同时将该文摘的网址收藏起来。听上去类似Furl.net,不过,和Furl.net的集中式服务不同,Wetaset是分布的、耦合的服务的结果,它的文摘存放在Wetaset.com,而分类或者目录的管理,由Del.icio.us完成。它们的这种结合,弥补了各自的缺憾,Del.icio.us只能分类存放网址和简单的描述,对于内容,则无能为力,现在,通过Wetaste得到补足。而Wetaste.com只存放文摘内容,并不提供用户、类别、目录等的管理,全部使用Del.icio.us的API外放到Del.icio.us去,极大简化了Wetaset的开发和维护。

Wetaset的使用很简单,首先,你必须是Del.icio.us用户,然后到Wetaste.com将它的快捷书签加到浏览器以后,看到好的内容,先选中,之后点击该书签,选中的内容自动进入Wetaste编辑区共编辑,整个标记工作完成后,发布就可以了。建议大家像Isaac那样创建一个文摘类别专门用来收藏自己所收录的内容。

我期待Wetaste将来能够提供如下功能:

- 我的文摘的打包下载。Del.icio.us可以备份到自己的机器,人们当然希望自己的文摘也能够保存到自己的机器上,而不是一直在Wetaste.com中。可以这么实现,用户输入自己的del.icio.us中的文摘类别的URL后提交,打包程序遍历该类比的所有书签,汇聚它们对应的内容压缩成ZIP下载。

- 最好能有个用户自己的查阅界面。这个实现上也很方便,比如可以是:www.wetaste.com/?username/label,其中username是del.icio.us的用户名,label是文摘所存放的类别名称。该程序自动生成一个带左右框架的网页,左边是书签的目录,右边则是对应的文摘的内容。

- 提供类似Furl.net的摘引自动生成功能。这样当我准备文章或写书的时候,可以用它摘取Internet中的内容,最后由Wetaset为我按照规范自动生成文摘引用。

一些问题:

- 它对blogger的吸引力到底多大,因为blogger完全可以把blog作为文摘的存放地。
- 很多人用本地的软件将内容存放,比如Netsnippets。那他们会想,有必要用Web存放方式么?
- 和Furl.net或者365key.com比较,Wetaste的特色在什么地方?仅仅是标注么?

继续阅读Wetaste 推介

[ 本站历史]被三大中文搜索引擎收录状况

http://www.klogs.org
Google PageRank 得分是 0/10。
Google 被收录了 1,960 个网页。
Baidu 被收录了 6,310 个网页。
Yisou 被收录了 124 个网页。

http://blogs.51.net

Google PageRank 得分是 5/10。
Google 被收录了 3,410 个网页。
Baidu 被收录了 5,900 个网页。
Yisou 被收录了 794 个网页。

上面的记录采用了Google123.net的工具

看来,YiSou收录的最少。差异大的惊人。是否Yisou计划针对Blog也做搜索,否则怎么会对我的这个Blog这么吝啬。

Baidu收录最多,看来不愧是最大的中文搜索引擎。奇怪的是Klogs.org和Blogs.51.net之间的差别,两站的内容大体相当,Klogs.org的历史更短,内容更少些,而Baidu居然收录的更多。让人匪夷所思。

继续阅读[ 本站历史]被三大中文搜索引擎收录状况

[ 学前教育]讲故事与数学能力

一直以来,语言能力和数学能力被认为是两个相互之间联系很少的智能。现实生活中也有很多事情表明语言能力的强弱和数学智力并不相关。

但是今年6月《第一语言》杂志发表的一篇论文提出了不同的看法,他们的结论是早期学龄前儿童的讲故事的能力和将来学习数学上体现出的能力有着很强的关联。

在该研究中,研究人员给一些3-4岁的儿童一本图画书,并要求儿童给木偶讲故事。这本只有图画的书小孩子以前从没见过,他们也没有被要求如何讲,儿童自己发挥。

其中的部分孩子完全不需要大人们的提示、怂恿、鼓励,自如的给木偶讲起故事来,甚至说得很精彩。当然,在讲故事中,儿童们在文采、语法、词汇和句子方面表现出了不同的差异。呵呵,这可是了解一个人的好方式。

两年以后,这群孩子再次来到研究所,被要求完成一组数学测试。研究者发现测试中表现好的孩子同样在两年前的讲故事测试中表现突出。

研究者说“Most strongly predictive of children's mathematical performance was their ability to relate all the different events in the story, to shift clearly from the actions of one character to another, and to adopt the perspective of different characters and talk about what they were feeling or thinking”

所以研究者建议孩子在学龄前积极的发展讲故事的技能,对将来他们入学后的数学的学习有相当大的帮助。

不过,因为不了解试验的具体做法,所以我个人对测试者两者之间的关联保留有怀疑的态度。尽管如此,我还是愿意相信讲故事的技能对数学、抽象等智能的发展的促进作用。

在发展上,讲故事先于抽象思维的出现。因此,讲故事中的一些思维方式,或许就是将来数学、抽象思维中的雏形。

不管怎么说,讲故事的培养总是容易的。

继续阅读[ 学前教育]讲故事与数学能力

Gmail 中的广告的隐藏

看来我是个很粗心的人,看到Remove Text Ads from GMail一文时回过头仔细观察了原先介绍过的妆点自己的Gmail一文,这才发现那张图片所显示的Gmail的界面居然没有了广告!

Google要是知道了肯定不高兴,不过估计他也没辙,因为这是利用了Firefox的特性在本地作的定制显示,应该没有违犯使用协议。

digitalmediaminute介绍的做法如下:

他建议大家安装Chromedit来编辑usercontent.css,在该CSS文档中加入这些语句

#rh table[class=”metatable”]{display: none !important;}
#rh div[class=”c”] {display: none !important;}

之后重新启动浏览器访问Gmail即可。如果没有Chromedit也没关系,搜索以下userContent.css这个文件,用记事本打开它编辑然后保存。

这种方法实际上是利用CSS的特性,将Gmail中的广告内容部分隐藏起来。

看来userContent.css可以充分利用来对待那些讨人厌的网页中的部分内容。

继续阅读Gmail 中的广告的隐藏

Google 本地搜索双剑:Desktop和Picasa

Google的Desktop并不是第一个桌面搜索引擎,不过因为Google本身的光芒,它已推出就备受关注,各大主流IT媒体以及众多的Blogger都作了记录。

一些人把它看作是Google对Microsoft发起的一个挑战。当然,还有有心人对它和另一个桌面搜索引擎blinx做了比较,对Google的Desktop作了批评。一是针对它的Web界面,二是抱怨它所搜索的资源类型有限。

我倒是觉得这两点恰好是G'Desktop的特色了。

首先,这个桌面搜索引擎是Google的Web搜索引擎的直接延续。Google搜索了全世界的Web和一些文档的内容,然后提供搜索,它服务的是大的世界。现在,它把Google缩小,以适应小的、个人的信息世界(本地文档),可以说就是一个Google搜索引擎的缩小版,同时又保证了体验的一致性(使用firefox的人应该会注意到Google的主页上多了Desktop的链接,就是说通过它,网络和本地搜索合二为一)。数字部落那里提到它实际上就是一个Web服务器,使用了127.0.0.1:4664端口。结合6e早前的文章“Google到底打算做什么”,明眼人应该能看出点什么了。

至于为什么不包括图片、流媒体之类的资源搜索,这恐怕要联系到前段时间收购的Picasa。这个图片管理软件本身能够搜索本地的所有图片和流媒体,位之建立索引,方便搜索,并且,它能实时监控所能搜索的指定位置的文件的变化,及时加入索引以准确的搜索,这点上和G'Desktop完全一致。有了Picasa,还需要在Desktop中加入多媒体文档的搜索功能么?

有一点可能和blinkx比较的那个人没有注意到的,G'Desktop才400多KB!!不过它的肚量和blinkx一样大,没有多余的硬盘空间(有人推荐为1GB)的人还是不要安装为好。这是代价。

另外,G'Desktop好像还和最近热闹的IE与Firefox之争有些联系。尽管它对IE也有很好的支持,但似乎对Firefox更偏爱些。想必除了技术的原因之外,也和Google与MS的未来竞争有关吧。

不知道Google在把广告带给Gmail后,会不会不广告也带入到本地的搜索,如果这样,那真的是个伟大的商业创意;D

------

我想,Google下一步是否考虑开发个人大脑信息的搜索引擎??

继续阅读Google 本地搜索双剑:Desktop和Picasa

Del.icio.us 的佐料

del.icio.us很讨人喜欢,所以也吸引了一些开发者利用它的API开发辅助的工具。weblogsinc那里的Del.icio.us redux就收集了几个:

- extisp.icio.us,以可视化的方式显示所搜集书签的类别之间的比例关系。通过它,一个用户的兴趣所在一目了然

- taga.licio.us,一个将del.icio.us整合入自己的Web的Php程序。它的特色是能够选择某些特定类别的书签生成一个页面,也可以嵌入到已有的网页,还能够选择某些时间段内的书签来显示。对于wordpress的用户,还可以用它来自动将搜集的书签作为blog的内容来发布。

- nutr.itio.us,提供一个浏览器的快捷方式来存储书签,它的特点是能够将所选择的文字自动放入到书签的描述框中,不用再做书写,就像Furl.net那样,可以摘取文章中的重要字句保存。

- loqu.acio.us 很有意思。它的介绍中提到“共用一个del.icio.us帐号”,这个主意真是不错,比如一个小组或者素不相识但兴趣相同的人,呵呵,好玩儿。这个loqu.acio.us让人们可以通过或者说为del.icio.us提供了进一步交流(留言)的功能。呼呼,我好像还不大明白。

- avar.icio.us,提供一个存入del.icio.us的浏览器快捷方式。它提供有源代码,兴趣的用户可以在自己的主机上定制。可以考虑为自己也安装一个。每次都重复写些类别之类的真的有些麻烦。

- SID.VICIO.US,有点看不懂。那样做真的好玩儿么??

继续阅读Del.icio.us 的佐料

WebNote 的用法

WebNote是一个Web方式的网络便签程序。人们可以像现实中留下便签贴在墙上、板上那样的使用它。因为它简单而且接近人们的使用经验,所以很吸引人。

我想到的几种用途:

比如将它设置为自己的桌面或主页,就可以当作本地的备忘簿使用,因为是Web方式,所以不论在哪里都能调阅到。

可以作为留言板,在使用人数很少的情况下,一些请求和问答可以在上面交流,这是很有趣的过程。用户的留言可以通过XML的订阅很快从RSS阅读软件中得悉。

甚至能把它用来作为一个简单的主页用。

作者基于网络用户之间相互信任的考虑,在WebNote中不提供密码保护功能。对这点,很多人在使用的时候都有所顾虑。我想,如果把它作为SNS这种信任网络中的一项功能,顾虑就会大大减少,也更能够发挥作用。

希望添加的功能:

提供一个所见即所得的html编辑窗口,这样能丰富便签上内容的表示。

提供多级页面。这就有点接近Wiki了。也可以做个折中,控制层级,比如两层,这样能对内容作分类。

有个便捷的浏览器用的书签,这样一些浏览中需要临时记录的东西就能直接被存入WebNote,无须到该页面这步操作。

简单的修改历史的记录(不是版本记录)。这是密码保护下一种不错的内容维护方式了。

最好能有php版本,python俺装不上:(

继续阅读WebNote 的用法

安装MultiBlog

MultiBlog是MT插件竞赛的获奖作品,由David Raynes开发。

这个插件能让一个MT站内的子Blog相互的调用彼此的日志内容。安装了它,我就能方便的在刻录事的首页显示ZII成长记中最新的日志标题。当然了,用途不止这个。

该插件包含了5个文件。其中multiblog.pl应当放置在plugins目录下,multiblog-config.cgi放在mt程序的目录下,权限设定为755,其他三个文件需要现在exlib中建立rayners目录,然后在放置其中。

之后进入MT的主界面,能够看到通往MultiBlog设置的连接。可以根据自己的需要确定一些参数。并利用它提供的标记模板自己创建引用内容和格式,很方便。

继续阅读安装MultiBlog