美味书签的聚类工具


delicious-clusty, originally uploaded by Zheng XiaoYun.
----------

Kai Bielenberg开发了一个工具,它采用K-means聚类方法,对用户美味书签中的标签云进行聚类。所希望的类别数量可以由用户指定。

上图截自我的聚类结果。

这里涉及到统计学,不是我的所长,嘿嘿,有点晕。

对了,gary,你那两篇土豆哪吒计划已经拜读,很是高深,到现在还没完全解透。等理清楚了,再和你讨教。

继续阅读美味书签的聚类工具

标签可视化分析工具

GrafoliciousCloudalicious是两个对美味书签的标签(云)进行可视化分析的工具。

前者以时间为X轴,以收录次数为Y轴,显示了随时间变化的收录状况(右边的橙色数轴是啥意思?)。同时还列出了特定URL下的所有标签和用户。

(试试news.google.com这个网站的del.icio.us收藏,那个标签云可真是让人打开眼界。我想有些人一定会以此为证据,来说明标签使用上的随意性。可我不这么看,他们都有意义,只不过有些标签的意义针对的是某个人而已。话说回来,如果担心因为标签的私人性过强,无法得到分享的话,那么想想这种情况,一是你所看到的信息体不是就你一个人看到,那么其他人也会看到并可能标注,你可能作私性很强的标签,但不可能所有人都如此做;二是确实就你一个人收录,这说明信息本身只对你个人有价值,还没有其他人发现,那它不被共享到也是可以理解的。)

后者也是以时间为轴,标签的使用次数和总用户数的比值为纵轴,显示了随时间变化下各个标签的权重变化比例。

Pietro用它来分析标签云和文化变化的关系

不错,从对标签云中各个标签的消长,可以看出趋势和文化上的一个改变。也就是说,标签系统是一个很好的观测趋势的地方。不过问题是,如何观测呢?

Pietro是举特定的例子,从后往前推的方式来说明,如果面对的是del.icio.us,由机器来做的话,该如何做?

还有,Cloudalicious图的左半部分似乎不是很有意义,因为才刚收录,几个标签的比例自然特别大,到后面逐渐下降,才趋于正常。我想,是否可以有个更为合适的统计来计算这个权重呢?

想中...

继续阅读标签可视化分析工具

东施效颦的百度标识图

最早在duduwolf那里看到百度推出辛弃疾的纪念标识图,今天再topku那里也看到。Topku说“我感激总有一个声音在相互鼓励,“坚持下去,终究会找到自己的特色”,差点没让我噎着。

Google利用标识图来纪念一些特别的事件、人或者庆祝节日等,这是Google个性的表现,而它所选择的那些人、事、节日,表现出了Google作为一个组织体的趣味取向,它所使用的图,凸现了它的文化底蕴。

而作为后来者的百度,学Google使用标识图。这就不是个性了。不仅不是个性,还更糟糕,百度是从Google那一招的公共关系和形象效应中看到好出去学的,以利为出发点去做一件事情,和以自己的趣味喜好去做一件事情,则是差得远了。

昨天百度推出的辛弃疾的纪念标识图(很奇怪,我如何刷新都看不到),看来策划这一标识的团队,甚至是百度挺高兴的,自我感觉挺好,估计还为自己的小创意骄傲的不行。

可是,我却觉得这个标识相当的糟糕,本来没文化吧,作自个儿的事情,也没人说啥,现在附庸风雅,还打着民族、特色的旗号,反倒把自己没文化的商业脾性露了出来。

为啥这么讲呢。

第一,拿Google作为对比,它选梵高、费舍尔、爱因斯坦,地球环境日等,是因为这个组织的确有着这样的趣味和责任。

百度选辛弃疾,我实在看不出其中有文学的趣味在其中。如果单纯讲文学的话,比辛弃疾成就高影响力大的古人多了去,为啥没有呢?原因很简单,他又“众里寻她千百度”一句,这说明百度的选择只不过还有些良心(百度这一词就是用了稼轩的词)的纪念,而无其他。

第二,与其说是纪念,不如说是变相的广告宣传。

道理很简单,Googel的标识图,是把所要纪念的人、事的主题特征体现在Google的图形变换上。借助自己的标识来纪念。

百度昨天的标识呢,如果真的是要纪念,就应当选择能代表辛弃疾成就的词来(他的青玉案・元夕虽然好,但不是代表),可是我们看到没有,不知道是不是百度团队对他的词不够了解,还是故意不用,就取“百度”这首?

选就选吧,还要在图上把百度一词加注红色。哪有这样纪念人的?显然不够诚心,也把自己的司马昭之心现了出来。

不知道即将到来的端午节,摆渡是不是要在屈原或者粽子上标上百度?

还是学学Google吧,收收利益熏心,多读些书,多充实充实,想想怎么用所要纪念的物事人的特征来变化自己的Logo,而不是借用他们来凸现自己的百度。

----------

对了,还有那个“有问题,百度一下”,可真不能上当。为啥呢,就凭百度和政府的关系以及百度用钱来排列搜索结果,谁还敢用?

继续阅读东施效颦的百度标识图

RSS 源出了问题

不知道为什么,烧制在FeedBurner中的每日美味书签的RSS居然乱码,乱得没有章法。

在乱码问题解决之前,暂时将我的美味书签的内容分离出Klogs.org的RSS。带来的不便,请见谅

如果我的美味书签对你有帮助的话,还烦请移步

http://del.icio.us/rss/Zheng

查看FeedBurnet的统计信息,查阅量大涨了近一倍,贡献居然来自一个Potu的RSS阅读器(该网站访问不到),占了54.9%,没道理呀,测试就测试呗,访问这么多干么;(

图片来自duduwolf的flickr图片集


codehtml
Originally uploaded by duduwolf.

继续阅读RSS 源出了问题

我对三个标签问题的理解

Tag不适用个人信息么?

勤于深思的Aether在自己文章Tags,无序,分类和家族相似后的留言讨论中说:

“因此仅仅在一个个人Blog的内部,为区区数十上百条信息建构相对散秩的Tags,实际意义不大,因为对于少量信息人为的分类应该已经足够;而通过统一的标准加以组织、集中和聚合,才有可能形成有效的规模;”

我的意见相反,至少在Blog中,意义很大。

就拿内容网站来说,有两种情况。

一是原有内容的呈现。这种情景下,可以很容易的对原有内容做出个分类来。

二是限定好了,就做某些类型的内容,这样的话,分类也是相当方便的。

但是,对于个人的Blog来说,它是一种面向未来的书写,而不是对过去信息整理的呈现。未来不可知,更不可能被限定在原来的分类框架中,除非我们要固执的活在过去认定的一个枯燥如欧氏几何的世界中。

标签给了我们通行向未来的自由,也给了我们的思维更不受束缚,因此也更广阔的空间。

这是理由之一。

第二个理由是,所有的标签需要人来做。这里不可能雇用类似图书管理员那样的人来对数以万计的信息题作标签,它需要的是一个群体中的每个人基于私人利益的参与,也就是说,标签首先是适用于个人的信息体管理,在此基础上才有Folksonomy的精彩,就如同有个人为自己谋利,才有完美的市场一样。


对个人标签膨胀的担心

大卫

“资源相对较少,tags也有限。如果信息膨胀到一定程度的时候,tags会随之膨胀,试想,如果索引条目超过1000个,读者将如何索引资源?这个时候,层层递进的分类形式要比平等的tags分类更加有效!但个人的blog信息也会不断膨胀,也会出现类似的结果。”

和上个问题一样的道理,层层递进的分类形式针对的是过去,是静态的信息,它无法面对动态的,不断增长着的信息,因此,要想让它有效,成本相当的高,最终的效果也不是很令人满意,这也就是IBM在实验将Folksonomy用户企业知识库的管理得缘由之一。

大卫文中提到的是“读者”,我觉得这里似乎有个误解,就是大卫认为使用标签的目的是为了读者。恰恰相反,它首先应当满足自己,至于是否满足读者,那是另外的话。从个人的角度上,个人的标签集(或许用标签云更合适,因为它在变)是个人知识的地图,一个人对于自己的地盘怎么会不认识呢?有些人个人知识空间小,有些人个人知识空间大,反映到标签上,前者少,后者多,多的人并不会比少的人更不便,因为所有的细节都在自己的胸中。不是么,那些博学的人并没有神经错乱。

对于群体的标签数目过多的担心同样的不必要。

从群体,也就是Folksonomy的角度,读者面对的标签多,恰恰是好处。正是标签数目的多样,才使得不同学识和阅历的人,能同样平等的适用自己的经验、知识、常识和判断得到自己的信息体。它是信息民主和平等的体现,也是信息体原貌的呈现。本来一个信息体,对于不同的人就有着不同的理解,恰恰众多的标签的存在,给了不同人群从不同角度抵达的途径。

用户的标签很随意?

undersound在语言和标签中说“既然是自定义分类,那么必不可免的存在语言中根本的问题:随意性。任何一个用户,从心理角度上说,都是随意的,只是在最后达成社会性一致。同样的文章我可以定制无数的标签来。”

这应当是从信息体创作者的角度来说。信息体的创作者真的会这么随意的使用标签标注么?前面说了,标签是自利的行为,因此创作者不可能那么随意,如果标签系统像公共草地那样,倒是有可能发生随意甚至是垃圾的现象。但如果标签系统是给个人自用,那就不一样了,没有人愿意把家里弄得乱七八糟,除非是缺乏生活自理能力。

从我的个人经验来说,在查找很多“专业”信息的时候,我都优先考虑使用美味书签,然后才是搜索引擎。不止我一个人对比过,对于一些内容,美味书签得到的结果要比Google之类的搜索引擎好的多。

当然了,它没有Google那么多的结果,但问题是,我们真的是需要所有的信息么?我想不是,我需要的信息只是那么几条而已,既然已经找到合适的,为啥还要苛求拥有全部呢?

继续阅读我对三个标签问题的理解

podcast 的中文译名:随身播

hopesome对雅虎新闻中一篇“一播到底”的报道颇有不满,再说(起)podcast的中文译名来

他在该则日志中列出了几个候选译名:

1、 波刻 2、 播波 3、 网播 4、“聚播” 5、 “广波” 等

上面的这几个,我都觉得不大合适。

Podcast为两个部分组合而成:Pod和Cast,前者取自苹果公司的便携电子音频播放器iPod,后者是播放、播发的意思。所以,取为“X播”比较合适,比如boardcast为广播,webcast为网播,screencast为屏播。

那podcast改为什么播呢?如果iPod也有中文名称的话,倒是可以参考以下,可是他们还没有中文产品名出来,如果取Pod的豆荚之意,也不大合适。看来只有从iPod产品本身的特点来看了。其实,podcast虽然源自iPod,但是听取podcasting的设备不止iPod,只要是mp3播放器都可以。记得以前对于便携的播放音乐的设备叫“随身听”,这倒是不错的名字,应当也可以扩展指称Mp3播放器。

随意,podcast叫随身播倒是很贴切,不仅指出了它涉及的设备,也区别了网络电台,因为podcast的一个很重要特点就是可以离线随身随时播放

对于制作Podcast的人,仍旧叫“播客”也可以。不过现在叫“客”的太滥,播客也不算好的选择。如果借用电视台的“主播”,我想可以把这些人叫做“话播”,呵呵,不妥不妥。

继续阅读podcast 的中文译名:随身播

幂次分布的社会性标签之二

幂次分布的社会性标签贴出了两条URL的标签的数量统计图。

两个月过去了,两条URL的收藏数量也发生了变化,Flickr Related Tag Browser从原来的384个收藏发展到现在有901个收藏。de.lirio.us从325人收藏发展到528人收藏。

随着收藏人数的增加,各个标签所占数量和相应的位置也发生了变化。

那么,这种变化是否影响到幂次曲线的变化呢?

下面的两张图是重新做过的,我个人直觉曲线的形态上仍然保持着一致,公式的变化也不大。

Flickr Related Tag Browser

下面是三月份的图:

Fiickr这个各个标签数量排序上的变化颇大。

de.lirio.us

三月份的图如下:

---------------
作上面这两张图是受On Tag Clouds, Metric, Tag Sets and Power Laws 一文的启发。

该文中的标签集标签云的概念我很喜欢。正是标签云的存在,才有了folksonomy之上的千丝万缕的奇妙联系。

文中还提到一个特别值得关注的问题,就是时间中标签云的变化(真的像是云彩的变幻),以及变化的原因和所透露出来的暗示。这里面我还有好些事没弄明白,赶明儿在读过一遍。

继续阅读幂次分布的社会性标签之二

让自己喜欢的BLOG多一份生存的机会


PPTlog
Originally uploaded by Isaac Mao.

车东说“寄存中文网志项目就是让自己喜欢的Blog多一份生存的机会。很棒的阐释。

以下为引用:

“出于对言论自由的信仰,我们发起了资助中文Blogger网志空间的项目,希望能通过我们以及互联网上有相同信仰的朋友们的资源的分享,帮助在自由表达上存在压力的中文Blogger们在海外找寻到相对较为安全的网志空间,继续他们没有顾虑的书写。

此项目无意于与中国大陆的政府或者政策作政治上的对抗。事实上,这个项目的希望去帮助的Blogger并不仅限于几个特别的国家,它是无国界的、全球性的,至少我们希望如此:让人们自由的表达,无须顾虑自己的网志可能被关闭的命运。 ”

如果您或者您的朋友有能力提供帮助,如果您因为blogging受到了压力,那么,请参与进来吧。

项目临时网址:http://projab.jot.com/WikiHome/Chinese

此项目仍在beta中,欢迎提供更多的建议。

继续阅读让自己喜欢的BLOG多一份生存的机会

关于Blogbus的tags介绍

Blogbus的“What's tags”这样介绍tags:

Tag(标签)是一种更为灵活、有趣的日志分类方式,您可以为每篇日志添加一个或多个Tag(标签),然后您可以看到BlogBus上所有和您使用了相同Tag的日志,并且由此和其他用户产生更多的联系和沟通。不仅如此,我们还通过与Technorati的合作,把您的Tag发送到全球Blog空间,和全世界的人们共同分享...Tag体现了群体的力量,使得日志之间的相关性和用户之间的交互性大大增强,可以让您看到一个更加多样化的世界,一个关联度更大的Blog空间,一个热点实时播报的新闻台。Tag为您提供前所未有的网络新体验……

注:重点是我自己添加

我觉得那样表述对用户来说是个误导。不止blogbus有这个问题,其他几家服务站也有类似的思路。他们都是希望通过标签的引入来增强用户内容之间的关联,为服务站的社群的创建带来便利。

在我看来,标签不等同于Folksonomy。标签应当是服务商为每个用户提供的一个功能。它的目的并不在于产生关联的内容社群,而是在于让用户更自由的管理自己的内容。

且不说gmail、picasa中的标签的使用。就说我在flickr中的图片的标签,它们仅只对我有用,其他人通过标签时看不到我的图片的。但这有什么关系呢。我用标签并不是为了分享,而是为了组织我的数据,所以,我想怎么标注那是我自己的事情,我不想加入公共的社群应当是我的自由。

现在,Blogbus把标签组织数据的本质功能放置一边,而强调了它的“有趣”,不恰当的夸大了标签的社会性。使本来很好理解的标签变得突然陌生起来。由于陌生,也就带来了种种不解和“混乱”。

用户使用标签的“混乱”又给服务站的社群建立带来了好些阻碍,于是服务站就要想方设法的干涉用户对标签的使用。结果是好玩儿的标签变得越来越没趣儿,成了为他人做嫁衣裳的工具。

没有个人的自由,完美的市场经济不会出现,没有个人对自己福利的最大化的理性追求,也就不会有最佳的社会效率。

同样的,对于使用标签功能并希望以此创建社群的服务站来说,没有为用户个体着想,提供一个可以让他们自由发挥的功能,很难想象会有一个“完美”的社群浮现。计划经济下没有什么好东西,虽然类比不是很恰当,但是过多的以服务站/社群的角度来考虑,结果是可想而知的。

(对用户来说,如果他们使用del.icio.us或者flickr的服务是从加入社群的角度来考虑,那么会产生出种种抱怨,但是如果从使用他们个人服务的角度来看,却会相当的满意)

这点上,美味书签和Filckr非常值得学习。他们首先是为个人服务的,标签也仅仅是面向个人的一个功能。但是因为标签本身的特点,自组织的浮现出了folksonomy的社群,这是后话了。也正因为对个人的重视,才使得他们的社群那么有生气。

试想,如果他们一开始就想要做一个社群,做一个内容站,内容哪里来?让用户提供,怎么关联起来,使用标签,这种思路下,del.icio.us和flickr会是什么样子?

介绍中说到“和technorati合作”,这让我想起前段时间看到过的一个网站,说自己和Google合作,其实也就是申请了Google的Adsense广告。呵呵,看来我也应当在自己blog显眼位置标上和Google、Yahoo、Microsoft、工商银行、Skype等合作;D

我想Blogbus没有必要借technorati来唬人吧,更何况blogbus的用户中几个人知道那个technorati呢?

继续阅读关于Blogbus的tags介绍

filangy 搜索模式

临时用画图程序画了张关于Filangy的图:

这里,搜索的信息库分成了两种,一是来自搜索爬虫的搜集,而是来自人/用户的分拣。

人的分拣包括了两个部分,个人的搜索数据和建立在个人相互分享合作基础上的社群搜索数据源。

而个人的搜索数据来自两个方面,一是自己收藏的,而是自己阅读过的。

对于Filangy来说,除了提供一般搜索到个人搜索之外,还借用户的标签的标注,结构化了所受纳的数据资料。

我估计Filangy的这种模式会在明年下半年出现在现今的主流搜索服务中。

继续阅读filangy 搜索模式

添加了tag this表单

feedster19日的网志讲了“Future Salon and Feedster Tagging Prototype”。文中提供了MT下的代码:

<form name="tags" method="get" action="http://bookmarks.feedster.com/submit.php">

<input type="text" name="tags" size="15">

<input type="hidden" name="uri" value="<$MTEntryPermalink valid_html="1"$>">

<input type="submit" value="Tag this">

</form>

有了这个表单之后,浏览者可以自由的标注标签了。什么也不填点击tag this按钮的话,可以看到该文的所有标签。

这个思路相当不错,特别是和RSS搜索引擎结合起来,这可以加强它的搜索功能。估计不久之后,人们也可以用上feedster的标签搜索了,不过这个和technorati有点不大一样,后者是作者自己添加的标签,而feedster则是来自阅览者(作者自己也可以添加)。

可是,加完标签之后呢(要不要在首页和RSS源中也加这段代码呢)?找了半天,没看到能有啥具体的作用。看上去似乎Feedster还没有完成bookmarks.feedster.com的功能。

期待中。

继续阅读添加了tag this表单

标签和关键词

标签的背后的网志中提到些关键词和标签的差异。

今天又想到些差别:

关键词可以使用的范围仅限于文本内容。而标签不同,它不仅可以用在文本内容上,还可以用于其他电子数据对象,比如图片、比如音频、比如视频,甚至是网站、软件、服务等,不只如此,它甚至可以应用在线下的任意一个对象。在这点上,关键词可是望尘莫及了。

很多人在提到关键词和标签的时候,总会把它们混起来,实际上可以混同的重叠领域很小。在美味书签或者365key中被设定的对象多种多样,有文章,有网站,有软件等等。

即便是在这个重叠的文本领域,标签也比关键词灵活得多,关键词多是针对内容本身,针对的是主题。做过图书编目工作的人应该很有体会。而标签可以针对主题,但未必是受限于文章的内容本身,而是来自读者方面的理解,即便这种理解偏离文章本身所传达的也没关系。

此外,标签可以未必针对内容,也可以针对形式,比如可能我将一片文章的标签设定为评论或者新闻或者思考等等,这些字眼却绝对成不了关键词的。

继续阅读标签和关键词

标签和链接

Ken Norton认为“The web is full of tags”。他说的这个标签不是metadata,而是超链接,因为超链接文本链接到了互联网中的某个电子数据,同时也描述了该数据。从这点上来说,还真有点像,标签也描述了某个电子对象,并且指向了它,和超链接一样,实际上它就是借助超链接,让人们可以迅速的访问到。

且不说Norton的观点是否合理,还真奇怪,居然有人做了一个标签和超链接结合的有趣玩意儿:tinky.org。它的工作原理是这样:

使用tinky的链接跳转服务来作超链接,而不是使用目的数据的URL链接,比如说用http://tinky.org/tag/blog,blogosphere,china?http://blog.cnblog.org 来链接中文网志心得集,有人点击这个链接之后,使用逗号分隔开的标签会自动被tinky收集,然后呈现在它的页面。

浏览者可以在tinky.org那里看到通过标签标注的网站/网页集和。

我很喜欢这么个创意。不过说实话,它不实用,因为没有好处来激励人们这么链接,不像美味书签,人们首先可以获得自己的书签管理服务,有了这个好处,自然也就有了标注资源的动力了。

不知道做点小改进是否能改变这种情况:以域名为标识,列出所有链接的网站。这样我可能就会通过它的服务存放我所链接的内容,在一定程度上说它们应该也算是书签,而tinky也就提供了书签服务,一个优势是它无需注册和登录就可以使用,也算是方便。

对了,动动脑筋,它还真能成为一个很好的标签服务:按照tinky建议的链接方式,用blog来记录每天收藏的内容,然后通告到tinky那里。

继续阅读标签和链接

Filangy 仔细使用之后

下午花了些时间认真地用了Filangy,发现我原先的认识有些问题。

Filangy实际上是一个社会性的搜索服务,而不是书签或内容存储的社会性分享服务

对Filangy来说,主要的也是特色的功能是Webcache,Webmarks则是次要的。

这个WebCache,就是通常所说的浏览的历史记录的搜索。用户在安装了工具条之后,什么都不用作,所有浏览过的页面都会被记录下来,它保证一些私人信息不会被记录,这些历史记录不能按照时间顺序来查阅,而只能作为数据源被查询。工具条也不是自动的记录一切,必须要登录后才发挥作用,如果用户不原意被记录的浏览历史的话,大可不必登录,或者登录之后在工具条上点及30分钟内不记录的按钮来保护自己的浏览隐私。

而WebMarks呢,则是针对那些有参考价值的内容,人们可以添加标签和笔记。但它和Furl不同,后者是以收藏为目的,因此提供时间顺序上的查阅。WebMarks没有办法按照用户收录的顺序来显示,从这点来说,它的目的也在于增强用户搜索的个性,并按照使用的程度来排序。

显然,WebCache库的内容要比WebMarks来的多。

比WebCache来得更多的是自己的联系人组成的群体所共享的Webmarks的数据源。

比这个群体更多的,则是一般意义上的Web搜索。

比WebMarks少的,是标签内的搜索。

可以看出,Filangy给用户提供了一个从Web到社群再到个人的全尺度搜索选择,让用户自主的决定信息获取的来源范围。

个性化搜索(如A9.com)+社会性搜索

(del.icio.us的数据,包括用户之间的关系,可以拿来作为社会性搜索用:比如这样的社会性搜索,不必像filangy那样让用户来建立组群,直接通过api从del.icio.us那里获取。从这点来说,del.icio.us可能会自己发展出搜索服务,也可能被收购用来发展社会性搜索)

------------

俺在Filangy的用户名:yunshen 。

继续阅读Filangy 仔细使用之后

Filangy 的社会性搜索服务

看到Ken提到filangy,忍不住又想多做点介绍。

http://www.filangy.com

我把它称为社会性搜索服务,因为它首先是为个人提供个性化的搜索,再次基础上,用户能用filangy建立一个社群,在社群内共享彼此可以搜索的内容。

使用它,需要下载一个工具条,目前IE和Firefox都支持。

用户通过这个工具条,可以将自己喜欢的内容收藏起来(不仅是网址,还包括了对整个页面的收录),它叫做Webmarks,这个Webmarks的内容可以在任何地方访问,因为它类似furl.net那样,为用户提供了一个存放的空间。

filangy提供的标签(Tags)功能来标注所收藏的内容,并且可以对内容作笔记存放起来。同时允许用户对收录的内容设置私有还是公开,如果是私有的话,只能自己看到,即便自己的联系人也无法查阅。

filangy能够将系统内有趣的用户添加为自己的联系人,此功能的好处在于可以通过这种方式扩展自己可靠搜索的范围,也就是说不仅能够搜索自己的收录,也能够搜索联系人的公开的收录。这种基于兴趣、信任以及人的智能判断的搜索,在用户数量足够的情况下,应当会比搜索引擎来的更准确,这点上有点类似eureskter。

用户还能创建群组,这是针对各自的联系人群的,就是给联系人分组,为什么要分组呢,因为我兴趣的联系人非常多,有些侧重软件开发,有些侧重童话,有些侧重科学探索等等,分组以后,就能够针对具体的搜索内容包括进特定的群组,比如我想搜索童话的,那么就只选择童话群组进入搜索范围内。

除了Webmarks之外,目前测试的还有一个叫做Webcache的功能。这个部分是绝对私密的,通过工具条,filangy能够收录浏览过的页面,用户借助Webcache,就能在浏览的历史中搜索了。不过它上面好像有个Webcache的联系人,估计可以自己设定Webcache的开放程度。

其他辅助功能有,导入Firefox、IE浏览器中的书签,甚至可以将Furl.net中导出的文档导入到filangy。RSS源得导入,看来可以通过它备份自己的内容了?del.icio.us中的美味也可以导入。

导出方面,可以生成一段脚本,嵌入到自己的Blog中显示。

据说在未来几个月,它还会推出更多的功能。(一些功能需要用户提供足够的数据后才会出现,嘿嘿)

filangy和furl等的不同再于,前者包括了后者的功能,比如webmarks就相当于页面的存储。但filangy更强大,它实际上是让用户能够建立起自己的网页索引库,因为它会收录所收藏的站点,比如news.google.com上的所有链接,而且会自动更新:它的索引库不完全是让爬虫到处跑,而是在用户限定的范围内抓去。

存在的问题:

- 过于重视通过邀请建立的社群,而多少忽视了filangy用户群体内社群的建立。因为它的页面呈现的公开的收录非常少,也没有一个页面让大家去浏览,就像del.icio.us、furl.net或者365key.com那样,通过浏览某个标签或者最新的内容,发现自己的同好。或许在将来的版本中他们会改进吧。

- filangy同google等搜索一样,会出现很多的干扰。就拿我搜索播客一词来说,只要页面上有这个词(实际上是作为相关新闻的标题出现),就全部被列出,结果blogchina相关的页面全部被看作符合结果,因为播客时它的页面上的一个栏目。(要解决这个问题,我想应当取消整个页面的cache功能,而是存放用户自己选取的的内容,这样会让系统负担减少,让搜索的结果更精确。)

- webmarks中的内容不知道是按照什么方式排列,我很不习惯,我想,绝大多数用户应该也会像我一样,想要按照自己保存的时序来显示。

- 当用中文词来搜索的时候,除了会找出与整个词匹配的结果外,还会将词拆分成字,然后搜索出现这些字的结果。要避免这种情况,中文搜索词必须加上双引号,使用起来还是有些麻烦。


------------

如果你也有兴趣试用/使用filangy,可以留下email(我不知道它有没有次数限制)收取邀请。

继续阅读Filangy 的社会性搜索服务

互联网著作权行政保护办法出台

新华网:互联网著作权行政保护办法》公布 5月30日实施

国家版权局和信息产业部16日举行新闻发布会说,经国家版权局局长石宗源和信息产业部部长王旭东签发,我国第一部网络著作权行政管理规章《互联网著作权行政保护办法》已于4月30日发布,将于今年5月30日起正式实施。[引自该报道]

可是我不知道在哪里可以找到该保护办法的法律文本:国家版权局网站上有这个发布会的新闻标题,标题而已,还有一张照片,连点报道的文字都没有(多谢coolwolf的提醒,我改用IE浏览器查阅,果然有。),更不用说法律文本了。信息产业部的网站更是一点相关文字都没有。

不知道是不是因为不愿意让被侵权者了解法规的具体内容而有意规避?

现在还只能从新华网的这篇报道得到些比较详细的信息,报道中说“这个保护办法主要规范的对象,是在互联网信息服务活动中,根据互联网内容提供者的指令,通过互联网自动提供作品、录音录像制品等内容的上载、存储、链接或搜索等功能,且对存储或传输的内容不进行任何编辑、修改或选择的行为。”

我现在兴趣的是,5月30日之后,百度等提供mp3搜索的站点会有怎么样的变化。对于百度mp3搜索还有其他类似网站强盗式的链接,不少人已经愿声载道,可是由于应对的成本,还有法律的模糊以及百度的“非道德”,使得他们的服务依然红火,依然我行我素。

这个法规的出台,使得情况看上去对被侵权者有利:“而造成对他人互联网著作权的侵犯,除没收违法所得外,还将被处以非法经营额3倍以下罚款;非法经营额难以计算的,处10万元以下罚款。[雅虎新闻]”

相信对百度们会是个很大的约束。这种约束之下,我估计百度会采取与mp3等内容提供商合作的方式继续提供搜索,并且在界面上应当会有所改变,不会在出现直接链接的情况。

只是,这种改变会在多久之后出现?会以什么方式推出?主动还是被动?

-----------

关于百度的盗链,这里争得可热闹了。

继续阅读互联网著作权行政保护办法出台

谁的常识是常识?


最近“常识”老从blog空间中跳将出来刺激我的神经。从几个颇受关注的传媒人那里看的出来,这个“常识”是很了不得的武器,甚至更厉害。有了它的支撑,甚至可以上天入海对于一切妖魔鬼怪了。

只可惜这种厉害多来于幻想和野心。很容易就会被戳破它的伪正义的面具。还原出学术和政治市场中的原貌来。后工业时代,学术也早已被纳入供给和需求的算计中,没有那么的干净,更何况社会中混迹的各个行当。

言归正传。

大城市生活的人的常识和在内地偏僻的山村中生活的人的常识不同。

共产党员的常识和布什的常识不同。

幼稚园的小孩的常识和饱学大儒的常识不同。

IT行业人的常识和一个不懂得电脑的人的常识不同。

左派和右派的常识不同。

小偷劫匪的常识和家庭主妇的常识不同。

稳定和发展是执政党的常识。给中国制造麻烦是美帝国主义的常识。

......

所以,根本不存在普世的常识。

如果非要有的话,那么就会和中国特色的马克思主义那样。如此一来,常识和伟大的真理不过是一丘之貉,都是普通人的负担。

或者说,他们说的常识不过是自己或者自己所代表的利益集团的常识,并且以这个常识来取代其他人的常识从而成为普世的常识。

从这点来看,伎俩和当权者有何两样。

继续阅读谁的常识是常识?

Blogbus 对标签的担忧

虽然BlogBus推出了标签标注网志的功能。但是却有“五个Tags的限制”。在有xuerchen的Tag本天成,妙手偶得之网志后有留言说“基于两方面。一是会破坏页面。
二是无法控制垃圾。”

真的很没有必要。

不知道破坏页面从何说起。

对于无法控制垃圾,明显的对标签和系统的进化缺乏信心。

网志的标签和美味书签的标签不一样,后者是阅读者标注的,标签和原文是在两个不同的系统中存放;而前者,比如Blogbus的标签,却是写作者自己标注的。

对于前者,那些垃圾标签制造者可以随意的放置任意多的标签, 对自己内容的管理不会有丝毫影响。但是对于类似Blogbus的系统,如果垃圾标签制造者本身也是内容的创建者,因为标签系统和内容系统一起,随意的垃圾标签将会让自己的内容管理变得混乱,而毫无意义。从这个角度说,网志者不会像社会性书签的某些用户那样滥用书签。

其次,可以在系统中增加滥用标签投诉功能,阅读者在订阅标签时遇到滥用时,可以投诉,站方根据投诉,可以限定滥用用户的标签呈现的范围,比如把它限定为自己察看,不进入整个Blogbus的公共标签层面。这样,滥用标签者只能自己享受自己的垃圾。

这种限定,要比删除标签甚至删除用户来的更人性化,也给用户一个机会辩解或改正。

第三,和Google这样依靠相互连接重要性的呈现方式不同,后者可以一直占据首页的位置。标签的呈现是依时间性,一个滥用标签的网志会很快淹没在后面。对于垃圾制造者来说,很不划算。

第四,分析为什么会出现标签的滥用,对于解决会有很大的帮助。之所以会滥用,是因为他们希望借助这个吸引人们的注意力。这种行为在Blog社群是非常危险的,它会降低自己的信任度,反而会被用户抛弃,最终可能没人来读。

所以,我以为在写作者的标签出现滥用的比例会很少,即便有,通过系统的功能,可以很快也很方便的对滥用的标签加以控制。

继续阅读Blogbus 对标签的担忧

标签的标签

美味书签有个捆绑功能,用户可以在设定中将多个标签捆绑在一起。具体效果可以在美味书签的主人joshua那里看到。

从表面上看,它像是在美味书签中结合了分类,让原本长列的标签有了结构和次序。

不过它绝不是分类那么简单。因为用户挥发现,可以将一个标签捆绑到多个地方,也就是说,它其实是用标签(元标签)再对自己的标签作标记。在这里,出现了两层标签面,下面的一层是直接面对内容作标记,上面的一层是对下一层标签的再标记。(两层的说法好像有悖于标签的无深度的平面性,或许可以这样说:在标签网络中,出现了几个大的聚合点,因为他们本身也是可以作为标签直接对应内容的)

这种标签的标签,对于个人用户来说,提供了呈现和浏览标签的便利。但它的作用绝不仅仅如此。

从高于个人的(用户)社会的角度来说,它解决了很多用户对于标签差异带来的信息遗漏的抱怨。

想象一下,当所用的用户都对标签再次作了标记,可以肯定这个元标签的数目要远比底层标签少,因为少,系统或者系统背后的人,就可以非常方便的作内容的相关性分析(比如元标签的聚类等),更全面切实的将社群内用户所关心的信息提供出来。

还有呢?

想不下去了,改天吧。成天下雨,蚊子都跑来家里躲避了。

等等,可以有另一种方式对标签进行再标柱。美味书签的方式是生产者自己标柱自己的标签。我们也可以让消费者来标注,拿美味书签来说,它允许用户订阅标签,当用户对所订阅的标签再标注的时候,所建立的元标签应该对系统很有价值。

可是,美味书签将系统内的订阅和书签的存放分开来。系统中再次将某些标签作为书签存储的人很少。

这里是边想边记,有点意识流了。

继续阅读标签的标签

无政府主义

makzhou留言中询问我的民主态度,他猜对了,是无政府主义。不过对于无政府主义,有很多的误读。

下面关于无政府主义的叙述摘引自hemp jewerly的“你知道无政府主义吗?”。放在这里,算是对自己态度的一个记录,同时也作为自己反思的一个印证,更可以作为将来态度的一个对照。

“了解什么不是无政府主义能够帮助明确什么是无政府主义:共产主义......自由主义......虚无主义”

“无政府主义的基本理念是认为包括国家、教堂、首脑或经济精英在内的一切具有等级意义的权威集团或个人不仅没有必要存在,而且对人类潜能的最大发挥有着先天的危害性。无政府主义相信人类在创造,合作和相互尊重等领域具备自行管理的能力。他们认为权力先天地带有腐败性质,因为拥有权力的人所关心的注定是如何保持自己的权威不受威胁,如何永久维持并不断扩展它,而不是其统辖之下的成员的利益......多数无政府主义者相信个人对其自身行为负有责任,而带有父权性的权力集团培植出的一套非人性化的思维模式却蜕化人的独立思想独立行动的能力,让人们期待精英界层来代替自己作决定,代替自己解决问题......无政府主义认识......多种压制形式之间的关联性,认识到在众多的不公正中单单反抗其中一种是无效的......多数一致同意工作重心不仅仅在于废除现有制度,而且要规化出一个新的更亲合人类的,更理性的替代社会模式。”

-----------

我想我讨厌权威,同时也讨厌那些以潜在的权威反对现有权威的姿态或者方式。

继续阅读无政府主义

汤晔代谁受过?

东方网4月27日的消息:沪居民汤晔传播虚假信息鼓动416游行被批捕

5天以后,也就是5月2日,东方网的消息说“近日,汤晔因涉嫌扰乱社会秩序罪被检察机关批准逮捕,并被判处5年有期徒刑。”

具有讽刺意味的是,在汤晔的说明书“一开始只是在我们公司内部的网络流传,只给内部职工看的,但是没想到一早就被人在公网上转贴了,到了下午像核裂变般的传开了,因为留有他本人的名字(他是一个敢作敢当的人),现在已经给他带来了无穷的麻烦,希望这里有良知的朋友,帮忙把这份声明转发一下!在下感激不尽!!”[来源:游*行说明书负责人汤晔个人声明](汤晔的详细说明书在百度几乎找不到。)

在该说明书中特别提醒参加者:

1、此次活动不针对任何在华日本友人、仅仅针对日本右翼势力和其支持者,所以在活动中请不要过激地针对友人; 2、警察是人民的公仆,在游行过程中,他们和我们一样也是爱国的,只是因为他们有他们的任务――保证活动的安全性,所以大家配合警察叔叔,特别是在使馆门口,如果警察叔叔看着你,就不要乱丢东西,如果没有人看着你,就丢一个鸡蛋或者一个番茄,万一丢完了被警察叔叔发现,就朝他笑笑; 3、沿途经过日本人投资的商店、公司等,不要给予破坏性打击,因为破坏了以后,日本人会向中国政府索要赔偿的,所以大家届时理智一点; 4、在焚烧日本国旗和小泉头像的时候,请注意安全,不要烧到衣服变成自焚了! 5、控制好整个活动的度是最关键的,所以请各部分(学校、公司、社会团体)负责人掌控好,上海是国际性大都市,是国家的经济命脉,请大家在整个活动中理性参与!!!

遗憾的是,对于汤晔的判决,网络上鲜有评论,仅有几条,比如:

“汤晔也算是一个小白领。他放着一份好端端的工作不做,深更半夜去发那些《上海地区抗议日本右翼活动的详细说明书》,弄到现在被戴上手拷,和家人分离,在看守所里等候法律的判决,真是犯不着啊”[来源:汤晔的教训]

“现在说这些被判刑的家伙是自作自受也不为过。但是,他们如此年轻,即使不说他毁了一生,至少也是毫无必要的半生挫折! ”[来源]

“我很由衷地对汤晔这种粪青说:活该!!”[来源:锐思评论]

只看到天涯上有一篇“汤晔的行为构成聚众扰乱社会秩序罪吗?”为其辩护。文章最后说“据此分析,汤的行为并不构成聚众扰乱社会秩序罪,希望检察机关不要起诉汤晔,也希望此文对汤的辩护律师有所帮助。”我很怀疑是否允许汤晔请律师为自己辩护了。

为什么在汤晔这件事情上,没有发生出像往常一些事件那样涌出的网络舆论呢?

我觉得这一事件对民众权利的侵害的严重性并不亚于以往,从这点来看,真是值得研究了。

抛开游兴这一事情来看汤晔被判刑和民众对此判决的反应,让我更多的看清了好些人对所谓民主的真实态度,也更看清了上海是个什么样的城市,有着什么样的文化和政治倾向(为什么没有发生在其它城市?)。

继续阅读汤晔代谁受过?

网志与商业?

Topku美味书签上看到信息周刊上的Blog, 下一个商业神话?一文的链接。

我一直闹不明白,为什么很多人会把提供Blog服务的商业服务和blog与商业这个话题联系起来。在我看来,这就好比平面出版繁荣,于是有人跳出来说纸张产业是下一个商业神话,或者电视节目产业的兴旺,有人因此说电视制造业是下一个神话。很可笑。

不过,当我随后读到这篇文章最后一句话(“现时情况下,是中国的“博客们”开展转化商业模式行动的时候了。”)的时候,我突然有点明白了,在他们看来,所谓的Blog,仅只提供Blog服务的网站/机构,他们眼里,根本就没有Blogger个人,即便有,也是构成Blog的一个分子而已,是为Blog服务商创造价值的奴隶。

这种看法的存在,或许和咱们文化中忽视个人以及势利的深厚传统有关吧。

对我而言,Blog与商业的关系,仅指个人或者机构利用Blog这种微内容的出版来赢利,或者指如何将Blog用于商业领域。

我所兴趣的是,和传统的出版业相比较,从总体上来说,这种微内容的新兴出版的赢利能力会有多少潜力?它的成长速度,它的市场容量,甚至它是否可能超过传统媒体的出版?

(更为关键的,这种文字/语音/视频的微内容、草根出版,究竟会把未来的传媒塑造成什么样子,对我们的各个层面的生活会有什么深刻影响,这是我最为关心的。)

当然了,因为是完全竞争的市场,不会有大的垄断的寡头出现,估计会有好些人因此失去兴趣。

继续阅读网志与商业?

超音频,超视频

听起来像超音速。

超音频/视频 hyperSound/hyperVideo的概念是对超文本 hyperText的发展。

现在的技术已经能够处理音频和视频,而不再仅仅是文字了。

超文本让原本独立的文本通过超链接联系起来,形成了一个复杂的无远弗界的文字载体的知识网络,非线性的阅读成为可能,讯息/知识间的联系变得可见可触。

知识的载体不该只是文字,语音和影像也同样重要,他们在传承知识上的作用不能被遗忘在史前时代。

超音频/视频的目的,就在于即将到来的文字、语音、影像时代,建立起一个和文本知识库并存的语音/影像知识库。不仅仅是相互没有关联的存储,而是要一个彼此依存的体系。

借助于超链接和音频/视频“浏览器”。

此时的超链接不再只是文本和图片,而是一段声音或者影像。

当我在录音或者对话的时候,我可以向使用超链接那样,用类似于a href="url"的方式,比如语音说超链接开始/结束,将这些个音和其他的音频文件链接。(需要录音工具的支持,也需要音频编码的改进)

用户使用语音播放浏览器听取我的录音的时候,遇到超链接的地方,会自动呈现在旁侧,让他们在方便的时候点击收听。或者可以类似“冲浪”那样飞线性的收听。

我甚至希望录音的时候能像文本blogging这样方便:可以摘引别人的语音。既然语音搜索已经可能,那么在我录音中复制我所需要的别人的语音片断应该也不是难事。现在的音频工具支持这个功能。但是要简单如现在的blog人人都回用,还需要有待时日。

我希望将来的互联网不再是文本的世界,而是整整的超媒体的世界,不仅可以通过浏览器来看,更可以通过播放器来访问彼此交错互联的超媒体世界。

继续阅读超音频,超视频

重新连线

整整5天没接触网络和电话,没任何不适,因为和信息的隔绝相比,和家人一起,跟小家宝玩儿,不用考虑工作,这种惬意自在要可贵得多。

快乐总是很快过去。重新连线之后,却需要花费相当于假期一半的时间阅读和整理。这是信息时代的代价,最多只能暂时搁置,无法视而不见,甚至抛却这些信息。

不过我发现有个自欺的好办法,就是用RSS阅读软件阅读,重新更新之后,所得到的信息要远比在线RSS阅读积累的信息少得多。前者让人感到自己的时间就是世界的时间,后者却让人沮丧和遗憾。

继续阅读重新连线