yahoo 收录文档数目更新

yahoo宣告它收录的网络文档数量达到200多亿,其中192亿是网页。

下面是对yahoo、google、yisou和baidu的一些简单比较,目的在于为我自己选择搜索引擎提供依据。

-------------------------
the 查询。

google是35亿多。

yahoo是109亿。搞不懂都去那里捡的?

msn是22亿多。

------------------------
的 查询

yahoo结果28.2亿。如果限定在中文范围,结果是25亿。

google拒绝在所有语言中搜索,限定在中文范围内的结果是2300多万。

yisou的结果是2.1亿。一搜第一页的结果很耐人寻味。

百度的结果很有趣,刚好1亿。好多零。

msn的结果1513万多。

---------------------------

folksonomy 查询。

yahoo,中文范围内的结果是9220,所有语言下的结果是57万3。

google,中文范围内是973,所有语言下是44万4。

yisou,所有语言下45万多,中文下是2583,但是仍然夹杂着好些英文页面/站。

baidu,6750。

msn,24087。msn有点变态,设定范围在中文后的结果是72177???

----------------------------

刻录事这个站点的收录情况:

站内搜索字。

yahoo结果318。(可能是我把yahoo的爬虫挡在了门外)

google结果7770。

yisou让人抓狂,就2条。

baidu,8730。

msn,10。

(对比,cnblog.org内搜索的字)

yahoo,18000。

google,89400。

yisou,8260。

baidu,14800。

msn,148。


站内搜索刻录事三个字。

yahoo,59。

google,975。

baidu,18800,有些变态??

msn,2项。

yisou,2项。

---------------------

msn基本不用考虑。

中文环境下,google、yahoo、baidu可以并立。

对yahoo爬虫开放,希望他不要吃掉我太多流量。