solidot新版网站常见问题,请点击这里查看。
消息
本文已被查看 3052 次
互联网上的大部分数据无人访问
互联网上的大部分数据是无人访问的。一名微软经理在 2010 年估计,Microsoft.com 有约 1400 万个网页,其中 400 万从未被访问过。Scottish Enterprise 有 753 个网页,其中 47 个网页占到了总访问量的八成。一家组织其网站一年的访问量有一亿,5% 的网页占到了总访问量的八成。南安普顿大学(Southampton University)大学发现,0.2% 的网页占到了总访问量的 90%,只有 4% 的页面被访问过,96% 的网页其数量约有 400 万从未被访问过。无数公司或机构都有类似的统计数据,在数据被储存之后,大部分是从未再次被访问的。因为存储太便宜了,有总比没有好,大部分人并不知道哪些数据会有用,哪些数据是垃圾数据。
Gerry McGovern:Data centers contain 90% crap data
Gerry McGovern:Data centers contain 90% crap data