| Google's BigTable:Source搜索引擎研究 | 点击:52 |
分类:google; bigtable 时间:2006-1-25 10:38:45 kingrever收录 (还有10人收录)  | |
| |
| Google总有一些新鲜的玩意,在Google file system(GFS),MapReduce和Lock Service之外,最近的BigTable又颇受关注。 Google 的多个服务Print,Search History,Maps,Orkut,Rss阅读等都是基于BigTable提供支持的。那么Google BigTable到底是什么呢? Google BigTable是Google的一种对于半结构化数据进行分布存储和访问的一个接口(服务)。半结构化数据,例如RSS的数据,虽然有明显的Field但是由于每一个Field的定义颇为宽泛,因此对每一个Filed并非是结构化数据。 下面介绍Google BigTable 的一些细节,BigTable 以下简称BT。 BT是按照行列的格式组建的,是一个多维的稀疏矩阵。每一个BT大约100M到200M,每一台Cell(数据单元)存储大约100个BT。这些存储是基于Google的GFS。 BT的单行的格局应该是如下的格式: URL|Content|Author|.... www.wespoke.com|Content:......|author:6e|anchor:www.wespoke.com;搜索引擎|anchor:blog.wespoke.com;六翼的天使|... 访问这些BT是采用三层哈%u |
| |
http://www.wespoke.com/archives/001042.html | |