「Tokyo Tyrantによる耐高負荷DBの構築」
http://alpha.mixi.co.jp/blog/?p=166
がとても興味深い.
Mixiのようにどのユーザも比較的まんべんなくアクセスされていて
かつ「あしあと」や,「最終ログイン時刻」のように固定長でOKなデータの場合は,バケットチェーンなどのオーバヘッドが発生するハッシュやB+Treeより,ファイルをスロット化してIDに応じて一発lseekなファイルベースの簡易DBの方がロックもないし速いケースもありそうだなぁと思ったけどどんなもんなんでしょう?
1500万ユーザ×64bitの日付情報として15Mユーザ×8byte=120MB
これならファイルシステムのキャッシュも利きそうだし結構はやそう.