對於大約1個月,我在我的Cassandra集羣中看到以下3個節點的使用空間值(我有複製因子= 3)nodetool cfstats output :Cassandra cfstats:Live和Total已用空間值之間的差異
Pending Tasks: 0
Column Family: BinaryData
SSTable count: 8145
Space used (live): 787858513883
Space used (total): 1060488819870
對於其他節點我看到良好的價值觀,是這樣的:
Space used (live): 780599901299
Space used (total): 780599901299
你可以注意到Live和總面積之間有25%的差異(〜254Gb)。看起來我在這3個節點上有很多垃圾,因爲某些原因無法壓縮。 列家人我說的是有100兆的大小的SSTable配置LeveledCompaction策略:
create column family BinaryData with key_validation_class=UTF8Type
and compaction_strategy=LeveledCompactionStrategy
and compaction_strategy_options={sstable_size_in_mb: 100};
注意,即總價值在所有三個節點爲一個月住。我依靠Cassandra自動標準化數據。
我試圖降低空間(無結果):
- nodetool清理
- nodetool維修-PR
- nodetool緊湊[KEYSPACE] BinaryData(沒有任何反應:主要壓實的LeveledCompaction戰略忽視)
有沒有其他的事情我應該嘗試清理垃圾和可用空間?
你在本月的時間段內是否執行了大量的刪除操作? – abhi 2013-05-03 10:38:23
我想是的,我沒有一個精確的值,它可能會在100Gb-1Tb之間的數據被刪除。但爲什麼我的羣集中只有3個節點存在此問題?爲什麼羣集中其餘節點具有Live == Total?我正在使用Cassandra 1.1.9 – odiszapc 2013-05-03 13:46:41