delphij's Chaos

选择chaos这个词是因为~~实在很难找到一个更合适的词来形容这儿了……

21 Oct 2011

#lspe之Disks

今天去 Y! 参加了 #lspe 的一个交流会。

比较感兴趣的项目是之前了解过但仔细看过的 FlashCache,这是 Facebook 搞的一个 SSD 加速模块,原理不复杂,是在文件系统下面做上一层集关联(set-associative)高速缓存,提供了LRU和FIFO两种淘汰方法。这次 Mohan Srinivasan 讲解的时候提到了以前公开发表的讲稿上没有的一个内容—-按线程id/线程组id去做的黑白名单,并对MySQL进行了修改,令其在扫描表时不做cache。从使用的角度,这个不失为一个不错的折衷方法。

第二个创意不错,使用压缩和 dedup 的方法在 1ms 延迟内做到 1:5 到 1:10 的数据缩减,从而实现低成本的 SSD 阵列。这个概念卖给愿意做虚拟化的企业是很好的,但是对其他应用可能就差点意思了,特别是数据安全唯一的保障是及时做远程复制,这个不太理想。不过,在存到 SSD 上之前先做排重或压缩来减少 I/O 数据量,假如能做到很好的压缩比,并控制 write clustering 令其尽量凑整而避免过量的擦写的话,确实能够极大地改善 SSD 的寿命。不过这个presentation主要是介绍产品,具体的技术介绍的不多。

另一个比较感兴趣的是 Cirrascale 的一个刀片设计,这个设计中在(竖直放置)1U厚度的刀片上放了12块硬盘(如果有导轨,可以热插拔!),并通过 SAS 交换机来连接,电源外置。刀片单元上下各一组工业风扇来散热。机箱设计的相当不错,充分考虑了散热问题。由于 SAS 可以做 multi-path,这个设计的可靠性应该是很好的。同时也极大地节省了空间,和 Dell 同类的刀片相比需要的空间是 7:27。