FAST 2010第二天
今天的话题都是我比较感兴趣的。
开场的Keynote是eBay的Oliver Ratzesberger的 Enterprise Analytics on Demand。eBay每天的数据增量是50TB,而每天的数据处理量是50PB。这个presentation讲了相当多的规划方面的细节。
第一篇 DFS: A File System for Virtualized Flash Storage 介绍的是一个把卷管理(并不完全是:包含了Flash的wear leveling)和文件系统集成在一起的设计。FusionIO公司提供了一种直接在PCIe接口上插的存储设备。类似这样的设计,感觉是未来Flash文件系统必须要走的一条路。
第二篇 Extending SSD Lifetimes with Disk-Based Write Caches 是一个很有意思的设计:现时磁盘的反复擦写寿命要远好于Flash,因此,在磁盘上做一个顺序写入的日志,然后再择机将数据擦写回Flash。不过这篇论文讨论的具体方案还有一定的改进余地。
第三篇 Write Endurance in Flash Drives: Measurements and Analysis 是关于 Flash 寿命的衡量方法。
下午的session主要是并行计算相关的内容。 Accelerating Parallel Analysis of Scientific Simulation Data via Zazen 介绍的是一种用于科学计算的文件系统,性能不错。
第二篇, Efficient Object Storage Journaling in a Distributed Parallel File System 和之前的一篇论文意思比较接近。还需要再消化一下。
第三篇, Panache: A Parallel File System Cache for Global File Access 讨论的是分布式文件系统中的 cache 问题。准备找时间做做测试。
傍晚的session是关于监控和自动化负载均衡的,现时做起来暂时还缺少机会。