delphij's Chaos

选择chaos这个词是因为~~实在很难找到一个更合适的词来形容这儿了……

12 Aug 2004

忙活了一早上,最后我以前的调试经验还是帮了我的忙

另一个部门的同事说他们那里的 mysql 总是会在凌晨0:00-1:00这段时间发生诡异的问题,即CPU占用迅速升高,并停止响应。

重起mysql无效,但到1:00之后,只要重起mysql,就可以恢复正常。

为此,今天我做了一次非常冒险的在线调试工作,并最终解决了问题。

方法其实很简单,就是一步一步地隔离。

开始我们怀疑和cron有关。于是,关掉cron,故障依旧。

然后我们怀疑是数据库本身的问题,经检查配置确实有毛病,但修改后故障依旧。

最后我提议检查是否是脚本的问题,关掉httpd。

故障瞬间消失。

然后开始查找出现故障附近的日子修改过的文件。

solved.

其实很多时候,有很多事情并不需要太复杂、高深的技术……有很多东西只是一些方法上的经验,但是在关键时刻,这些经验和知识要比技术有用的多。