忙活了一早上,最后我以前的调试经验还是帮了我的忙
另一个部门的同事说他们那里的 mysql 总是会在凌晨0:00-1:00这段时间发生诡异的问题,即CPU占用迅速升高,并停止响应。
重起mysql无效,但到1:00之后,只要重起mysql,就可以恢复正常。
为此,今天我做了一次非常冒险的在线调试工作,并最终解决了问题。
方法其实很简单,就是一步一步地隔离。
开始我们怀疑和cron有关。于是,关掉cron,故障依旧。
然后我们怀疑是数据库本身的问题,经检查配置确实有毛病,但修改后故障依旧。
最后我提议检查是否是脚本的问题,关掉httpd。
故障瞬间消失。
然后开始查找出现故障附近的日子修改过的文件。
solved.
其实很多时候,有很多事情并不需要太复杂、高深的技术……有很多东西只是一些方法上的经验,但是在关键时刻,这些经验和知识要比技术有用的多。