架构师_程序员_码农网

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 7804|回复: 1

[linux] 2017.11.13服务器故障分析

[复制链接]
发表于 2017-11-13 12:16:27 | 显示全部楼层 |阅读模式
早上收到百度的监控邮件,发现网站打不开了,当时并没有什么担心的,因为网站打不开,可能原因有下面几点:

1:服务器欠费了
2:服务器被攻击了

当时,也没太在意,刷牙洗脸上班,然后,打开电脑访问阿里云网站,然后,看下是不是被攻击或者欠费了,发现,并没有欠费,也没有收到攻击。

然后,ssh连接到服务器,重启了一下服务器,等了5分钟,发现服务器也连接不上了,发现事情并不是那么简单!!!!

既然,外网链接不上,我们就用vnc连接吧,就是登录阿里云网站控制台有个远程连接,这是web版本的远程连接,走的应该是内网,然后,发现,黑屏!!!!

事情越来越不是那么简单了,感觉是不是阿里云出什么故障了???(因为,我没有动过服务器的任何操作)先提交了一个工单,说明了情况,然后,去上班了。。。

在地铁上,登录阿里云app,随时关注工单反馈,突然,在app页面,有个公告,链接:https://help.aliyun.com/noticelist/articleid/20651342.html

(已恢复)北京时间2017年11月12日电信南北互访异常通告

QQ截图20171113120411.jpg

个人猜测是不是阿里云那边的问题,是不是一些阿里云官方服务或者接口还没有恢复正常导致的????

阿里云工单反馈之后,发现能用ssh到服务器了,但是,重启之后,又不能连接到服务器了,反复工单沟通,期间电话也沟通了好久。

即使ssh能连接上,服务器的一些服务不能正常工作,例如:mysql服务器,没有正常启动。。。

最后,工单回复如下:

主机远程连接以及恢复,您测试下。
当前的问题rc.local中设置的启动项存在异常启动后导致系统无法完全启动,卡主了,如附件1,
注释掉rc.local中的内容后恢复正常,请您排查下对于的服务是否存在异常。
处理完毕后再开启rc.local中的内容。



QQ截图20171113115159.jpg

我好像明白点什么了,是服务器的一些服务没有正常启动,然后,我手动启动mysql,发现,30秒都无法启动起来,发觉事情并不是那么简单。。。。。

通过个人直觉,敲了一下df -h命令,查看硬盘空间使用,发觉,有一块空间占用100%!!!!!

QQ截图20171113110104.jpg

最后,找到占用磁盘空间前10的文件,发现了一个文件,12g多,是nginx的日志文件,

QQ截图20171113111326.jpg

应该是磁盘空间被占满,导致的故障了,修改nginx日志的配置参数,然后,删除nginx的日志文件,重启服务器,一些恢复正常。。。。

nginx配置有个坑,当server段不指定access_log时,并且http段中也未指定任何 access_log参数时,它会默认写到logs/access.log这个文件,也就是access_log默认值就是”logs /access.log”,而且是所有server的访问日志






上一篇:Linux CentOS下如何确认MySQL服务已经启动
下一篇:nginx access_log 日志完全关闭
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
 楼主| 发表于 2017-11-13 12:22:36 | 显示全部楼层
nginx access_log 日志完全关闭
http://www.itsvse.com/thread-4238-1-1.html
(出处: 架构师)
码农网,只发表在实践过程中,遇到的技术难题,不误导他人。
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

免责声明:
码农网所发布的一切软件、编程资料或者文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。

Mail To:help@itsvse.com

QQ|手机版|小黑屋|架构师 ( 鲁ICP备14021824号-2 )|网站地图

GMT+8, 2024-4-26 23:42

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表