您可能已经知道,我们的平台可以保护您伺服器上可能发生的硬体故障。
当在机器上发生问题,或是我们发觉有可能会发生问题时(温度异常,记忆体错误,等),您的 “伺服器” 会被自动签移到另外一台主机上。当然,如果您的问题是发生在您的 “伺服器” 内,并不是物理主机的问题,这时若伺服器没有回应下,您需要自行处理问题。
首先处理问题的第一个步骤是从 Gandi 的网页介面上看一下伺服器的状态是否是 “运作中”。在某些情况下有可能会是 “已停止” 或是 “已暂停” ,举例来说,伺服器没有续用。如果显示的是 “运作中” 并且伺服器没有回应,请依照下列方法进行检查。
有三不同的情况:
在这个情况下,下列这些指令可以帮助您分析问题:
uptime
可以看到您目前伺服器的负载值,free
可以在 “used” 栏位看到您应用程式使用记忆体的情况,top
(我们建议您安装使用 htop 可以即时显示应用程式使用系统资源(记忆体, CPU) 的等级,dmesg
显示来自您内核的讯息,tail /var/log/daemons
),就可以看到有用的讯息, df –h
显示您硬碟可使用的总空间。最常见的错误状况:
sysctl -w vm.overcommit_memory = 2
。注意: 修改后可能需要重新启动系统,您也必须增加 “vm.overcommit_memory = 2” 到 ”/etc/sysctl.conf” 与 ”/etc/gandi/sysctl.conf” 内。您可以在您的帐户内使用 紧急终端机 来直接连接您的伺服器,就像您使用萤幕与键盘直接连接伺服器一样。
在这种情况下,您可以停止所有有问题的应用程式,然后再次尝试连接您的伺服器。
您可以使用紧急终端机中的 'sysreq' 模式。使用 Ctrl + o 来进入 sysreq 模式,然后输入您的指令。您可以使用 Ctrl + o + i 来删除所有程序。Ctrl + o + h 来查询其他有用的指令。