既当故事,也作见识~服务器
事情是这样的,星期四的时候须要用工做站
的GPU
进行AI模型训练,因此把GPU
和主板
驱动升级了一下,而后就运行了1天,晚上的时候暂停任务,心想着让工做站
休息一晚,明天继续吧(那GPU
运转和产热真是夸张啊,如今知道为何GPU
都有两个风扇了)code
次日把工做站
从新开机,发现远程链接不了了,这就坑了blog
因而先ping
了一下,发下不通,而后登录路由查看了一下,没发现工做站
,那确定是开不了机了接口
接着找了个显示器链接到了工做站
上,发现开机没反应,显示器一点变化都没有内存
这时候学生时代两层机房的管理经验就用上了,把工做站
拆了路由
发现GPU
落灰挺严重的,估计是大量运算卷起的灰尘,加之工做站
刚安装的时候显卡也出现过一次接触不良的状况,遂拆了从新装容器
先拧开螺丝(供电的线若是阻碍能够先拔了,若是不影响就无论)
扩展
按一下卡扣,手握两头就能够轻松拔下(别用蛮力,显卡将近3k,主板将近4k)
硬件
我是确保这个卡槽没问题的,要是你不肯定能够安装了另外一个卡槽上,工做站
基本上都是多个显卡槽
技巧
发现开机黑屏了(这个有个技巧,关下显示器再开,若是屏幕亮画面黑,就是黑屏)
PS:其实开机黑屏,插拔内存就能够解决80%的状况
那就插拔内存试试,我这边4个卡槽,先拔下内存条
插下内存条
的金手指
发现仍是不行,开机继续黑屏
那就得排出是不是某内存条烧坏了,因而单个插入来试
单插外部的没事,能够开机,单插内部位置的内存不行
因而得进一步排出,是卡槽出问题了,仍是内存出问题
外部内存插入里面卡槽也开不了机,里面位置的内存插入外部能够开机
那么就能够判断里面卡槽出问题了,至因而落灰仍是其余问题有待排查,先继续说
把内部内存换个卡槽就能够了
PS:推荐内存是一个牌子的,好比都是金士顿,有时候不太牌子的内存容易有其余问题,之前踩过坑
而后就能够了~
顺便普及一个硬盘的知识点,以某老电脑为例:
这个是链接线,经过这个电脑就能够访问到硬盘
PS:为电脑或者服务器添加硬盘的时候,这个先也要买一下,并且得看一下主板上还有没有接口
这个是电源给硬盘供电用的线
看张详细图
先申明,不推广,不发链
以前朋友想买2T的WD硬盘,500左右,问我有没有性价比高的推荐
我说3T硬盘500左右,本身买个硬盘盒就能够用了,并且不容易坏,考虑不
PS:常常使用的状况下:移动硬盘通常2年左右的寿命,硬盘5年左右
最终效果
缺点:须要额外供电,体积比移动硬盘大点
(若是想小点能够使用笔记本的硬盘)
PS:硬盘是3.5英寸的,笔记本硬盘是2.5英寸的,买硬盘盒须要注意一下,搞不清楚就买通用的
固然了,NAS也能够本身改装,多盘支持的容器
+LoT
+RAID 0
就能够搞定了,之后有机会继续说