Comptia 服务器认证指南（三）_comptia 认证

技术文档

原文：annas-archive.org/md5/07644eedeea0121cba48385937ebfb1c

译者：飞龙

协议：CC BY-NC-SA 4.0

第十二章：物理安全和环境控制

并非所有安装在、连接到或与计算机硬件和软件集成的网络和服务器安全设备和方法都能有效工作。任何基于服务器的系统、数据中心或设施的第一道防线是它的物理安全。物理安全的核心是保护计算资产的安全、功能、运作正常，并防止任何入侵者的进入。虽然我们将其视为一个单独的话题，但物理环境的环境系统和控制应当是组织安全政策的一部分。

本章将讨论保护计算系统的物理安全和环境控制。覆盖的主题如下：

多因素认证（MFA）
一般的物理安全概念
环境控制
物理安全问题

MFA

多年来，用户访问计算机、系统和网络的身份验证系统经历了从几乎没有身份验证到结合多个身份因素的演变。这一过程始于要求用户身份代码，然后是与用户名一起输入的秘密密码，如今已经发展到结合两种或更多的身份因素。这些层级的主要目的都是为了尽可能确定地验证寻求访问的用户身份。

密码

也许第一个密码，至少是第一个被记载下来的密码，是阿里巴巴用来打开宝藏的语音命令——芝麻开门。曾几何时，用户账户或身份代码用于标识谁在访问一个系统，通常是大型机或小型计算机。最终，由于同事之间共享且内容简单，这些代码不再能提供任何安全的访问控制。用户账户代码，也就是用户名，通常由每个有权限访问系统的用户的名字首字母和姓氏组成，例如rprice。这是一种标准做法，至今仍在使用。用户名在过去 50 年里几乎没有变化，它们提供的安全性也几乎没有，基本上是没有的。

你必须记住，早期应用系统的主要数据存储介质主要是可移动介质，如硬盘盘片、主轴包、磁带和软盘。阻止访问物理介质的物理安全是访问控制的重要组成部分。

随着应用系统的复杂化，数据存储逐渐转移到附加或内部的磁盘存储设备。这意味着安全性必须成为绝对必要的要求。保持数据的完整性和安全性需要更强的认证方法。登录过程添加一个秘密密码，有助于验证请求访问系统的用户是否真的是他或她所声称的那个人。基本假设是，如果用户知道密码，那么用户就是用户名所标识的人。

使用用户名仅仅是身份验证过程中的一步（即识别步骤）。将密码与用户名配对创建了一个数据包，作为单因素身份验证（SFA）值。如果输入的密码与系统安全文件中与用户名配对的值匹配，系统便会允许访问。

最终，使用组合的用户名和密码不再提供曾经的访问控制和安全性。密码破解工具、社交工程、恶意软件和其他不正当手段能够获取用户密码，从而访问用户的个人数据。这就是 MFA（多因素身份验证）出现的原因。

身份验证因素

MFA 结合两种或更多的身份验证因素来验证尝试登录系统或网络的用户（请求者）。MFA 过程涉及两个或更多因素的组合，来唯一识别请求者。到目前为止，MFA 能够处理五种身份验证因素的各种组合，分别是：

你知道的某些东西：这一类包括你已经记住并能在需要时回忆的各种数据、短语、数字或它们的组合。这可以是密码、PIN 码、问题的答案、乔治·华盛顿拥有的狗的数量（50）等等。尽管用户名和电子邮件地址是你知道的内容，它们是标识代码，我们正在尝试验证这些代码。
你拥有的某些东西：这一类的因素是包含信息的物理物品，确保持有者/用户确实是他们所声称的人。这可以是一个小型塑料令牌，比如 RSA SecurID，或是通过银行应用在手机上生成的数字，一个个人身份验证（PIV）智能卡或员工证，或者可能是一个 RFID 接近卡。
你是的某些东西：许多人将这一类与你拥有的或你是的类别混淆，但本质上这一类是生物特征识别。生物特征使用身体的一部分来唯一识别你。你的身体特征，包括指纹、手印、视网膜和虹膜扫描、声纹和面部扫描等，建立了一个与登录时对比的二进制编码模式。
你拥有的某些东西：这种类型的身份验证最常使用 IP 地址来识别用户请求的来源或位置。地理位置服务验证请求来源的地点是否与预设的用户位置一致。
你做的某些事：这一类包括触摸板和触摸屏的动作（手势），例如一个秘密手势。Windows 8 引入了一个名为图片密码的功能，允许用户录制手势用于身份验证。

仅使用一个因素，如密码，就是简单身份验证（SFA）。仅使用两个因素就是双因素认证（2FA）。如你所料，超过两个因素的认证就是多因素认证（MFA）。你需要了解的关于认证因素的一点是，使用的因素越多，你的数据就越安全。

一般物理安全概念

任何组织的物理安全必须定义与安全、保护和完成组织使命相关的事件、原因、行为者、防范、恢复、缓解及其他相关程序。

任何 IT 组织的物理安全计划都基于整体组织的安全政策和计划。IT 安全政策必须认识到物理安全对计算资产和功能的需求与目的。定义 IT 物理安全计划的政策应包括以下目标，以及根据组织性质可能存在的其他目标：

已经到位的物理保护措施，如消防安全、入侵预防、业务连续性和灾难恢复
对组织的威胁来源和类型
物理安全监控系统的组成部分
公用事业服务中断（如电力、天然气、水等）的影响及恢复
针对未经授权的入侵、破坏或计算资源盗窃所定义或实施的对策

物理安全计划通常有两个重点领域——威慑和检测。威慑程序、方法和设备旨在阻止或防止威胁转变为安全事件。检测当然涉及用于发现威胁或破坏物理安全措施的设备、程序和方法。

对物理安全的威胁

对任何组织物理安全的威胁可分为四大类——环境、人为、特定地点和技术。以下部分将列举这些类别中一些威胁的例子。

环境威胁

环境威胁是指天气、自然灾害、灾难性事件以及来自自然界的其他事件。它们包括以下内容：

灰尘：空气中的灰尘可能导致计算机中的电气问题，更不用说会阻塞主板和 CPU 的气流和冷却系统了。
地震：地震的损害威胁通常是结构性的，但随之可能出现电气、管道，当然还有通风方面的问题。
极端天气：这种威胁可能包括各种灾难性的天气事件，包括强风、大雨、龙卷风、飓风/台风、冰、雪、冰雹等。
火灾/爆炸：除了火灾可能对计算设备造成的损害外，还可能由于灭火剂、抑制剂和灭火器中的化学物质造成损害，更不用说水了。
洪水：洪水通常是由其他气象事件引起的，比如极端天气、地震或你所在社区的火山爆发。
雷电：电气风暴是一个真实且严重的威胁。雷电直接击中一个数据中心所在的建筑，可能会通过即便是保护设备也无法承受的电流冲击。
害虫：不幸的是，一只老鼠咬坏了通信电缆或电源电缆，可能会给服务器及其节点带来难以检测的问题。

人为威胁

正如其名称所示，这些物理安全威胁通常是由于疏忽、疏漏或无知造成的，或者它们来自恶行之人的恶意行为。它们包括以下内容：

事故：事故可能无法完全避免，但可以采取一些措施来帮助减少其发生：如层压地板表面的安全踏步、设备和柜子之间的适当间距、为所有员工提供安全意识培训等。
恶意软件：计算机病毒、木马、根套件、机器人以及其他恶意软件是任何联网设备，特别是网络服务器的严重威胁。
盗窃：这不仅仅是外部人员入侵安全场所的行为。员工、供应商、承包商和访客等人也在设备、文档和资源盗窃中扮演了重要角色。
未经授权的访问：黑客获得程序、数据和其他资源的访问权限是一种安全政策和程序必须应对的威胁。然而，未经授权的物理访问同样构成威胁，这意味着入侵者已物理入侵并接触到设备、数据存档、文件和表单及其他计算资产。
破坏行为：虽然通常被认为是对外部表面的损坏或毁损，破坏行为也可以包括窗户和围栏的破坏、火灾，以及设备和建筑物的随机毁坏。

特定站点的威胁

这一类物理安全威胁的范围通常是单一站点、建筑或周边区域。大多数情况下，它们涉及到购买或外包的系统或服务。以下是一些例子：

通信系统故障：由于通信服务涉及多种通信技术，这些技术可能会影响或破坏语音、数据传输和反馈系统的性能和可靠性。
计算设备故障：显然，任何网络的主要风险因素之一就是设备和组件的故障。物理安全政策应解决由于某些设备故障可能出现的所有潜在漏洞。
灭火系统故障：如果在一个受保护区域发生火灾，并且灭火系统出现故障，应当有相关程序来尽可能减少总体损害。技术人员可能只能切断所有设备的电源并撤离设施。
供暖、通风和空调（HVAC）故障：此事件的严重性取决于设施的位置。在温度和湿度通常较高的地区，HVAC 故障可能导致计算设备的严重热损害。另一方面，在极寒的情况下，失去供暖可能会降低关键组件的性能。
关键人员辞职/离职：许多组织无法为每个关键职位配备后备人员。当一名重要且难以替代的员工离开组织时，特别是当该员工是某些活动的唯一负责人时，若没有额外帮助，可能无法从安全事件中恢复。
停电/电压降低：我们都知道，失去建筑、楼层、房间或电路的电力服务的威胁，以及由此带来的操作中断。频繁的停电（黑暗期），通常涉及电压下降后紧接着的电压激增，和电压降低（俗称电压下陷）或低电压期，都可能降低计算机电源的性能和效率，最终导致设备故障。

技术威胁

物理安全威胁通常以某种形式涉及人为因素，但通常是因为人为因素利用了技术漏洞或程序上的缺口所创造的机会。一些技术威胁的例子如下：

未授权访问：这种情况确实发生过！ 一个毫无防备的网络用户登录系统后，突然发现自己获得了之前无法访问的机密数据。如果用户报告此情况，系统管理可以进行调查并采取纠正措施。然而，如果没有报告，应立即进行用户和用户组账户权限及权限的审计和复查，并定期进行。
入侵者攻击：计算机网络的攻击面是外部入口点或内部访问点，外部和内部威胁代理可以利用这些点进行攻击。入侵检测系统（IDS）、入侵防御系统（IPS）或结合检测和防御的混合设备可以分别检测或防止攻击。
硬件故障：根据故障的硬件组件，故障可能影响生产、安全或两者。例如，身份验证服务器的故障或生物识别设备的故障可能会产生可利用的漏洞。
缺失或不充分的操作程序：无论事件类型是物理访问事件还是逻辑安全事件，如果没有现成且更新的程序来处理该情况，采取的行动可能会造成额外损害，甚至使问题无法恢复。
未授权的软件或硬件修改：这也许应该算作人为威胁，但无论如何，未经授权和未记录的生产软件或硬件更改可能会造成各种物理或逻辑安全漏洞。

物理安全设备

Server+ 认证考试涉及多种物理安全概念和对策。以下列出了考试目标中具体列出的那些项目或概念，并对每个项目进行了简要说明或定义，及其在物理安全应用中的作用：

徽章和卡片：正如我们在本章前面讨论的那样，员工徽章可能包括射频识别（RFID）芯片或其他嵌入式电路，这些电路可以是带有少量内存的微控制器，或者仅仅是存储身份数据的内存电路。智能卡和个人身份验证卡（PIV）就是这种技术的例子。
生物识别设备：最常见的基于 PC 的生物识别设备是指纹扫描仪，它可以是外部设备也可以是内置设备。然而，还有几种物理安全生物识别设备，涵盖了从指纹和掌纹、手和手指几何形状、视网膜和虹膜扫描仪，到语音识别和血管图案扫描（扫描手部以匹配内部血管图案）的技术。
可锁柜和保险箱：在数据中心，某些可移动介质、表格（如支票或订单表格）、热插拔组件以及其他重要物品应放在锁住的、最好是防火的柜子或保险箱中。
锁和钥匙：也许最古老的物理安全设备就是门锁和其他锁具，以及能打开它们的钥匙。这项技术的扩展是键盘，在这种键盘上，寻求进入某个区域的人输入安全通行码。
人身防护门：这也被称为空气锁或缓冲区，提供了进入建筑物或安全区域的通道，通道内有一个小空间，某些人称之为房间或前厅，两个相互锁定的门分别作为入口和出口。这种锁定机制使得任何时候只有一扇门（或一组门）可以打开。人身防护门常见于外部温度远低于或高于建筑物内温度的地方，或者是两个门之间存在某种环境或安全程序的地方。
机架式柜：在较大的数据中心，计算和互联设备通常是机架安装的框架和柜子。有关机架式柜的更多信息，请参见第一章，服务器硬件。
监控摄像头和传感器： 安全摄像头扩展了安全人员（如保安）可以监控多个摄像头图像的视野。安全摄像头还可以提供视频流，以便存储在磁介质上供以后回放。安全传感器包括运动探测器，能够激活其他安全设备，门窗开关传感器，玻璃破损传感器，以及各种入侵检测装置。

环境控制

数据中心或计算设施中的温度、湿度和气流，可以像门锁一样成为物理安全计划的一部分。系统安全的一个原则是可用性，计算设备和服务器所在的环境必须支持所有设备的高效运行。环境控制实现并维持每个空间中设备和装置的最佳运行环境。环境控制的各个组成部分包括：

HVAC（供暖、通风和空调系统）： 除了供暖和制冷，HVAC 系统还必须为整个数据中心维持恒定的温度和湿度范围。HVAC 系统还应与火灾控制系统连接，以便在发生火灾时，空气流通系统不会继续向火源提供氧气。
机房、机架和机架温度： 如本书前面所讨论的，许多大型数据中心通常有一排排安装服务器、电源和网络附加存储的开放式机架或封闭式机架柜。由于不同的设备有不同的冷却需求，一排机架可能是冷区或热区。HVAC 系统可以通过空气流向挡板和机架遮挡板，利用这些板件在机架设备之间创造空隙，将冷空气引导到某一排机架，将温暖空气引导到另一排。

环境监测

许多可测量的条件和持续的功能共同影响计算机服务器房或数据中心的环境。由于外部天气和环境的变化、设施的 HVAC 系统以及专门为数据中心设计的 HVAC 系统，这一环境是一个动态的目标。

环境监测系统应检测和报告的条件包括：

温度： 大多数计算机房和数据中心的环境指南将温度范围设定为 68 至 77 华氏度或 20 至 25 摄氏度。长时间将环境温度保持在这个范围之外可能会损坏电子组件。
湿度： 根据数据中心的位置，湿度可能存在过高或过低的问题。高湿度环境可能会导致电子电路和组件的氧化和腐蚀。极端情况下，低湿度可能会产生静电问题。数据中心相对湿度的标准推荐值为 45% 至 55%。
电压和功率：电压传感器和功率监测传感器监测电力电压水平和功率消耗，超出预定义的高低限制、停电或电力中断时，系统会触发各种警报。
物理入侵：数据中心在正常工作时间应保持锁闭的门应安装开门或门未关紧的警报。这些警报可以让数据中心工作人员知道门已打开，并且可能正在发生入侵。
烟雾：正如俗话所说，有烟就有火。烟雾和一氧化碳烟雾可能对数据中心的工作人员构成危险。与电力系统和环境监控及报警系统互联的烟雾报警器和化学探测器可以在检测到烟雾或烟雾时关闭电源并触发警报。

电力供应

没有电力，至少到目前为止，电脑是无法运行的。也许某天，电脑可以通过空气或香蕉皮来运行，就像某个“融合反应器家用能量反应堆”的时光电容器一样，但现在，它们仍然是电气设备，依赖于电网或电池供电。在本章中，由于我们关注的是物理安全，因此我们将重点讨论计算机的电力来源及其最佳管理方式。

不间断电源（UPS）

保护数据中心设施的电力供应是物理安全计划的另一个重要考虑因素。然而，物理安全计划应认识到，通常 UPS 能够充分保护单独的计算机和外设。UPS 系统的基本操作功能是将交流电源传递给交流电动设备，同时为电池充电直流电。

UPS 的主要目的是，不论是独立的还是多功能数据中心 UPS，稳定电力波动，提供电力，在断电时仍能保持电力供应。持续的电力波动和电力故障可能会损坏或摧毁电气组件，甚至可能导致数据中心未能达到其 SLA（服务水平协议）。当 UPS 检测到电力事件发生时，它会启动所需的缓解措施。这可能是抑制电力尖峰，增强电力衰退，或者切换到电池电力来应对停电。

通常，UPS（不间断电源）有多个内部电路和一块电池：

整流器：将交流电源转换为直流电，为电池充电
逆变器：将直流电转换为交流电，并通过 UPS 的电气插座输出
旁路：将交流电直接传送到 UPS 的电气插座
开关：用于切换逆变器电路输出和旁路电路输出的电路

以下图示展示了典型 UPS 的电路：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/4fabe0ab-27cb-4c23-a214-014801725485.jpg

在线 UPS 的电路

UPS 主要有两种类型——离线型和在线型。离线 UPS，也称为待机 UPS，将市电交流电通过其自身的交流电插座传输。当市电电源稳定时，UPS 将电力传递到输出电气插座，仅使用足够的电量来给电池充电。如果市电电源断电，离线 UPS 将使用逆变器将储存的直流电转换为交流电。

在线 UPS，如前面图示所示，使用整流器将市电交流电转换为直流电，从而稳定电流并充电电池。然后，UPS 将直流电转换为清洁且稳定的交流电。在线 UPS 系统提供持续的交流电电力，即使在电源掉电时也不会中断电流。

UPS 评级

通常，UPS 的评级有最大伏安 (VA) 数值、最大瓦特数或两者兼有。这些数值表示 UPS 的能力上限，电力需求不应超过这些评级。对于较小的电力需求（如单台计算机）来说，确定 UPS 大小的经验法则是，瓦特数不应超过 VA 评级的约 60%。然而，在较大系统中，瓦特数和 VA 评级通常是相等的。

另外两个表示 UPS 性能的评级值是容量和运行时间。容量是 UPS 能输出的最大 VA 数值。运行时间则取决于 UPS 电池的大小，是指 UPS 能为连接的设备提供足够电力的时间长度。

附加设备的自动关机

一些 UPS 单元可以向连接的设备发出关机命令，这可以防止数据丢失或处理损失；一种紧急模式活动可以安全地关机服务器和存储设备，或避免长时间的系统恢复。有两种方式实现此功能——通过为 UPS 添加网络适配器将其连接到网络，或者将 UPS 连接到每个设备，以便在市电断电时使用。

电力分配

电源供应单元可能是 PC 最重要的组成部分！这个说法当然有争议，但试想一下，如果没有它，PC 就只是一堆塑料和金属，可能变成船锚或者非常大的纸镇。电源供应单元将市电交流电 120 伏或 240 伏转换为直流电，通常为 3.3 伏和 5 伏用于内部电路，以及 12 伏供内部安装的外设（如磁盘驱动器和冷却风扇）使用。

电源供应在桌面、塔式和便携式计算机中至关重要。然而，机架或机柜式系统，如服务器、磁盘驱动器和网络设备（如路由器、交换机和防火墙）则在最大化计算能力的同时，最小化所需的地面空间。这些设备大多数需要外部电源，该电源可以专门为某个设备提供，或由多个设备共享。在任何情况下，外部电力分配设备就是 电力分配单元 (PDU)。

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/e9cea07f-d27c-4aad-aa7d-c2a07e0631d6.jpg

电源排插（左）和 16 插口 PDU（右）

图片来源：Tripp Lite

电源排插或浪涌抑制器通常用于家庭和办公室系统。然而，尽管有些 PDU 看起来像电源排插，它们之间还是有一些区别。像电源排插一样，PDU 有多个电源插座和一个主电源线，将设备连接到交流电墙插座、UPS 或其他电力分配设备。PDU 是机架或机柜中设备的常见电源单元。

PDU 通过多个插座将电力分配到两种主要设备样式：

落地式：这种 PDU 将原始电力源（未调节的交流电源）转换为多个低电压电源插座。落地式 PDU 通常是独立的单元，用于为多个设备、机架或机柜提供电力。
机架安装型：这种 PDU 为多个插座提供市电。某些机架安装型 PDU 包括监控和控制功能，管理员可以远程访问以跟踪电源供应情况。

PDU 类型

PDU 有七种配置，有些是落地式或机架安装单元：

标准（基础）PDU：这种 PDU 类型通常是一个电源插座排，放置在电源设备（如 UPS、电源发电机或市电插座）与布线机房、数据中心或单个机架或机柜之间。它通常有多个低电流插座，用于为多个机架安装的设备提供电力。
计量型 PDU：这种机架安装的 PDU 类型包括一个数字电流计，用于监控电气负载，避免电力浪涌和过载。
监控型 PDU：这是一种机架安装的 PDU，增加了通过网络连接监控电源的功能，扩展了计量型 PDU 的功能。
交换式 PDU：也称为交换式机架 PDU，这种机架安装的 PDU 将监控型 PDU 的功能与能够开关单独插座以通过网络重启设备的功能结合在一起。
自动切换开关（ATS）PDU：这种 PDU 类型可以具有两个（或更多）独立电源。在其中一个电源失效时，ATS PDU 可以自动切换到备用电源。
热插拔 PDU：像 ATS PDU 一样，这种 PDU 类型连接到两个不同的电源，以便在需要时可以通过手动开关在输入电源之间切换，而不会中断电力供应。
双回路 PDU：实际上，这种 PDU 相当于将两个 PDU 合并为一个单元，节省空间并提供冗余支持，适用于具有双电源供应的设备。

PDU 额定值

在美国，PDU 的输入电源通常是单相或三相 208V 电源。简单来说，三相电力和单相电力的区别在于供电电缆的数量。单相电路使用其中一根 120V 的热电线和一根中性线提供 120V 电流，如下图所示。三相电缆有三根 120V 的热电线和一根中性线。如以下图所示，任何一根热电线和中性线都可以提供相当于单相电路的电力。更常见的是，两根热电线合并提供 208V：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/3cf09ddc-65fb-40b9-9b53-74e7f081eceb.jpg

单相和三相电路结构的比较

在较大的数据中心和服务器机房中，三相电力是最常用的。单相电力通常用于家庭或小型办公室环境。

PDU 的能力可分为两大类——功率额定值和负载能力：

功率额定值：功率额定值以安培、电压和瓦特为单位。这些额定值表示由 PDU 提供的电力特性。安培表示每个 PDU 插座上可用的电流强度。电压衡量通过电路、电缆或电线推动安培所需的压力。在美国，电压额定值通常为 110V 或 120V。瓦特额定值指定了满足连接到 PDU 设备需求的电力。
负载能力：PDU 应与其所服务设备的电力需求相匹配。PDU 的负载能力是 PDU 能够支持的最大功率。例如，一台机架式服务器可能需要 600 至 900 瓦的工作范围，相当于 5 至 7.5A 的电流。建议 PDU 插座的需求不应超过其能力的 80%。这意味着一个 20 安培的插座的负载不应超过 16 安培。以下表格展示了这些计算：

设备 额定功耗 最低功耗（-20%） 最高功耗（+20%）电流（W/V） 1U 服务器 750W 600W 900W 5A-7.5A 4U 服务器 800W 640W 960W 5.3A-8A 路由器 660W 530W 800W 4.5A-6.6A 防火墙 275W 250W 300W 2.1A-2.5A

机架式设备的电力需求示例

身体安全问题

数据中心和服务器机房必须是安全可靠的工作环境和工作空间。有各种各样的指南和标准列出了创建一个功能性、安全且可靠的区域的要求。以下是服务器机房和数据中心的空间和安全要求：

空间：用于容纳服务器、网络设备、UPS、PDU，以及可能的冷却设备、配电面板和布线的区域或房间，应提供设备之间或设备与设备之间的间隙，以便进行维护、服务、安装、拆除和通行。设备、机架或柜子之间的通道应至少为 3.2 英尺（1 米），但机架和柜子前后至少应有 4 英尺的间隙。若一排机架或柜子位于另一排的后面，前后间隙应均为 4 英尺。出入口应符合当地法规。
照明：无论服务器机房或数据中心的大小，所有电子设备都应有良好的照明，以确保安全并提供良好的工作区域。照明应照亮机架和柜子的前后面，以及设备内部。应设置紧急照明，以便在停电时提供安全的撤离通道。
电气安全：服务器机房或数据中心的电气密度平均不应超过每平方英尺 300 瓦。机房内的 PDU 和 UPS 设备额定功率不应超过 100 kVA，如果更大，应安装在单独的空间内。
消防安全：封闭的服务器机房或数据中心应配备灭火系统，且空间内所有布线应具有防火等级或气流等级。灭火器应随时可用。
安全性：只有授权的员工或供应商才能进入服务器机房或数据中心。日志文件会记录进入和退出空间的情况。作为紧急预防措施，该空间应至少配备一个通信设备，用于与外部联系。

更大的服务器机房和数据中心通常会安装架空地板，至少是为了将设备的布线放在地板下。然而，架空地板是安装在网格框架上的，并用地板瓷砖填充，其承重能力无法与混凝土地面相比。架空地板在实际使用中与混凝土地面一样永久，这意味着随着企业的扩展和计算设备的增加，地面上的负荷也会相应增加。

架空地板有三种主要的负载类型（重量测量）：

点负载：指物体在其任何一个支撑点上的重量。例如，如果一个机架柜子放置在四个滚轮上，则该柜子的点负载就是放置在任何一个滚轮上的重量。地板必须能够承受将占用该空间的最重设备或机柜的点负载。
静态负载：指特定地板瓷砖上所有点负载的总和。如果两个（或更多）机柜的支腿或轮子放在同一块地板瓷砖上，则静态负载就是这些设备点负载的总和。
滚动负载：通常，这个因素适用于穿孔地板瓷砖，表示一台设备或机架柜在瓷砖上移动时的重量。瓷砖上的滚动负载是设备两个点负载的总和。

总结

MFA（多因素认证）结合两种或多种因素来验证用户身份。MFA 使用五个认证因素：你知道的事情、你拥有的东西、你自身的特征、你所在的位置以及你所做的事情。

物理安全基于组织的安全政策和计划。物理安全计划应涵盖以下内容——物理保护、漏洞和威胁、监控系统、服务和公共设施中断以及未经授权的入侵、破坏或盗窃。物理安全应着重于预防措施，以防止安全事件发生，并通过检测措施发现威胁组织的事件。威胁有四大类——环境、人为、特定地点和技术。

环境控制是物理安全的一部分。服务器和网络设备可能有多种冷却要求，如冷排或热排。环境监控系统应检测并报告：温度、湿度、电压和电力、物理入侵、烟雾和化学气体。

物理安全计划包括 UPS 单元，用于保护计算机和外设。UPS 将市电通过交流插座传递并为内置的直流电池充电。离线 UPS 将市电通过旁路电路传递到交流插座，同时也为电池充电。在线 UPS 将交流电转换为直流电，再将直流电转换为交流电。UPS 单元的额定值以伏安（VA）、瓦特、容量和运行时间为单位。

许多机架式设备需要外部电源，通常是 PDU。PDU 具有多个交流电插座和连接到交流电插座的电源线。PDU 可以是地面安装或机架安装。PDU 有七种配置：标准型、计量型、监控型、切换型、自动转接开关型、热插拔型和双回路型。PDU 的额定值还包括功率额定值和负载能力。

数据中心和服务器机房必须是安全、可靠的环境和工作场所。创建一个功能性、安全、可靠的区域的指南和标准如下：空间、照明、电气安全、防火安全和安全性。服务器机房通常有架空地板，地板承载有三种负载类型——点负载、静态负载和滚动负载。

问题

使用多个认证因素验证申请人的方法是什么？
1. SFA
2. CHAP
3. DHCP
4. MFA
以下哪项不是身份验证中使用的因素类型？
1. 你知道的事情
2. 你拥有的东西
3. 关于你的事情
4. 你所做的事情
什么是防止未经授权进入、访问和恶意行为到私密区域的安全措施？
1. 逻辑安全
2. 物理安全
3. 入侵检测
4. 人体通道
以下哪项不是私密区域的通用威胁类别？
1. 网络
2. 环境
3. 技术性的
4. 人为的
CompuGood 公司拥有一个大型服务器机房，内有几排机架式服务器、电源单元和网络附加存储。它将设备按行排列，以便 HVAC 系统为每一行提供合适的冷却。该服务器机房使用的环境控制方法是什么？
1. 区域调节
2. 隔间化
3. 冷行/热行
4. 行内/行外
以下哪项通常不包含在环境监控系统中，既不被扫描也不被报告？
1. 温度
2. 逻辑入侵
3. 烟雾和化学气体
4. 湿度
哪种设备能够电气保护计算机和外围设备，并在停电时提供电力？
1. PDU
2. HVAC
3. UPS
4. PSU
哪种设备通过多个交流电源插座为机架式设备提供电力分配？
1. PDU
2. HVAC
3. UPS
4. PSU
以下哪项不是 PDU 的配置类型？
1. 标准
2. 热插拔
3. 双回路
4. 切换式
服务器机房中的架空地板应满足三种主要负载类型。以下哪项不是架空地板的负载类型等级？
1. 广泛负载
2. 点载荷
3. 静态负载
4. 滚动负载

第十三章：逻辑安全

物理安全（参见第十二章，物理安全和环境控制）保护组织及其计算资产和资源免受损害、破坏和盗窃。逻辑安全不是物理安全的对立面，而是安全整体的另一个部分。逻辑安全与物理安全具有相同的总体目标——保护、预防、检测和阻止对任何组织极为重要的资源的入侵。

在本章中，我们将探讨用于实施逻辑安全政策以保护组织数据、软件和计算资产的各种方法、程序和技术。我们将涵盖以下主题：

访问控制
数据加密
数据保留和处置
物理销毁磁盘驱动器
操作系统、系统、应用程序和硬件强化

访问控制

我们之前谈到了在路由器上的访问控制（参见第十一章，安全系统和协议）及访问控制列表（ACLs）的使用。然而，在逻辑安全的背景下我们谈论的访问控制，虽然在结构和程序上有所不同，但其总体目标是相同的——防止未经授权访问系统软件和数据资产。

访问控制是一种逻辑安全方法，用于确定个人用户可以访问、修改、创建或移除哪些资源。通过使用访问控制，系统管理员可以基于个人或群组的基础允许或限制对某些系统资产和资源的访问。每个经过身份验证和授权的用户或群组都被分配一个安全标识符（SID），它是详细说明用户或群组访问权限和权限的系统记录的标识；也就是说，它们的安全主体。

当用户作为个人或作为群组的成员请求访问系统资源或资产时，SID 记录告知操作系统（OS）授予该用户的访问权限和权限。通常，请求的访问以读取或写入资源的形式进行。作为响应，操作系统扫描相应的 SID 来确定是否可以允许请求的访问。

访问控制标准

授予系统资源访问权限可以基于几种不同的标准。虽然访问权限和权限可能仅基于用户身份，向个别用户授予访问权限的管理——称为自主访问控制（DAC）——在小型组织中可能是可行的。然而，在更大规模的企业，特别是地理上分散的企业中，分配权限的标准可能来自各种识别因素，例如以下内容：

组访问控制：组访问定义了系统管理员分配给该组的单个用户的共同权限和权利。组账户通常是通用的，例如普通用户组账户或会计部门账户。组账户和组访问控制允许管理员对需要相同权限集的用户组实施访问控制策略。
基于角色的访问控制 (RBAC)：用户的行为——即其职称、工作、任务、职责或责任——可以定义该用户执行或完成任务所需的权限和权利。通常，RBAC 定义了一些执行相同任务并需要相同资源的用户组。
特定标准访问控制：尤其是在地理分布广泛的网络中，某些标准可能定义组账户的访问标准。以下是一些常见的标准：
- 位置：位置访问控制可以基于用户的位置限制访问，例如分公司或远程制造站点。
- 时间：在此情况下，访问只能在特定的日期和时间段内进行。例如，公司政策可能限制财务数据的访问仅限于周一至周四，并且仅在每天的上午 10:00 到下午 2:00 之间，且可能仅限于财务组的用户。
- 事务类型：在在线事务处理系统中，访问支持数据库元素的权限是特定于各个事务类型的。权限也可以与用户的身份或组账户相关联。
- 应用程序：访问控制还可以根据在线或离线应用程序的类型和目的定义权限和权利。通常，登录用户的权限和权利扩展到用户执行的任何应用程序。如果禁用此控制，即用户帐户控制（UAC），则应用程序的权限将超出用户的权限范围。

访问控制级别

除了在不同上下文中对用户应用访问控制外，访问控制还可以应用于系统的硬件和软件组件，且用途相同。访问控制机制可以限制对软件和硬件组件的访问和使用。

文件系统访问控制

除了分配给单个目录、文件夹和文件的权限外，文件系统（如 Windows NTFS、Unix POSIX 和 Linux NFS）还具有 ACL，它指定了用户和组对文件系统内程序和文件的权限。文件系统中的每个项都有一个访问控制条目（ACE），该条目定义了与每个单独项目相关联的权限。

ACE 中的权限与单个文件系统元素的权限非常相似，指定了谁具有访问权限以及每个组或用户可以对元素执行什么操作。以下截图显示了 Windows 高级安全设置中的文档对话框，权限和权限可以在该对话框中分配给文件夹和文件上的组和用户：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/12d7bf9c-edf8-44d5-b268-67f23fa10ab7.jpg

Windows 高级安全设置用于为文件夹和文件设置权限和权限

以下截图显示了 Linux 系统中/usr目录的 ACL 内容：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/86544fd4-01f4-4f9f-aaf2-1017edb57522.jpg

getfacl命令显示 Linux 系统中目录或文件的权限和权限

如上图所示，该目录的权限和权限属于三种不同的访问级别——文件所有者、组所有者（即文件所有者所属的组）和其他所有用户，在本例中分别是root、root和other。表示读取（r）、写入（w）和执行（x）的字符代表每个级别的权限。前述截图中/usr目录的用户/所有者具有读取、写入和执行权限。写入权限包括修改和删除。root组以及所有其他用户和组仅具有读取和执行权限，这意味着他们可以打开、扫描、显示，如果文件是程序或脚本，还可以运行它。

外部设备的访问控制

控制服务器及其他网络设备（如路由器或交换机）的内部或外部设备访问，必须是任何网络安全策略的关键部分。现代外部设备本质上就是计算机，这使得它们成为网络攻击的潜在目标。以下是一些限制对这些设备未经授权访问的方法：

管理员密码：所有外部设备都包含一个配置过程，用于设置其性能和安全设置，包括管理员级密码。设置此密码有助于防止未经授权访问设备的配置。
应用补丁和固件升级：大多数内部和外部设备都有相关软件，它提供了与计算机或操作系统的接口。保持这些软件的最新版本可以确保安全功能也能及时更新。
禁用未使用的功能：像任何系统一样，计算机设备和外部设备可能包含一些未使用的功能。禁用这些功能可以增强设备的安全性。
限制访问控制：这些包括任何允许用户登录以修改设置和配置的访问功能。只有管理员应有权限访问这些功能，打印服务器、直接将打印任务发送到设备的网络节点以及管理设备及其网络的管理员工作站也应具有访问权限。
隔离设备：外部无法访问的内部网络应包含外围设备。

管理访问控制

定义和规范谁可以访问组织的服务器和网络，以及他们可以做什么，应该在安全或访问控制政策中。该政策应详细说明各个用户和管理员组的访问权限和特权。管理员访问控制应限制仅那些安装、配置、管理和监控执行访问控制系统资源的软件或硬件的技术人员才能访问。即使在系统管理员的总体组内，访问权限也会根据责任、职位、技能和知识有所不同。

安全组和分发组

Windows 操作系统在其活动目录（AD）服务中提供了两种类型的组帐户。新建的组必须有一个组类型，可以是安全组或分发组。安全组允许你分配访问控制、文件和文件夹的权限。分发组仅用于分发电子邮件信息。安全组通常反映组织的组策略，并在用户和硬件安全设置上提供灵活性。另一方面，分发组仅用于分发信息，不用于安全目的。

网络访问控制（NAC）

NAC 是一种软件或集成设备，顾名思义，它控制对网络的访问。NAC 实现了组织的安全政策，执行逻辑合规性，并管理网络访问控制规则。NAC 适用于有线和无线网络，以及云计算。

NAC 基本上只允许经过身份验证的设备和笔记本访问网络资源，并监控对受保护设备的任何访问。因为 NAC 由政策、程序、工具和应用软件组成，它能够限制用户和设备对网络连接设备和资源的访问及活动。NAC 涵盖了网络上所有连接的设备。

数据加密

数据或文件加密是将加密算法应用于数据或文件，使其在存储或传输时，只有具有适当访问权限的用户或收件人才能打开、执行或应用其内容。加密和密码学是广泛的术语，涵盖了多种方法、应用和手段，用于保护数据和文件资产。接下来的讨论中，我们将使用加密这个术语来涵盖通过应用密码学对数据进行转换。

在最基本的层面上，加密有三个主要目标——机密性、完整性和可用性（CIA）。此外，CIA 三元组通常会扩展以包括身份验证、授权和不可否认性。加密是数据完整性和机密性保护机制。

存储加密

在计算机系统或网络中，数据（包括数字媒体、文档和编程）可以处于三种状态之一：使用中、传输中和静止中。使用中的数据已被解密，并通常复制到内存中以进行逻辑操作。传输中的数据在通过传输线路时需要防范各种拦截技术（这些技术都是不安全的）。同样的保护（甚至更强的保护）对于存储在某种数据存储介质上的敏感或机密数据也是必需的，例如硬盘、闪存驱动器，甚至可能是磁带。

存储设备上静态数据加密可能具有不同级别的数据安全性。加密几乎应用于存储设备的所有层次，包括整个硬盘驱动器，在某些情况下也包括可移动介质。全盘加密 (FDE) 本质上在存储介质和主内存之间创建了一个通道。当数据传输到磁盘进行存储时，它会被加密；当数据传输到内存时，它会被解密。实际上，相同的加密/解密过程可以保护磁盘分区、文件系统、单个文件或单个数据元素，例如电子表格或数据库中的一列、一行或一个单元格。

数据保留与处置

有时，确保数据的安全意味着需要将其删除。当数据不再需要时，通常取决于数据类型、其操作环境、安全级别以及任何要求特定处理或保留的法律或法规。以下表格显示了一些常见数据保留政策项目及其保留期限的示例：

类别项目 保留期限 销毁日期 处置方法 组织记录 IRS 表格 1023 永久不适用不适用财务记录财务报表永久不适用不适用财务记录银行存款 7 年 2024 年 1 月 1 日销毁税务记录薪资税扣缴—2015 7 年 2022 年 4 月 30 日焚烧人事记录 I-9 表格终止后 5 年变化销毁基于计算机的通讯内部电子邮件 12 年每月月底电子软清除

擦除磁盘

根据你的目标，移除硬盘驱动器上数据的方式有几种不同的级别。最低级别（破坏性最小）是删除，而最高级别（破坏性最大）是清除。介于这两者之间的是擦除和粉碎。用户通常将这些术语（及其操作）视为移除某些东西的不同名称，无论是半永久性移除还是永久性移除：

删除：通常，删除操作适用于移除一个或多个文件、目录或文件夹。然而，与彻底擦除相比，删除命令本质上是软删除。在从磁盘删除对象后，构成数据的电信号（比特）仍然保留在原地。删除功能移除文件在磁盘上的位置索引指针，并将其空间标记为可用。在新数据覆盖该空间之前，恢复删除操作将通过替换其索引指针来恢复文件。
擦除：虽然用户可能认为删除和擦除基本相同，但擦除会永久删除文件和文件夹，因此它们将永远消失。从磁盘擦除数据涉及使用专门的软件工具，例如Darik’s Boot and Nuke（DBAN）2.3.0、Eraser 和 CBL 数据粉碎器。这些工具通过随机字符或二进制零（空值）覆盖磁盘，从而永久摧毁磁盘上的数据。
清除：清除磁盘驱动器比擦除要更具破坏性。当你清除一个存储设备时，无论是计算机中的二级存储、手机上的存储还是闪存驱动器，你不仅会移除活动数据，还会移除任何可能仍然可恢复的数据。执行擦除的软件下载工具也会执行清除操作。一些磁盘清除软件工具包括远程格式化、擦除或清除硬盘的功能。
粉碎：粉碎操作基本上是一种清除，但仅限于单个文件或文件夹。像擦除或清除操作一样，数据会被随机字符或零值覆盖。

格式化

许多用户认为格式化会删除存储介质上的所有数据或文件。事实上，格式化磁盘的效果与删除文件几乎相同——所有受影响的文件和数据看起来都已消失。就像删除单个文件一样，数据仍然存在。然而，格式化命令会移除所有索引条目，实际上删除了对现有数据的所有引用，并将所有存储位置标记为可用。与单个文件删除一样，格式化磁盘上的数据是可以恢复的。

数据存储设备有两种不同级别的格式化：

低级格式化（LLF）：通常，硬盘制造商在将存储设备安装到计算机机箱之前执行此过程。低级格式化会在磁盘上放置数字扇区标记，将存储介质映射到柱面、磁道和扇区。
高级格式化（HLF）：在低级格式化之后，磁盘仍然需要为操作系统使用进行准备。高级格式化为操作系统提供了分区或逻辑卷所需的结构。通常，高级格式化发生在操作系统安装过程中，或者在安装一个全新的未使用的硬盘后。

那么，格式化磁盘会删除或擦除数据和文件吗？ 这取决于情况。Windows 操作系统提供了一种名为快速格式化的工具，实际上这是一种对整个分区或磁盘的软擦除。快速格式化只是一种大规模删除，只是去掉了索引，因此是快速的。Windows 还提供了一种格式化功能，它做的是一些人称为硬擦除的操作，因为它会对整个磁盘进行一次彻底的擦写，将零写入所有位。

物理摧毁硬盘驱动器

在至少擦除一次磁盘后，如果你希望百分之百、毫无疑问地确定磁盘及其现在已经遗忘的数据永远消失，你应该物理摧毁硬盘驱动器。有多种方法可以做到这一点。以下是你可以使用的几种方法，确保磁盘永远无法读取：

移除并摧毁磁盘盘片：假设我们正在查看的硬盘驱动器是将数据存储在涂有铁氧化物的盘片上，我们可以使用星形螺丝刀打开驱动器的外壳和固定盘片在轴上的卡环。移除盘片并将其打碎，焚烧，或使用任何你希望的方式摧毁它们。如果你愿意，也可以不移除盘片而直接用锤子敲打它们。无论哪种方式，都可以将驱动器外壳、任何松动的电子部件和盘片碎片送到电子废料回收处。
穿透硬盘驱动器：通过钻孔（当然是使用电动钻）、用大螺丝或钉子穿透外壳，或使用任何能让驱动器无法使用的工具穿透外壳，未必能确保数据无法读取。
销毁硬盘：这种方法适用于所有类型的数据存储设备，包括内外部硬盘驱动器（HDD 或 SSD）、闪存驱动器、CD-ROM 和 DVD-ROM。当然，对于 CD-ROM 和 DVD-ROM，只需要销毁已记录的介质。工业碎纸服务可以将这些设备粉碎成小块，并收取少量费用，这能提供最高的保障，确保任何数据无法访问。

强化

通常来说，强化是为了通过减少工作站、服务器和网络的漏洞，增加其安全性，防止被利用。强化有多个层级，但你在 Server+ 考试中可能会遇到的有操作系统强化、系统强化、应用强化和硬件强化。

操作系统强化

加固操作系统在确保计算机安全的过程中起着重要作用。客户端操作系统和服务器操作系统的加固过程略有不同。虽然两者的大部分步骤相同，但我们将重点讨论网络服务器操作系统的加固。基本上，加固操作系统包括四个主要步骤：禁用不必要的服务、禁用未使用的 TCP/UDP 端口、仅安装支持任务所需的软件，并通过应用补丁和更新保持操作系统的最新状态。

每个主要操作系统都有自己特定的加固实践，但有些措施适用于任何操作系统。这些措施包括以下内容：

未使用的软件：你出于好奇或为了解决一次性问题下载的免费应用程序，像几乎所有软件一样，都可能成为黑客入侵的途径。移除任何未使用或不必要的软件，并确保你的策略限制用户在工作站上安装非标准软件的能力。
组和用户账户：服务器常见的安全隐患之一是由于管理错误，用户发现自己能够访问机密或私人信息。所有用户密码应遵循统一的密码策略。定期审查所有组和用户账户的权限和权利。
补丁管理：虽然保持操作系统更新，应用最新的补丁、错误修复、服务包和更新是一个好习惯，但确保补丁适用于你的系统也很重要。这可能需要在应用补丁前后进行测试和审计。
建立并监控基线：基线是为服务器（或客户端）的操作系统和组件设定的标准性能或容量水平。安装时生成的操作基线并在每次系统修改后更新，作为与当前性能水平对比的标准。与基线的较大偏差可能表示潜在的安全事件。

系统加固

系统加固，也称为工作站或 PC 加固，是提高网络节点安全性的过程。加固措施适用于工作站的几乎每个部分，包括主要硬件和软件组件，并涉及整体安全性。除了适用于服务器的加固步骤外，还有一些专门针对网络工作站的步骤，包括以下内容：

用户账户策略：尽管技术上这是一个服务器级别的策略，但用户账户策略和权限会影响用户访问网络的能力，以及本地主机上的软件和数据。密码策略应要求定期更换密码、设定密码长度、密码重用政策和登录失败锁定标准。用户权限也应符合安全政策和访问控制模型。
物理安全：用户应了解并理解适用于其工作站的物理安全政策。这应包括对建筑物、工作室或办公室或隔间的出入口控制的政策。整洁办公桌政策要求保护物理文档和计算机的访问权限。用户还应了解在发生灾难性事件时的责任。
日志记录：除了键盘记录器，记录用户的所有系统和网络交互，包括登录和登出时间、访问的应用程序和数据，以及任何与安全相关的程序或数据访问尝试、成功和失败。
自动补丁应用：对工作站操作系统和应用程序执行的修复和补丁可以自动发布。
禁用共享：禁用文件和设备共享，以防止通过共享系统进行基于网络的访问。

应用程序加固

应用程序加固也被称为应用程序防护，因为这一过程改变了应用程序或工具的二进制代码，使其更能抵御篡改。应用程序软件可能会受到反向工程、入侵以及在某些情况下的代码注入。加固过程不仅保护了应用程序代码本身，而且在许多情况下，它还保护了数据不被应用程序访问。应用软件常见的威胁包括漏洞发现、病毒和其他恶意软件攻击，以及可能的应用程序和数据窃取。

硬件加固

除了操作系统和应用程序软件的加固，系统或网络的安全性还可以通过对工作站和网络上的某些硬件设备进行加固来增强。

主机硬件加固

大多数主机系统的硬件加固过程都在 BIOS/UEFI 配置设置中。设置访问配置设置的密码、禁用 Wake-on-LAN（WOL，如果可用）并设置启动设备顺序，以消除远程启动的初始化，这些都是帮助防止主机系统入侵的设置之一。

网络设备加固

加固网络的一项重要组成部分是通过加固网络设备来保护网络的基础设施。然而，不同制造商的网络设备可能需要稍微不同的步骤来加固。一般来说，加固路由器、防火墙、交换机、桥接器和其他设备使用大致相同的过程来实现相同的目标。用于加固网络设备的一些常见步骤包括：

备份配置：将设备操作系统的当前配置和设置的副本存储在安全位置。
禁用管理协议：禁用未使用的任何管理协议，例如 Telnet 和 文件传输协议（FTP）。
禁用未使用或不必要的服务和协议：禁用不使用的设备服务和协议，例如任何发现协议、HTTP、SNMP 和 引导协议（BOOTP）
加密配置文件：在传输配置文件时，应用加密以保护其内容
安全访问：使用强密码策略访问设备控制台及其辅助和虚拟终端接口
定义安全标准：为网络设备及其操作定义安全标准和程序

端点安全

即使对服务器和网络进行了硬化，额外的措施也可以增强其整体安全性。当客户端连接到主机时，连接会创建两个终止点：一个入口点和一个端点。入口点在连接的客户端端口打开，服务器（其接口端口）成为端点。由于日益增多的 自带设备（BYOD）政策，端点安全迅速成为一个问题。在这些环境中以及多种远程访问形式中，端点安全必须集中于检测和防止入侵和恶意软件。

入侵检测系统（IDS）可以是硬件或软件。无论如何，IDS 扫描网络流量（入站或出站），以识别恶意软件或可疑行为模式，并监视系统配置设置以防止意外更改。端点 IDS 是 安全信息和事件管理（SIEM）应用程序，用于监视、扫描和收集有关端点流量的信息。一些 IDS 允许设置性能和事件阈值，超过这些阈值时会向管理员发送警报。在网络上，端点和入口点 IDS 设备分别被称为 基于网络的入侵检测系统（NIDS）或 基于主机的入侵检测系统（HIDS）。NIDS 是一种独立设备，用于监视网络流量，使其在传递到网络设备之前可以被检测到。HIDS 可以是连接到主机计算机的硬件或软件，也可以在主机上运行的软件。

IDS 主要有两种类型 — 签名和 启发式：

签名型 IDS 从可疑消息中提取一段代码，对其进行算法处理，然后与已知恶意软件数据库进行比较。如果匹配成功，将删除消息，创建相关日志条目，并通常禁止发送者访问网络。
启发式 IDS，即异常基础 IDS，将可疑程序的操作与可接受操作模型进行比较。如果匹配成功，可能会出现误报（匹配成功，但消息有效且非恶意）或漏报（不匹配，但消息无效且可能是恶意软件），否则 IDS 可能会阻止源地址进入网络。

概要

访问控制确定单个用户可以访问、修改、创建或删除的资源。访问控制允许或限制对系统资产和资源的访问。在大型组织中，分配权限的标准可能来自不同的识别因素，如群组、角色、位置、时间、日期、交易类型或正在使用的应用程序。

访问控制可以应用于硬件和软件。文件系统 ACL（访问控制列表）指定权限和授权。每个文件或对象都有一个 ACE（访问控制条目），定义其拥有者、组和其他用户的权限。每个级别可以有读取、写入和执行权限。设备的访问控制通过管理员密码、应用补丁和升级、禁用未使用的功能、限制访问以及通过隔离设备来实现。

加密应用一种加密算法对数据或文件进行加密，以限制其内容仅对具有适当访问权限的人员可见。加密和安全性有三个主要目标：保密性、完整性和可用性。CIA（保密性、完整性、可用性）扩展为包括身份验证、授权和不可否认性。数据可以处于使用中、传输中或静态状态。

有几种方法可以从硬盘中删除数据——删除、擦除、清除和粉碎。

格式化会移除所有索引条目，但数据本身仍保留在磁盘上。格式化磁盘上的数据是可以恢复的。低级格式化会在磁盘上放置数字扇区标记，将存储介质映射为圆柱、轨道和扇区。高级格式化会添加操作系统用于分区或逻辑卷的结构。销毁硬盘有几种方法：移除并销毁盘片、穿透硬盘或粉碎硬盘等。

加固通过减少系统或设备的漏洞来提高其安全性。不同类型的加固包括操作系统加固、系统加固、应用程序加固和硬件加固。加固操作系统包括禁用不必要的服务和未使用的 TCP/UDP 端口，只安装所需的软件，并应用补丁和更新。此外，加固还可能包括删除未使用的软件、审核组和用户权限、执行补丁管理、建立和监控基准线。

系统加固提高了网络节点的安全性。这可以包括强制执行用户账户策略、实施强密码策略、遵守物理安全政策、启用系统日志记录、禁用文件和设备共享。应用程序加固通过修改应用程序的二进制代码，使其抵抗篡改、逆向工程、入侵和代码插入。主机系统的硬件加固通过 BIOS/UEFI 配置设置来完成，包括设置 BIOS/UEFI 密码、禁用 WoL 和设置启动顺序以消除远程启动。硬化网络设备包括备份设备配置、禁用未使用的管理协议和服务、加密配置文件以及确保访问安全。

IDS 是一种硬件或软件，用于扫描网络流量中的恶意软件或可疑行为模式。端点 IDS 监控、扫描并收集端点流量的信息。NIDS 在网络设备之前监控网络流量。HIDS 是一种在主机计算机上的硬件或软件。IDS 的两种类型是特征匹配和启发式。

问题

以下哪项不是常用的访问控制识别因素？
1. 组
2. 角色或分配
3. 应用程序类型
4. 计算机名称
分配给特定用户或组的权限和权利定义在什么元素中？
1. ACL
2. ACX
3. ACE
4. ACR
将加密算法应用于数据以限制访问其内容的目的是什么？
1. 保密性
2. 身份验证
3. 授权
4. 加密
以下哪项是从磁盘驱动器中删除数据的方法？
1. 删除
2. 擦除
3. 擦除
4. 擦除
5. 以上所有
6. 以上都不是
以下哪项描述了磁盘驱动器格式化后任何数据的状态？
1. 不可恢复
2. 销毁
3. 可恢复
4. 不可读
系统或设备加固的目标是什么？
1. 延长服务寿命
2. 加强其案例
3. 降低漏洞
4. 使其离线
应用程序加固修改应用程序的二进制代码：
1. 正确
2. 错误
设置 BIOS/UEFI 密码和禁用 WoL 是以下哪种操作的例子？
1. 应用程序加固
2. 操作系统加固
3. 网络加固
4. 硬件加固
当 IDS 将消息中的内容与身份代码数据库进行比较时，它正在执行什么操作？
1. 启发式扫描
2. 特征匹配
3. 二进制匹配
4. 数据扫描
哪种软件或硬件设备可以通过实施组织的安全策略来控制网络上的访问？
1. NAC
2. SAC
3. UPS
4. IPSec

第四部分：故障排除

本部分内容涵盖了故障排除的一般流程和方法，特别针对硬件、软件、网络、存储设备和安全应用的故障排除。

本节包含以下章节：

第十四章，故障排除方法
第十五章，常见硬件问题
第十六章，常见软件问题
第十七章，常见网络问题
第十八章，常见存储问题
第十九章，常见安全问题

第十四章：故障排除方法

在本章中，我们将审查标准故障排除方法和程序以及由硬件、软件、网络、存储设备和安全系统引起的常见服务器问题。

在本章中，我们将回顾用于识别、隔离、重现、应用和测试任何一般硬件、软件、网络、存储设备和安全策略及设备的故障或故障的一般程序和方法。本书的此部分的后续五章分别涵盖了这些子系统的具体故障排除过程。本章的主题是适用于任何故障排除情况的故障排除程序的回顾，如下所示：

故障排除步骤
识别问题
建立和测试原因理论
制定解决问题的行动计划
记录发现和结果

故障排除步骤

在计算机、服务器和网络环境中，故障排除是一种结构化过程，用于识别、隔离和解决性能问题或故障组件。无论计算机的大小、用途、使用情况或位置如何，其问题对其用户、运营商和利益相关者都很重要。计算机维修技术员的责任其实很简单——识别问题、解决问题，并记录这两个动作。是的，这个过程还有几个步骤，但它们大多是为了验证假设和测试解决方案。

尽管没有真正的用于故障排除过程中使用的步骤标准，但详细说明了在 Server+考试目标中列出的故障排除步骤如下：

确定问题并确定范围
建立可能原因的理论
测试理论以确定原因
建立解决问题并通知受影响用户的行动计划
实施适当的解决方案或升级
验证系统功能完整性，并在适用时实施预防措施
在整个过程中记录发现、行动和结果

请理解，这些步骤的应用可能在每个故障排除情况下都不一定是必要的。例如，常见组件的故障易于识别、更换、测试和记录。在其他不那么明显的情况下，每个故障排除步骤都是必要且重要的。

技术人员对计算机系统的知识是解决计算机问题的重要工具。然而，技术人员的人际交往能力可能同样重要，甚至更重要。与沮丧或慌乱的最终用户、监督者或一般利益相关者互动以更多了解问题的本质，是计算机维修技术员的重要技能。此外，技术人员的工作习惯和职业道德贯穿整个故障排除和修复过程。执行的工作应该是高效、有效和正确的。

确定问题

确定问题的实际原因是排除故障的第一步。然而，这第一步的第一步应该是验证问题是否真实存在。通常，问题会在对硬件或软件进行更改后不久，甚至是立即发生。或者用户或相关方认为发生了某些事情，但无法重现他们认为看到、听到或闻到的情况。为了验证问题是否真实存在，可以尽量重现问题——如果可能的话——或者花时间通过开放性问题（不能简单回答是或不是的问题）向用户提问。记住，用户、主管或相关方通常没有你对计算机系统的了解或理解。

确认有问题后，无论是报告的问题还是其他原因，开始确定问题的来源、原因和位置。大多数 PC 硬件问题相对明显，但看似硬件问题的问题很可能是软件问题。或者症状可能与多个组件的问题有关，或者一个问题表现为多个不同的问题。

无论问题的来源如何，如果可能的话，你应该备份硬盘并记录已安装组件的清单，至少这样可以在系统出现问题时恢复到没有问题的状态。

硬件还是软件？

虽然这个问题看起来很简单，但一些问题仅凭症状可能难以确定。排除故障的方法以及可能使用的工具在这两个领域是不同的。如果你明确无法确定问题的来源，可以凭借你的知识和经验开始排查你认为可能是问题的地方。

硬件问题

为了判断报告的问题是硬件问题，还是看似软件问题但实际上是硬件问题（例如，死机蓝屏 (BSoD)），最好的方法是采取系统化的方法。实际上，硬件问题通常与松动的连接器或跳线、脏污的风扇和组件，或者因软件错误而导致的硬件组件故障有关。在排除硬件问题时，首先要处理任何明显的问题，无论你是否认为它们与问题有关。一台不干净的 PC，只有在清洁后才更容易进行维修；灰尘可能会导电。

硬件问题的常见领域包括以下几个方面：

主内存
电源
散热风扇
硬盘驱动器 (HDD)
显卡或图形卡
扩展卡、插槽和端口
电缆连接

软件问题

软件问题比硬件组件问题更为频繁。计算机上的软件可以分为三种类型：系统软件（例如操作系统）、应用软件（例如 LibreOffice）和工具软件（例如设备驱动程序）。每种软件类型都可能有自己的一套问题。操作系统问题通常是由于配置不当、设置错误或兼容性问题引起的。操作系统问题可能需要轻微调整或完全重新安装。应用软件问题可能有一些相同的问题，但通常一个严重问题可以通过更新、补丁或修复注册表来解决。工具软件问题主要是版本问题，通常通过替换安装来轻松解决。

常见软件问题的一些原因如下：

丢失或损坏的系统或配置文件
恶意软件攻击
安装或移除软件不当
损坏的文件系统或注册表

确定可能的原因

识别问题是一方面，通常是显而易见的，但有时识别根本原因则更具挑战性。确定可能的原因是一个过程，它识别出问题的可能原因，分析它们成为原因的可能性，最终确定一个或多个原因进行进一步调查。该过程的总体目标是确定问题的可能根本原因。列出可能的原因，简单或更明显的问题排在顶部，复杂且不太可能的排在底部。

根据优先级列表，从上到下开始测试每一个可能的原因，以证明或排除你所识别的可能原因。列表顶部的可能原因应该是最简单的测试项。如果其中一个可能性被证明是问题的根源，下一步是制定解决问题的计划。然而，如果在测试了所有可能的原因后，仍未能找到问题的确切根源，你应该重新审视问题，并在可能的情况下，制定另一个可能原因的列表。如果你穷尽了所有可能的原因——至少是你能想到的原因——可能需要将调查升级到更有经验的技术人员，或许是制造商。

制定行动计划

在绝大多数情况下，解决问题的方案通常只是移除硬件组件、应用程序补丁，或重置或重新配置系统设置或参数。涉及的基本过程是获取替换部件或软件（如果解决方案需要替换硬件组件）、清除工作区域的静电以防止电静电损害内部组件、收集所需工具、进行必要的修复，并彻底测试修复后的系统。

如果您正在解决多个问题，影响修复并分别测试每一个问题。随着您的进行，每个后续测试步骤都会重新测试之前的修复，因此您希望考虑您的工作顺序以累计兼容。如果在进行更改或一系列更改后，问题仍然存在或出现新问题，您应撤销到目前为止所做的更改，并重新考虑您的解决方案。完成修复并成功测试后，请通知其用户或利益相关者，并简要介绍问题的原因、您如何确定原因、您采取的解决方案以及您如何测试解决方案。

验证功能

在这一点上，您已经测试了用于缓解问题的修复或解决方案，并且现在是完全测试整个系统功能的时候，如果适用，还要测试系统与其交互的任何设备的交互。最好由指定用户、监督员或了解情况的利益相关者进行此测试。如果这个测试在任何级别上失败，请记录失败点，并重新启动整个故障排除过程，重点关注新的故障。

如果测试成功并且系统正常运行，确定是否有可能的预防措施可以帮助避免将来发生相同或类似的故障。这些预防措施可能是简单的改进备份程序或调整供暖、通风和空调（HVAC）系统，也可能是计划尽快更换整个系统。

记录发现、行动和结果

从网络服务器或主机的初始安装开始，全面文档记录应与系统的任何硬件和软件一样重要。个别计算机、网络和系统连接设备的文档应记录其修复和维护历史。此记录必须详细描述任何故障排除活动（无论成功与否）、任何修复、升级、补丁、修复、添加甚至从每个系统中删除的内容。其作为修复和维护记录的重要性在于，通常只有一名技术人员执行几乎所有计算机或系统的故障排除、修复和维护操作。

整理故障排除、修理和维护的完整文档对下一个将要处理该系统的技术员来说，比对你或其他任何人更为重要。由于该文档包含了任何报告的问题及其解决方案的书面记录，它减少了未来技术员的猜测工作。完整的修理和维护文档应包括：故障现场的日期、地点和联系人；报告的问题/技术员访问的原因；进行的故障排除描述；所做修理的描述以及任何被更换、添加或移除的组件的身份；任何软件更改的描述或身份，包括更新、配置、安装或移除；执行的测试的详细描述及每次测试的结果；以及此次访问未涵盖的任何疑似问题或需后续关注的潜在维护或修理问题。

从第十五章《常见硬件问题》到第十九章《常见安全问题》，每一章都专注于计算机的单一主要子系统或组件类别，常见的修理和维护问题，以及故障排除过程的步骤。

总结

故障排除是一个结构化的过程，用于识别、隔离并解决性能问题或故障组件。在 Server+的目标中，故障排除的步骤包括：首先，识别问题及其影响；识别一个或多个可能的原因；选择最可能的原因并验证其是否为问题的根源；规划解决问题所需的步骤；向任何受影响的用户解释应采取的步骤；执行解决方案计划；测试修复结果及整个系统；最后，当然，记录这个过程中的每一步以及你的操作。计算机系统的知识对故障排除非常重要，但人际沟通技巧同样重要。技术员良好的工作习惯和职业道德，以及其工作应该是高效、有效且正确的。

确定问题的原因是故障排除的第一步，而这第一步中的第一步是验证是否确实存在问题。通常，问题会在硬件或软件更改后出现。用户报告了一个问题，但无法重现它。你可以通过重现该问题来验证它。大多数 PC 硬件问题都很明显。然而，看似硬件问题的情况，实际上可能是软件问题。备份硬盘并记录已安装的组件。

常见的硬件问题包括主内存（RAM）；电源；散热风扇；硬盘驱动器；视频或图形卡；扩展卡、插槽和端口；以及电缆和连接。计算机软件分为系统软件、应用软件和实用软件。常见的软件问题包括丢失或损坏的系统或配置文件；恶意软件攻击；安装不当的软件；以及损坏的文件系统或注册表项。

确定可能原因的过程是识别问题的可能原因及其概率。从优先级排序的列表开始，测试每一个识别出的可能性。解决问题后，彻底测试修订后的系统。全面测试整个系统并让用户参与。文档应包括故障排除和执行工作时的完整记录。

问题

哪种诊断活动是一种结构化过程，用于识别和隔离计算机问题？
1. 维护
2. 分析
3. 故障排除
4. 系统测试
什么提问技巧最适合从报告计算机问题的用户那里获取信息？
1. 是/否
2. 闭合性提问
3. 多项选择
4. 开放性提问
除了计算机系统的技术知识外，计算机维修技术员应该具备哪些技能？
1. 使用修理工具
2. 人际交往技能
3. 人际交往技能
4. 使用诊断设备
确定计算机性能问题的源头或原因的过程中的第一步是什么？
1. 识别问题
2. 重启计算机
3. 关闭计算机
4. 测试一个可能的解决方案
验证报告的问题是否存在的最佳方式是做以下哪项？
1. 确定问题是硬件还是软件
2. 移除疑似的硬件或软件
3. 重新创建问题
4. 重启系统
在开始对计算机进行工作以隔离和识别问题之前，您应该采取什么警示性措施？
1. 打开命令提示符窗口
2. 备份整个硬盘
3. 移除硬盘驱动器
4. 从软盘启动计算机
以下哪项不是计算机软件的通用类别？
1. 系统软件
2. 娱乐软件
3. 实用软件
4. 应用软件
以下哪些组件类别是常见的硬件问题领域？选择所有适用项。
1. 主内存
2. 系统案例
3. 电源
4. 外部连接器
5. 冷却系统
6. 图形卡
以下哪些是常见的软件问题？选择所有适用项。
1. 损坏的系统文件
2. 安装不当的软件
3. 恶意软件攻击
4. 以上所有
5. 以上都不是
在对系统进行硬件或软件更改后执行完整系统测试时，应该包括以下哪些步骤？
1. 制定测试计划
2. 吸引用户参与
3. 记录结果
4. 以上都是
5. 以上都不是

第十五章：常见硬件问题

尽管大多数计算机问题与软件相关且容易解决，但硬件组件也可能出现问题，通常这些问题的影响最小，或在极端情况下可能是灾难性的。你排除故障、解决问题和记录硬件问题的能力，直接影响硬件问题可能带来的干扰程度。在本章中，我们将讨论相对常见的 PC 硬件问题。这些问题是你在作为认证服务器管理员的角色中，最有可能遇到的。

本章将讨论以下内容：

常见的硬件问题及其原因
环境问题

硬件问题

硬件问题可能是电气或电子组件中的故障，也可能与组件的设置、安装或配置有关，这可能导致整个计算机的故障或失效。然而，看起来像硬件问题的故障也可能是由软件引起的。为了避免显得过于显而易见，硬件问题和软件问题的一个主要区别在于，硬件问题通常需要你打开或拆除系统机箱，而不仅仅是应用一个补丁。

识别硬件问题

有些计算机问题很难确定是软件问题还是硬件问题。虽然有些问题很明显，比如机箱冒烟，但对于其他问题，你可能根本无法判断。以下是一些有助于你将问题识别为硬件问题的条件：

间歇性故障：一种不规则发生但每次以相同方式发生的问题，可能是硬件或软件相关的问题。如果该问题在安装新软件、补丁或对现有操作系统或应用程序进行升级后立即（或很快）出现，那么它很可能是软件问题。然而，如果问题发生在没有任何软件更改的时期，那么你猜对了——这很可能是硬件问题。
访问失败：如果问题出现在任何组件的使用或外设设备的 I/O 操作之后，那么问题很可能是由于硬件故障引起的。然而，问题也可能是由于软件缺陷导致的。在测试软件问题之前，你应该首先排除硬件问题。
随机停止或重启：如果你正在处理一个极为宝贵的文档、论文、学位论文或游戏，而计算机突然冻结并关机或随意重启，那么你遇到的就是硬件问题。
POST 故障：启动过程的一部分是开机自检（POST），它验证在 BIOS/UEFI 配置设置中识别到的设备的存在和功能。如果启动过程失败，POST 会在显示器上显示错误信息或代码，或在系统扬声器上发出一系列蜂鸣声（表示特定的错误状态）。显然，这是一个硬件问题，通常发生在新硬件安装之后。

其他通常表示硬件问题的症状如下：

BSoD/RSoD：蓝屏或红屏死机表示操作系统与硬件配置之间的错误
I/O：对二级存储的读取和写入非常慢
数据完整性：文件莫名其妙地损坏、损坏或丢失
混乱的显示：显示缺失部分图像；显示混乱或不是预期的图像或内容
异常噪音：来自系统机箱的刮擦声、磨擦声、敲击声，甚至可能有蜂鸣声

常见问题

大多数（但并非所有）计算机硬件问题相对容易诊断，并且在许多情况下容易解决。否则，为什么专注于网络服务器的认证考试会包括故障排除和修复信息呢？ 作为系统管理员，你的技能应包括识别和解决常见硬件问题的能力。以下各节列出了几类硬件组件的常见故障。请注意，这些问题很可能以某种形式出现在认证考试中。

POST 故障

正如我们之前讨论的，启动过程中的 POST 阶段出现故障可能会导致启动过程停止。虽然 POST 会传达它检测到的任何问题，但这种通信的形式在不同的 BIOS/UEFI 版本之间有所不同。Windows PC 和 macOS 计算机都在启动过程中执行 POST 作为初步步骤。POST 验证了基本组件和设备的存在和功能，例如电源供应单元（PSU）、主内存（RAM）以及系统总线结构等。如果这些设备中的任何一个未能响应 POST，系统扬声器会发出一系列可听的蜂鸣声来提醒用户。

在 POST 运行期间，唯一可用的输出设备是系统扬声器。因此，POST 使用短促或长鸣的蜂鸣声模式来指示它发现的任何问题。这些代码通常是主板或计算机制造商特有的。没有统一的蜂鸣代码，每个制造商都有自己独特的代码。因此，在一个环境中，技术员可能需要具备多厂商蜂鸣声知识。

下表是使用蜂鸣代码的示例，并附有一些说明它们含义的插图。如所示，蜂鸣音有短和长两种。短蜂鸣音通常持续一秒钟，而长蜂鸣音持续两秒钟：

数量和长度 含义 1 短音内存刷新故障 2 短音 POST 故障 4 短音系统定时器故障 5 短音 CPU 故障 8 短音显卡故障 10 短音 CMOS 故障 1 长音，3 短音内存故障 1 长音 POST 成功

过热

计算机过热的原因有很多，但通常是由于忽视了预防性维护。灰尘在通风口和散热器上积累，以及系统机箱内部的灰尘可能会阻塞或限制原本用于冷却发热元件的气流。系统机箱内部的热量慢慢上升到超出安全工作范围的程度，也可能会慢慢导致主板上的电子元件和已安装设备的性能下降。损坏的原因是灰尘形成了绝缘层，导致热量无法散发，从而引起了热量积聚。

另一个可能导致计算机过热问题的因素是其位置与通风和气流的结合。一个良好的通风空间提供了一个基础环境，有助于计算机冷却系统工程设计时所假设的条件。其他因素包括直射阳光、靠近外部窗户、或者家具或物体阻塞气流。

对于一台存在过热问题的计算机，无论是间歇性还是持续性，解决方案基本上是逆转导致计算机过热的条件。用压缩空气清洁系统机箱内部，吹走任何积尘，特别是冷却系统的通风口、风扇、散热器和空气通道。你可以使用吸尘器清理灰尘，但确保使用的是不会产生静电的吸尘器。换句话说，千万不要使用家用吸尘器！

如果清洁后问题仍未解决，检查计算机的位置以及其对周围通风系统的访问情况。将计算机移出直射阳光下，并远离任何阻碍气流的物体。若问题依旧，可能是机箱风扇故障，散热器或 CPU 风扇安装不当，或者导热膏过多或过少。你需要逐一排查这些问题，消除它们作为可能的原因。

处理器故障

如果计算机的微处理器出现故障，这通常是其他问题的很好的迹象——不过到那个时候也无关紧要。处理器出现故障的原因只有几个，比如极端的电力冲击或雷击、尝试超频 CPU 失败，或者长时间过热造成的累积损害。大多数处理器现在都包含一种保护机制，当其工作温度过高时，会使其速度减慢或完全停止。虽然这个功能可以保护处理器免受突发和剧烈温度升高的影响，但从长远来看，尤其是对高负荷使用的处理器而言，它仍然可能逐渐开始出现故障。

监控新组装的商业计算机上 CPU 的温度可以建立一个可靠的基准。然而，如果你安装了新的 CPU 或冷却设备，任何不注意的错位或不正确的应用都会导致一个错误的基准。定期检查系统与这个基准的对比，实际上就是在追踪故障时间（TTF）。

那么，你如何 测量 CPU 的温度呢？ 而应该是多少温度呢？ 这在不同处理器之间略有差异，但一般来说，处理器应该在 45^o 到 50^o 摄氏度（C）的范围内工作，相当于 113^o 到 122^o 华氏度（F）。在满负荷状态下，比如玩游戏时，CPU 的温度不应超过 75^o C（167^o F）。某些处理器可以在更高的温度下运行，但不能维持太长时间，否则会损坏 CPU。

以下截图展示了三种不同软件工具的捕获画面——Core Temp、CPUID HWMonitor 和 Open Hardware Monitor，按顺时针方向从左上角开始。这些工具和其他类似工具报告了多个操作参数来进行监控：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/4a60df44-0148-4a55-9463-c1474347ea90.jpg

监控处理器和核心温度的实用软件示例

内存故障

一台计算机，像人类一样，当其内存开始出现问题时，就无法正常运行。计算机中的内存相关错误和故障并不总是显而易见，而且在大多数情况下，似乎表明其他组件可能是问题所在。常见的内存问题包括：

逐渐变慢：当你第一次开机时，一切都运行得很快。然而，随着时间的推移，计算机变得越来越慢，直到下载一个网站或打开一个文档可能需要几分钟，而不是几秒钟。
随机重启：在你工作时，计算机会不定时地重启，重启之间的时间不固定，或者计算机会卡住，键盘和鼠标似乎无法工作。
文件损坏：虽然这通常看起来像是磁盘驱动器问题（也可能是），它也可能是内存问题。常见的内存故障可能会损坏一个常用的单个文件或文件系统，直到使磁盘驱动器无法使用。
安装失败：在安装或重新安装软件时，包括操作系统或大型应用程序，安装过程会停止、冻结，或者显示一个可能与实际问题无关的随机错误信息，这个问题很可能是内存问题。
蓝屏死机/红屏死机：蓝屏死机（BSoD）或它的“亲戚”红色屏幕，会迅速闪现显示器，告诉你可能存在问题（通常是内存问题），然后继续启动过程。

大部分情况下，内存问题的原因与影响 CPU 的原因基本相同——热量、电涌、电静电损伤、不当安装、超频 CPU、内存插槽损坏，或内存模块故障。

主板和组件问题

坏消息是，你可能认为主网络服务器的问题是主板问题。好消息是，问题可能并非真正是主板；它只是看起来像是主板的问题。记住，主板上有些组件是固定的，也有一些是安装在主板上的。附加组件、处理器、内存、散热系统等，可能是问题的根源，但不幸的是，最终问题可能确实是主板。

不必在意主板可能是计算机中最昂贵的组件这一事实——它可能是最难更换的组件。一旦你确信问题绝对是主板的问题，务必小心行事。在拆卸旧主板之前，标记每根电缆和线缆，注明它连接的设备、连接位置以及重新组装顺序。你会感激自己这样做的，相信我。

计算机的主要组件很少会突然完全故障。一般来说，它会随着时间的推移逐渐故障，发出一些警告信号，表明可能有问题，你应该去调查。以下部分列出了可能出现主板或其组件问题的几种迹象，顺序无关频率或重要性。

电容问题

主板上的三个主要电子组件是变压器、整流器和电解电容器。计算机电源中的变压器降低输入电力的电压。降压后的电力通过整流器将交流电转化为直流电。由于交流电波动，整流器产生的直流电也会波动。电容器，也被称为电解电容器或电容器，储存静态电荷。当主板上的直流电波动时，具有等效串联电阻（ESR）的电容器会提供足够的电流来升压电流。

一个可能的主板问题是电容器的故障。如下面的图片所示，故障的电容器可能会开始膨胀或顶端凸起，泄漏电解质材料，甚至发生火灾。电容器的故障不一定是紧急情况，但未经调节的直流电源可能开始损坏主板上的其他组件，包括处理器：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/21c0821c-c45b-469b-8c52-b4c21158018e.jpg

主板上的电容器显示膨胀的电容

图片来源：Wikipedia.com (https://commons.wikimedia.org/wiki/File:Defekte_Kondensatoren.jpg)

烧伤

如果电气组件，如电容器，发生爆裂或烧毁，结果通常是显而易见的：有电烧味（臭氧味）或主板上有烧毁的组件或电路的迹象。电子组件不一定需要起火才能看起来像是烧坏了。电气短路也能造成同样的效果。

USB 无法识别

你正在处理一台网络服务器，需要安装一个文件。你插入一个 USB 闪存驱动器，但屏幕上出现错误提示：“USB 设备无法识别：连接到此计算机的某个设备发生故障，Windows 无法识别它”。出现此错误可能有多种原因。然而，最好的方法是从最可能的原因开始排查。以下是一个处理过程：

验证闪存驱动器是否在其他端口或计算机上工作。如果在其他地方也无法工作，那就说明问题所在。
现在你已经确认闪存驱动器正常，检查 USB 端口是否有视觉上的损坏，尤其是如果它是外部设备，必要时更换它。
验证 USB 驱动器和 USB 根集线器（参考下面的截图）的设备驱动程序的有效性和版本（如果根集线器比实际 USB 端口多，不用担心）。如果需要，重新安装或更新设备驱动程序。
检查是否有松动的电缆、连接器或没有正确插入的线缆。替换或修复你发现的问题。

如果这些情况似乎是导致问题的原因，请采取适当的措施。然而，如果问题似乎不是硬件故障，那么问题可能出在操作系统、设备控制器、固件或根集线器设置上。请应用任何待安装的操作系统更新或补丁。更新系统固件，特别是如果更新涉及到 USB 或扩展总线。检查根集线器是否将 USB 设备置于选择性挂起状态：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/21647731-160d-439c-a7c5-1704146aa65d.jpg

检查 USB 根集线器设备驱动程序

扩展总线

扩展总线，也称为外部总线，提供了扩展插槽（以及插入其中的扩展卡）与系统总线之间的连接。大多数主板通常会包含多个扩展总线标准，以提供向后兼容性和组件灵活性。目前大多数主板上的扩展总线包括加速图形端口（AGP）、外设组件互联（PCI）、PCI 扩展（PCI-X）和PCI Express（PCIe）。PCI 总线是最流行的，通常出现在 PC 和 Macintosh 主板上。

与扩展卡和总线相关的常见问题之一是芯片松动。这种情况，也被称为电力松动，是由扩展插槽中金属连接器的温度变化引起的。随着时间的推移，扩展卡可能会开始晃动并逐渐从扩展插槽中脱落。解决这个问题的方法是将卡片牢牢地插入扩展插槽（当然，要在关机状态下进行）。

如果一张扩展卡在正确安装时没有问题，那么故障或性能问题很可能出现在与该卡相关的区域。扩展卡通常与一个或两个功能、组件或外部设备相关，如显卡、声卡和网络接口卡。因此，如果卡片出现问题，通常会表现为支持的设备出现问题。

如果一张正常运行的扩展卡突然出现问题，最常见的原因是过热和电源问题。过热可能会损坏卡片上的元件；不良的电源可能会造成严重影响；或者大范围的电涌可能会影响所有内部电子元件。另一种看似扩展卡问题的情况，可能是因为主板和芯片组包含了与已安装扩展卡相同的功能。移除该卡片可能会消除问题。

将卡片移到相同类型的不同扩展插槽中，可以验证故障是出在卡片、扩展插槽，还是与总线、设备驱动程序或芯片组有关。然而，解决扩展卡问题的最常见方法是将卡片更换为一个已知良好的卡片。

电源单元（PSU）

如果没有完全功能的电源单元（PSU），计算机就无法运行。计算机内部或连接的电子元件所需的电力，与其他任何电气设备的电力要求完全不同。是的，计算机确实通过插座连接电源，获得 110 伏或 220 伏的交流电，但其内部组件运行在+/- 3.3 伏、+/- 5 伏和+/- 12 伏的直流电上。交流电从插座转换为计算机所需的直流电，正是电源单元（PSU）的工作原理。

尽管电源单元（PSU）是计算机的主要组成部分，并且故障率最高，但当电源单元开始故障时，它是一件大事，而当它完全失效时则更为严重。早期检测到的电源问题可以防止其他内部组件出现严重问题，这些问题通常更难诊断。故障排除的最大挑战是，电源故障可能是计算机中任何电气问题的根源，而且往往的确是。以下是一些常见的迹象，表明电源单元可能正在故障或已经故障：

系统机箱背部靠近电源线连接处发出不寻常的噪音。
打开电源开关后，计算机没有启动，但计算机前面或后面会亮起闪烁的指示灯。
启动后计算机在非常短的时间内自动关机。
在玩游戏或使用应用程序时，计算机突然断电且没有任何警告，可能还会显示蓝屏（BSoD）。
新游戏的画面显示出现扭曲，电源单元的功率和电流不足以支持显卡。
计算机启动时，硬盘驱动器和冷却系统没有启动，导致系统死机。
接触金属机箱会产生电击。

解决电源故障的方法是更换电源，即使只是为了确认电源是否是检测到问题的根源。

硬盘驱动器（HDD）

机械故障是硬盘（HDD）问题最常见的原因，甚至在一定程度上也会影响固态硬盘（SSD）。硬盘的机械内部组件也是其运动部件，随着时间的推移，运动部件可能会磨损并故障。硬盘的故障几乎没有预兆。固态硬盘的故障周期要长得多，固态硬盘的常规保修期为十年，制造商声称固态硬盘可以保持功能超过 300 年。所以，我们还是聚焦于硬盘及其故障原因。

硬盘问题的常见原因包括以下几点：

热量：到现在为止，你应该已经意识到，计算机内部过高的温度是一个坏信号，而且长时间的高温会损坏或摧毁系统的关键组件。
湿气：似乎很合理，当硬盘浸泡在水中时，它可能会遇到一些问题。然而，问题不一定出现在硬盘外壳周围的主轴、磁头和盘片上，但水和电子组件的结合并不好。在没有完全干燥的情况下开机可能会导致电子组件短路，而不仅仅是硬盘上的组件。
静电放电（ESD）：另一方面，极度干燥的环境几乎能造成与潮湿环境相同的损害。静电积累可能导致组件或电路故障，包括硬盘。
电涌：交流电源中的常规电涌会随着时间的推移降低计算机的整体性能，但严重的电涌，例如雷击，可能会轻易摧毁硬盘驱动器以及计算机的所有电子元件。
物理损坏：硬盘驱动器的内部部件在精密公差下运行，设计上并不适应突然的震动、跌落或撞击。如果计算机，甚至仅是硬盘驱动器，被摔落、撞击或受到了足够的冲击力，硬盘很可能会发生故障。

如果你认为计算机问题可能是由硬盘驱动器引起的，可以使用自我监控、分析和报告技术（SMART）工具来显示其状态。此工具几乎在所有操作系统中都可以使用，包括 Windows、Linux 和 macOS X。以下截图显示了 SMART 硬盘错误 301 的结果，这表明硬盘驱动器出现故障，应立即进行备份：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/3754fec3-c3f1-4668-8103-a169d886399a.jpg

显示 SMART 硬盘错误

视频显示

显然，如果计算机的视频显示上有垂直或水平线条或条纹，正如下面的截图所示，说明出现了问题。此情况可能是由硬件或软件问题引起的。请根据情况选择一种方法开始排查：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/a5ea8f70-d8ec-4a8c-a291-9d0b93f8431c.jpg

显示器上出现垂直线条和条纹，表示存在问题

如果你开始将显示问题排查为软件问题，请按照以下步骤操作：

访问显示器制造商的网站，进入支持页面，下载适用于你型号的图形设备驱动程序
如果有多个驱动程序，请一次安装一个，完成所有驱动程序后重启计算机

如果这些步骤解决了问题，那就是软件问题，很可能是操作系统与之前版本的设备驱动程序之间的冲突或不兼容造成的。

如果你首先将问题排查为硬件问题，或者软件排查步骤没有解决问题，请使用以下步骤排查带有分离显示器的系统：

重启计算机并打开 BIOS/UEFI 配置系统。如果问题与硬件相关，启动进入 BIOS/UEFI 设置会将视频显示从与操作系统关联的视频驱动程序和芯片组功能中隔离开来，并仅通过基本驱动程序支持显示。
如果在 BIOS/UEFI 系统中显示问题仍然存在，那就是硬件问题。不同制造商甚至同一制造商的不同型号修复方法不同。请访问制造商的网站，找到解决问题的具体操作流程。

无论显示器的品牌或型号如何，有几个通用的检查步骤。检查电缆，确保它在每一端都正确连接。验证显示器是否连接到计算机的正确插头和视频标准。检查电源线和视频连接电缆是否有 sharp 弯曲、物理损伤以及松动的电线连接。

最后一点——如果视频问题出现在笔记本电脑、平板电脑或其他集成显示屏的计算机上，最好将其送到专业维修技术人员处，最好是厂家授权的维修人员。

其他常见问题

除了我们已经讨论过的问题和原因外，计算机系统中还可能出现其他一些不太具体的问题。这些问题包括以下几点：

兼容的组件：如果必须更换计算机的主要组件，则更换件与现有或其他新组件的兼容性对于计算机性能的提升非常重要。有一些网站可以帮助你验证组件是否兼容。以下截图展示了其中一个网站的示例，pcpartpicker.com/：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/7a8b4ec9-4960-4897-b340-be2e9b1c7317.jpg

在 PCPartPicker.com 上进行兼容性检查的示例

不兼容的 BIOS：当安装或升级 Windows 系统时，如果升级软件停止并显示 Windows 和计算机上的 BIOS 不兼容，问题可能是一个名为 非执行 (NX) 位的 CPU 设置。这是一个控制内存用于各种功能的开关设置，它会阻止部分安装程序的运行。要启用 NX 位，打开命令提示符（具有管理员权限），输入 exe /set {current} nx AlwaysOn 命令并按 Enter 键。关闭计算机（不要重启），然后重新启动。一切应该就绪。
服务器背板故障：背板是一块带有多个扩展槽的电路板，允许多个组件共享公共总线结构和电源。背板的质量取决于其插槽连接器，如果发生故障，某个插槽将被空置，从而允许更换背板。

环境问题

无论服务器机房或数据中心的地理位置如何，其环境应该基本相同。一个问题是，外部环境可能会出现温度、空气质量、湿度和极端天气条件等极端情况。服务器机房或数据中心必须提供一个有利于电子设备操作的环境，同时也要考虑到人类管理员的需要。

服务器机房的主要环境威胁包括温度、湿度、空气中的污染物以及电源的剧烈波动。以下是每个因素的简要说明：

温度：服务器房间的环境温度应始终保持在 50° F (10° C) 到 82° F (28° C) 之间，最佳温度范围是 68° F (20° C) 到 71° F (22° C) 之间。计算机可以在温度稳定的环境中运行，无论是冷还是热。当温度快速或频繁变化时，可能会出现如系统机箱内结露等问题。
空气质量：空气中的污染物，如灰尘、绝缘物以及其他颗粒，如果没有控制或清洁，可能会积聚在冷却系统、主板和计算机、存储设备、电源供应以及其他设备的电子元件上。空气中的水分也是一种污染物，可能会逐渐饱和内部组件。此类污染可能导致过热、电气短路和腐蚀等问题。
电力：电力服务电流的波动可能会损坏并可能摧毁服务器房间中的设备。电力浪涌、电压跌落、低电压和停电可能会给设备造成压力，甚至烧毁或短路电动机、控制器和其他电子元件。应该使用电源调节器和不间断电源供应（UPS）设备来平稳电力服务。

总结

电子组件中的计算机硬件故障是由设置、安装或配置中的问题引起的，这些问题导致其故障或失效。硬件问题包括间歇性故障、访问失败、随机重启和开机自检（POST）失败。系统管理员应具备识别和解决常见硬件问题的能力。

POST 过程验证了基本组件和设备的存在与功能。如果设备没有响应，会发出一系列可听的哔哔声来提醒用户。POST 使用短促或长音的哔哔声来指示问题。没有标准的哔哔声代码。

计算机常常因忽视预防性维护而过热。机箱内的灰尘会阻碍空气流通，而空气流通本应用于冷却组件。系统机箱内的热量会逐渐损坏电子元件。解决过热问题的方法是用压缩空气清洁通风口、风扇、散热片和空气通道。

处理器失败有几个原因：极端电力浪涌、超频或过热。测量 CPU 温度可以设定基准。任何不对齐的情况都可能造成错误的基准。处理器应在 45° 至 50° 摄氏度（113° 至 122° 华氏度）之间工作，且不应超过 75° C（167° F）。

常见的内存问题包括逐渐变慢、随机重启、文件损坏、安装失败和蓝屏死机（BSoD）。内存问题的原因与 CPU 问题相同：热量、电力波动、静电损伤、安装不当、超频、内存插槽损坏或内存模块故障。

主板上的三种电子组件分别是变压器、整流器和电解电容器。变压器将输入的电压降低，整流器将交流电转换为直流电。电容器储存静电电荷，ESR 用它来提升电流中的电压下陷。故障的电容器会膨胀顶部、泄漏电解物质或着火。

当前大多数主板上的扩展总线包括 AGP、PCI、PCI-X 和 PCIe。PCI 总线是最常用的，PC 和 Macintosh 主板上都有。

电源供应单元（PSU）将 110 伏或 220 伏的交流电转换为 3.3 伏、5 伏和 12 伏的直流电。PSU 可能出现故障的常见迹象包括奇怪的噪音、开机时不启动计算机、计算机自动关机、硬盘驱动器（HDD）和冷却系统无法启动。硬盘驱动器的机械故障是最常见的问题原因。硬盘问题的原因包括高温、潮湿、静电放电、电源浪涌和物理损坏。

服务器机房或数据中心必须提供一个有利于电子设备运行的环境，同时也要考虑到人类管理员的需求。服务器机房的主要环境威胁包括温度、湿度、空气中的污染物以及电力源的极端波动。

问题

负责管理和维护一组服务器的系统管理员必须具备的核心技能是什么？
1. 应用程序编程
2. 识别常见硬件问题
3. 修理 HVAC 系统故障
4. 监控环境条件
以下哪项不是常见的计算机硬件故障？
1. 缓冲区溢出
2. POST 失败
3. USB 设备无法识别
4. 访问失败
开机后立即运行并验证硬件组件和设备存在的过程是以下哪个？
1. BOOTP
2. DHCP
3. POST
4. AGP
POST 过程发出的声音，用于指示错误来源的声音叫做以下哪个？
1. 嘀嗒声
2. 迪菲-赫尔曼（Diffie-Hellman）
3. 状态警报
4. 蜂鸣代码
以下哪个是计算机过热的常见原因？
1. 阻塞的气流通风口
2. 一个坏的 CPU 风扇
3. 被忽视的预防性维护
4. 以上所有
处理器应该在计算机机箱内部的哪个温度范围内工作？
1. 10°C 到 45°C
2. 45°F 到 50°F
3. 113°F 到 122°F
4. 75°C 到 85°C
以下哪个不是内存问题的常见原因？
1. 静电放电（ESD）
2. 超频
3. 一个故障的内存模块
4. 一个坏的 PCI 插槽
以下哪个不是计算机中常见的电子组件？
1. 一个变压器
2. 一个电容器
3. 一个 CMOS
4. 整流器
5. 以上所有
6. 以上都不是
缩写 PCI-X 代表以下哪个？
1. 外围组件接口扩展
2. 外围集群互联扩展
3. 外围组件互联扩展
4. 打印机指令电子
以下哪项通常不被认为是服务器机房或数据中心的潜在环境危害？
1. 灰尘
2. 湿度
3. 阳光
4. 电涌

第十六章：常见的软件问题

许多软件问题是由硬件问题引起的。然而，软件本身也可能创造、引发或产生与硬件问题相关，或者完全独立于硬件问题的故障、缺陷和错误。在本章中，我们将回顾常见的软件问题、其原因以及一些用于故障排除的工具和实用程序。

本章我们将探讨的具体主题领域如下：

常见软件问题
常见问题原因

软件问题

通常情况下，当一个应用程序或某些系统软件在服务器上运行时，它已经在测试环境中经过充分测试，经过模拟生产环境的运行，并在密切监控下发布到生产环境。当然，好的。也许并非所有软件都经历了如此严格的测试和试用过程，尽管它们应该如此。除了逻辑错误、编程结构和接口问题，貌似是软件错误的情况，也可能是硬件故障通过软件表现出来的，或者该软件与安装的平台不兼容。

软件问题不仅仅是应用软件的专属领域。问题和错误可能是由于系统软件、设备驱动程序、实用软件，甚至诊断和分析软件配置不当、安装不当或不兼容所导致的，当然，应用软件也可能是原因。在接下来的部分中，常见的软件问题分为两大类——与硬件相关的软件问题和操作系统问题。

Windows 文件恢复

Windows 系统上有四种类型的文件恢复：

系统文件检查器（SFC）：sfc.exe 文件会扫描硬盘，查找损坏的系统文件和文件夹。SFC 与 Windows 资源保护 (WRP) 协同工作，后者保护注册表文件和其他重要的系统文件。SFC 也可以在 Windows 安全模式下执行，以消除与第三方软件的冲突。以下截图显示了 sfc.exe 的典型结果：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/930eba2a-ca21-4220-a503-f670efdf1935.jpg

SFC 工具的输出

部署映像服务与管理（DISM）：该命令行工具基本上是一个多功能工具，可以扫描、检查、恢复和修复硬盘上的损坏文件或作为映像文件的一部分存储的文件。以下截图显示了 DISM 的示例：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/b44ed95e-5df5-4b51-81f3-3cb255853364.jpg

DISM.exe 工具

替换损坏的文件：如果有损坏文件的最后一个已知良好副本的备份，可以直接用该良好文件的副本覆盖损坏的文件。请记住，可能需要首先取得损坏文件的所有权（takeown）并获得完全的管理员权限（icacls）。
恢复系统：如果其他所有方法都无法恢复损坏的文件，或者损坏的文件、文件系统或分区过大，那么最佳的解决方案可能是将系统恢复到最后一个已知的良好状态。

Linux 文件恢复

Linux 系统上有多个数据和文件恢复工具。这些工具从能够从损坏的分区或卷中找出并复制可恢复的数据和文件到良好的存储介质（如Ddrescue）开始，还有一些工具尝试修复损坏的文件结构并恢复损坏文件和图像中的数据，如TestDisk。许多在 Linux 上运行的相同工具也可以在 macOS 上使用。

与硬件相关的软件问题

首先，某些软件问题实际上是硬件问题，甚至可能是恶意软件问题。在某些情况下，可能难以立即确定问题的根本原因，你只能做出最佳猜测。然而，下次你会有更好的思路来处理这个问题。你首先应该关注的故障排除内容，正如吉尔斯特法则所解释的，内容如下：

“你永远无法预测；一切都取决于情况。”

常见的与硬件相关的问题，可能表现为软件问题，包括以下内容：

死蓝屏（BSoD）：BSoD 是 Windows 的错误报告屏幕（见下方截图），它通知计算机操作员发生了停止错误，这会使操作系统停止运行。此状况表示操作系统发生了与特定硬件组件或该硬件的设备驱动程序相关的操作错误。Windows 会收集与故障相关的数据并重新启动。BSoD 也可能由操作系统内核的组件显示。应用软件通常不会导致 BSoD，除非它引发硬件或操作系统错误。然而，当应用程序崩溃时，它通常不会影响操作系统或硬件：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/487e708e-ef42-4ab7-8f43-704143864615.jpg

Windows 10 系统的蓝屏（BSoD）

磁盘启动失败：这也称为操作系统启动失败。造成此错误的最常见原因可能是 BIOS/UEFI 中的启动顺序将 CD 或 DVD 驱动器设置为主要启动设备，而该驱动器为空，或者里面放的不是启动盘。在这种情况下，用户应移除 CD 或更改 BIOS 启动顺序并重启计算机。然而，问题也可能是新购买的未格式化硬盘，或者硬盘未连接电源。
无法挂载驱动器：此错误的原因取决于你使用的操作系统。在 Windows 系统上，这个问题很可能是与外部硬盘（很可能是 USB 硬盘）有关的硬件问题，具体问题可能出在 USB 端口、连接线或外部驱动器上。而在 Linux 系统上，这个问题可能是文件系统损坏，或者是文件系统表（fstab）文件出现问题。

常见的操作系统问题

尽管我们希望操作系统是非常稳定且没有错误的，但现实和经验告诉我们，事实并非如此。操作系统和所有软件一样，在与不同的、且常常不兼容的资源结合时，可能会出现问题和错误。

以下是您可能在 Server+ 考试中遇到的常见操作系统问题和错误：

用户无法登录：用户登录问题在所有主要操作系统—Windows、macOS 和 Linux 上基本相同：
- Windows：请参阅下表，了解常见的操作系统相关登录问题。以下截图所示的错误消息框是 Windows 登录失败的常见示例：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/8b83934c-3052-42ae-aa34-8b21716f89da.jpg

Windows 登录错误消息框

- macOS：像其他操作系统一样，macOS 不要求用户设置密码，但强烈推荐使用密码。然而，如果忘记了密码或用户名，可以通过管理员模式、单用户模式或 Apple ID 账户重置其中之一或两者。
- Linux：大多数 Linux 版本和发行版采用 可插拔认证模块（PAM）来验证用户名和密码凭据。如果用户无法使用有效凭据登录，可能需要使用 pam-auth-update –package 命令重建 PAM 表。

常见的 Windows 用户登录错误及其可能的原因包括以下内容：

消息问题 Windows 无法登录到您的账户。密码已更改或已安装升级。 Windows 无法使用密码登录。文件中的密码与输入的密码不同。我们无法登录到您的账户。用户配置文件丢失或损坏。Windows 升级可能会导致用户登录问题。用户配置文件服务未能登录。用户配置文件无法加载。无法显示登录屏幕。这很可能是启动（启动）问题。

用户无法访问资源：如果此错误表示拒绝访问单台计算机上的资源或共享网络资源上的资源，那么很可能是个别用户账户或用户所在组账户的权限问题。然而，如果错误是关于拒绝访问对等网络上的资源，问题可能是 TCP/IP 配置问题或某个对等工作站上的浏览器错误。
用户无法打印：在大多数情况下，这个问题可能仅仅是受影响计算机上的打印机驱动程序不正确，或者可能是组策略问题。通过使用一个已知的账户登录来隔离问题，确定问题是本地的还是全局的。
驱动程序问题：新设备如果使用旧型号的驱动程序，可能无法获得最佳效果。驱动程序问题通常是与其关联的设备驱动程序的兼容性问题。这些问题也可能由 BIOS/UEFI 配置中的错误引起。
无法写入系统日志：用户必须具备写入系统日志文件的授权。在 Windows 系统中，您需要在注册表中编辑要授予用户写入权限的日志文件条目，路径为 HKEY_LOCAL_MACHINE\\SYSTEM\\CurrentControlSet\\Services。在 Linux 系统中，应创建一个由用户拥有的日志文件目录。
操作系统性能变慢：当一个或多个程序占用系统资源，尤其是 CPU、内存和二级存储时，所有操作系统都会变慢。使用适当的工具，如 Windows 的任务管理器、macOS 的活动监视器和 Linux 的 systemctl 命令，结束那些不重要的资源占用进程，并可能查看启动文件中的程序和服务。
进程失控：任何进入无限循环并可能启动其他任务的程序或服务都属于失控进程。在 Windows 系统中，打开任务管理器并结束该进程。在 macOS 系统中，使用活动监视器结束该进程。在 Linux 系统中，使用 ps 命令来杀死该进程。
补丁更新失败：如果在应用补丁后，操作系统中的一个或多个组件、服务或应用程序出现问题，并且您确定问题出在更新或补丁上，使用系统的备份工具恢复到先前的状态。在 Windows 中，这个功能是在设置菜单中的“返回到先前版本”。在 macOS 系统中，从恢复模式运行重新安装 macOS 工具。在 Linux 系统中，使用 GRUB 菜单中的“最后已知良好”选项。
服务失败：消息“服务无法启动，可能是因为它被禁用或没有启用的设备与之关联”表示一个或多个服务、程序或脚本未能启动。您需要隔离该服务并重新加载它，或者更新到新版本。
关机时挂起：如果操作系统在关机时无法正常关闭，通常是以下三种基本问题之一：某个进程或服务无法停止，设备驱动程序卡住或正在占用设备，或者恶意软件导致操作系统挂起。
内存泄漏：当程序在不再需要时未能释放其分配的部分或全部内存时，便会发生内存泄漏。内存泄漏也发生在软件将一个无法通过其编程代码访问的对象加载到内存中时。如果执行了多个导致问题的程序实例，系统最终可能会耗尽可用内存。像 Windows 内存诊断工具（见下图）这样的工具可以帮助解决这些错误：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/d8c7ad6a-1967-4eae-95bb-869ba69ef083.jpg

Windows 内存诊断工具可以用来解决内存泄漏问题

常见问题原因

前面部分讨论的许多问题有不同的原因，有些问题甚至会导致其他问题。在接下来的部分中，我们将讨论常见的服务器硬件问题原因，特别是你可能在 Server+考试中遇到的那些问题。

用户账户控制（UAC）

在 Windows 计算机上，这个控制功能是 UAC。在 Linux 计算机上，相应的控制功能是sudo命令，它比 Windows UAC 出现得早得多。

Windows UAC

UAC（和sudo）的目的是限制对系统的更改，只有那些被授权的人才能进行更改。在大多数情况下，这应该是使用管理员级别账户的管理员的责任。启用 UAC 时的问题在于，每次安装新的或修改过的软件时，用户都必须输入管理员密码。UAC 可以设置为四个级别之一，从“始终通知”到“从不通知”，如以下截图所示。

根据系统管理员设置的 UAC 级别，用户必须输入管理员账户密码（始终通知）或者永远不会要求输入密码（从不通知）。过多的用户账户控制可能导致安装错误、恶意软件以及严重的应用程序或系统错误：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/ccc93c96-a13e-4e19-8342-fd9839ba55f7.jpg

Windows UAC 设置系统更改控制级别

访问控制

虽然它们使用稍微不同的格式，但 Windows、Linux/Unix 和 macOS 本质上使用相同的访问权限结构。访问权限和权限在三个层次上指定——所有者（创建者）、所有者的组以及其他所有人。Linux 和 macOS，作为基于类 UNIX 的系统，使用相同的权限方案。而 Windows 虽然相似，但以非常不同的方式呈现。

在 Windows 系统中，定义用户或组可以访问、打开、修改、写入或删除的权限的等效访问控制列表，是在用户或组的权限中定义的。以下截图显示了 Windows 高级安全设置对话框，它提供了对所有用户或组现有权限的访问，以及管理员修改权限的权限：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/85ebc807-79d1-4b34-8fed-e93f3a62f8e7.jpg

Windows 高级安全设置对话框

因为 macOS 操作系统是建立在可移植操作系统接口（POSIX）之上，而 POSIX 是一个类 UNIX/Linux 系统，因此 macOS 和 Linux 基本上使用相同的命令和权限集来允许或限制用户访问资源。系统管理员不仅可以指定文件所有者、所有者所在的组以及其他所有人的访问级别，还可以控制谁能够执行可能更改或操作文件、目录或内容的特定命令。

Linux/UNIX/POSIX 文件或目录的文件权限呈现形式如以下截图所示。在显示的最左边部分，共有四个部分。第一个是一个字符，表示是目录 (d) 还是文件 (-)。接下来的九个字符是三组权限指示符，从左到右，分别表示文件所有者、所有者所属组和所有其他用户的权限。例如，apps 目录的第一个位置是 d，且三个权限组都有读取 (r) 和执行 (x) 权限。game1 文件不是目录（-），并且所有者和组拥有读、写 (w) 和执行权限。其他用户的权限只有读和执行：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/dfb4a0c9-0590-4d6b-a80d-7c351d53c5ef.jpg

一个显示类型、权限、所有者、组、大小和创建信息的 Linux 目录文件列表

在任何操作系统中，如果用户尝试访问或执行他们没有权限的文件或目录，系统会要求用户输入密码，或者至少会询问他们是否确实想要进行这个操作。

损坏的文件

文件、文件系统，甚至，天哪，硬盘分区损坏的原因有很多种，且各不相同。不幸的是，通常你会在数据或程序需要使用的那个关键时刻才发现这个问题。虽然并非所有损坏的文件都能恢复，但大多数是可以的，具体取决于损坏的程度以及在某些情况下，是什么原因造成的。不过，也有些情况，即使硬盘盘片破裂、遭遇严重的水灾或火灾等灾难，数据也能被恢复。大多数情况下，像你这样的服务器管理员可能只会遇到一些系统无法找到或读取的文件。

硬盘空间问题

你正在安装新的关键任务软件时，出现了类似下图所示的错误通知。快速反应（这可能是正确的反应）通常是删除硬盘上不再使用或已被遗忘的文件。然而，也有其他的选择需要考虑：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/cb2b5e33-2d86-4d83-ac3e-e28affe82e32.jpg

Windows Server 中的低磁盘空间弹窗

在 Windows 中，要释放磁盘空间，你可以使用以下选项：

压缩：压缩硬盘上所有或大部分文件可以释放空间。在某些情况下（这实际上取决于被压缩的数据），甚至可以释放高达 20%的硬盘容量。不过，请记住，这可能会减慢 I/O 操作。
磁盘管理工具：Windows 磁盘管理工具允许你重新分配健康的磁盘空间，但该空间没有分配驱动器字母。请确保已备份整个磁盘，以防忘记有关该空间的某些内容。无论如何，你可以将这些空间添加到系统磁盘分区中。
临时文件夹：磁盘空间不足的问题可能是由于Temp文件夹最近没有清空，甚至从未清空过。
存储感知：这是另一个 Windows 工具，它可以识别占用不成比例磁盘空间的临时文件，并提供删除它们的机会。
磁盘清理：这是另一个 Windows 工具，它报告几个临时数据存储正在使用的空间量，并提供清除所有或部分空间的选项。

在 Linux 和 macOS 上，以下选项可用：

磁盘使用/磁盘空闲：这两个命令（du 和 df）分别列出当前挂载的文件系统中使用和空闲的磁盘空间。
列出打开的文件：另一个可以帮助你找到空闲空间或可以释放的空间的命令是 lsof 命令。该命令有十多种选项，可以列出当前正在使用并由运行中的任务打开的文件。这个列表会标识出那些可能不应该删除的文件。

系统资源不足

不幸的是，系统资源 这个术语不够具体，当它出现在错误信息中时，比如内存错误 或 系统资源不足，可能并没有提供任何具体的信息。例如，内存错误并不意味着你已经用尽了所有可用的主内存。在大多数情况下，它实际上意味着计算机已经用尽或耗尽了系统为其预留的、称为堆的内存区域。堆是一个运行中的任务动态分配的内存区域，它位于从系统分配的内存之外。当为堆保留的内存区域用完时，就会生成内存错误。堆也被认为是系统资源的一部分。

在大多数情况下，因系统资源不足而导致的错误的直接修复方法是重新启动计算机。然而，要追踪问题并修复它以避免它继续发生，你需要隔离出问题的根本原因。如果每次运行某个特定应用程序时都会出现此问题，请注意其他正在运行的程序。你可能存在兼容性或资源争用问题。

无论如何，你应该使用事件日志和任务管理器（参见以下截图）来调查问题发生时正在运行的内容，以及哪些任务主导了 CPU 和主内存。你知道，问题也可能是你需要更多的 RAM：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/f229d6b1-7d6d-45ac-8dd7-89b5141517fb.jpg

Windows 任务管理器可以帮助识别资源利用率

虚拟内存问题

虚拟内存，像所有虚拟的东西一样，根本不是内存。它只是操作系统将一部分辅助存储视为主内存扩展的空间。虚拟内存，也叫做交换文件，允许计算机运行更多的任务。操作系统将空闲任务的一部分从主内存移到虚拟内存中，以便让正在运行的任务使用现在可用的内存空间。虚拟内存的缺点是大多数辅助存储设备，比如硬盘驱动器（HDD），比 RAM 慢得多，这可能会增加处理过程的延迟。

一个常见的虚拟内存问题是在显示“虚拟内存不足”警告时出现，如下面的截图所示。这种错误意味着主内存中运行的任务太多，结果导致 RAM 不够用。如果这个问题频繁发生，最好的解决方案是增加 RAM 容量。其次的解决方案是增加虚拟内存的大小。关于虚拟内存的配置没有硬性规定，但其大小不应超过计算机上安装的 RAM 的 150%。准确地配置虚拟内存的大小是一个挑战。太多或太少都可能适得其反，并且拖慢计算机运行速度：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/62594652-fcb3-47db-b45f-57689497718d.jpg

Windows 低虚拟内存警告

启用虚拟内存时可能出现的另一个问题是由损坏的页面文件引起的。虚拟内存实际上是一个页面文件（准确地说是pagefile.sys），它是在硬盘上分配的一个空间，操作系统可以将空闲的程序和数据临时存储在这里。当你最小化桌面上的窗口或暂停应用程序时，部分或全部任务变为空闲任务。通过将它从 RAM 中移到页面文件中，其他竞争 RAM 的任务可以运行得更快。那么，如果页面文件损坏了会怎样？ 好消息是，虚拟内存只有在没有足够的 RAM 来支持计算机上的任务时才会被使用。如果你从来不缺少 RAM，页面文件本身就会处于空闲状态。否则，可以运行我们之前讨论的sfc /scannow命令来修复页面文件。

碎片化

当一个非常小的文件写入硬盘时，它会被放置在一个称为扇区的小磁盘区域内，通常该扇区的大小为 512 字节。如果一个更大的文件，比如 1MB 大小的文件，写入硬盘，它显然不能完全放入一个扇区。因此，磁盘控制器会将文件分成约 2,000 个片段，并将每个片段存储到一个扇区中。并非所有可用的扇区都是连续的，因此文件片段最终会被分散存储在磁盘的各个位置。随着其他大文件和小文件占用磁盘中的扇区，以及我们第一个文件的片段逐渐变化、增大或消失，扇区会被释放或创建新的扇区。随着扇区的更替，文件片段的原始位置变得更加分散和随机。这就是碎片化。

硬盘碎片化可能导致可靠性问题，如启动失败、文件损坏、系统挂起以及数据错误或丢失。它还可能导致性能问题，如 I/O 操作变慢、磁盘扫描时间延长和磁盘抖动现象加剧。碎片整理工具会重新排列文件片段，使得文件的片段尽可能接近连续的扇区和连续的磁道。

打印问题

各种类型的打印机仍然是任何网络中不可或缺的部分，无论是大规模网络还是小型网络。然而，技术的发展使得更少的打印机可以为更大的用户群体提供服务。这是因为多种相关技术的发展，主要是由于打印服务器的演变。

打印服务器是提供网络客户端与一个或多个网络打印机之间接口的软件或专用设备。它在大多数情况下也是一个单点故障（SPOF）。与软件和硬件一样，目前没有统一的标准协议用于将打印任务发送到打印服务器，再由打印服务器传递给打印机。将打印服务器添加到网络中可以解决许多打印问题，不仅对用户有帮助，也能帮助管理员解决问题。

打印服务器常见的问题是变慢。有多个原因可能导致打印服务器运行缓慢，包括一些特定于特定安装的原因，但也有一些原因如下：

瓶颈：如果打印服务器在队列中有多个打印任务时似乎会锁死，可能是内存或某个服务正在消耗其资源。了解可能导致此问题的最佳方法是，在没有打印任务运行时监控 Windows 任务管理器，然后在运行一个打印任务和多个打印任务时再进行监控。在此过程中，您应该能够找到罪魁祸首。
打印管理：你可以在 Windows 打印管理页面访问网络打印服务器的设置，如以下截图所示。将每个打印机的选项设置为在缓冲后打印、优先打印缓冲的作业并为其分配相对优先级，可以建立一个排队系统，避免竞争。

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/73a14e40-75ae-48ca-a6cb-473d1243e7e0.jpg

显示打印服务器支持的打印机属性的 Windows 打印管理页面

其他补救措施：每个网络都有一定的独特性，尤其是在涉及打印机时。为了加速基于网络的打印，可以采取多种措施，但这些措施可能对某些特定的网络有效，也可能无效。以下是其中的一些措施：
- 专用存储上的打印缓冲：在支持活跃或大规模应用程序的计算机上进行打印作业缓冲可能会减慢相关的 I/O 操作。将一个独立的硬盘专门用于打印缓冲器可以加速处理。
- 为打印服务器添加存储：大多数用户并未考虑到这一点，或者即使知道，也忽略了，打印作业在为打印机渲染时会增大大小。如果多个打印作业争夺打印服务器上的存储空间，可能会导致瓶颈，进而减慢打印服务器的整体性能。为打印服务器添加额外的辅助存储可以避免此问题。
- 清空队列：有时，打印作业会在打印队列中卡住，阻塞所有其他排队的打印作业。有几种方法可以强制清空打印队列——结束打印缓冲服务，或从命令行运行 net stop spooler，然后删除缓冲区中的队列。

日志文件

操作系统会保留日志文件，这是一件好事。日志文件提供了事件、操作、错误以及需要警告的操作的历史记录，同时也记录了一些好的事件。排查操作系统或应用程序问题时，通常应从查看和分析系统的一个或多个日志文件开始。以下截图展示了 Windows 事件查看器，它提供了查看各种系统日志文件内容的功能：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/3ca5d836-4c1d-42cb-9bca-f28b2f9ff8d3.jpg

Windows 事件查看器可以用来扫描日志文件以查找问题

在 Linux 或 macOS（POSIX）系统上，系统日志会集中保存在 /var/log 目录中。以下截图展示了在 Linux 系统上列出并显示一个日志文件的命令行输入。所有三个操作系统都有用于查看和分析日志文件的第三方软件包：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/eb95950f-966a-4a85-bb10-f5a72a7a842c.jpg

从命令行显示的 Linux 日志文件

操作系统监控工具

Windows、Linux 和 macOS 都包括一组可以监控服务器全部或部分性能的命令或窗口。虽然有一些第三方工具可能更强大且直观，但如果你需要检查操作系统和计算机的一个或多个活动或条件，系统自带的实用工具应该能胜任。下表展示了每个系统用于监控不同性能领域的一些命令或工具：

组件/功能 Windows Linux macOS 活动进程任务管理器 ps 活动监视器磁盘剩余空间/使用情况文件资源管理器 df/du 关于本机/存储可用内存/使用情况资源监视器 free 活动监视器系统状态任务管理器 top 关于本机/更多信息

Windows、Linux 和 macOS 中用于监控性能领域的工具或命令

摘要

系统软件问题可能源于设备驱动程序、实用软件、诊断软件和应用软件的配置错误、安装不当或不兼容。常见的硬件相关问题可能表现为软件问题，包括蓝屏死机（BSoD）、磁盘启动失败和驱动器挂载问题。常见的操作系统问题包括用户无法登录、用户无法访问资源、用户无法打印、设备驱动程序问题、系统日志错误、性能缓慢、进程失控、服务故障和内存泄漏。

Windows 定义了对用户或组的访问权限。macOS 和 Linux 允许或限制用户访问并控制用户对文件的操作能力。Windows 的文件恢复选项包括 SFC、DISM、替换损坏的文件以及将系统恢复到早期的检查点。Linux 系统使用工具从损坏的介质中查找并复制可恢复的数据，以及从损坏的文件中恢复和修复数据。许多 Linux 实用程序也可以在 macOS 上运行。Windows 上的磁盘空间不足警告和错误可以通过压缩、Windows 磁盘管理工具以及清理临时文件或搜索工作文件中的不必要数据来解决。在 Linux 和 macOS 上，du 和 df 命令显示使用的磁盘空间和剩余的空间，lsof 命令则显示不应删除的文件。

解决系统资源短缺的方法是重启计算机。使用事件日志和任务管理器查看问题发生时正在运行的进程，以及哪些进程占用了 CPU 和主内存。虚拟内存的常见问题是“虚拟内存不足”警告，意味着没有足够的 RAM 来支持当前的需求。硬盘碎片化可能导致启动失败、文件损坏和数据错误。磁盘碎片整理工具通过将文件块尽量排列在连续的扇区和轨道上来减少碎片。

打印服务器是一个单点故障（SPOF），可以解决许多打印问题。打印服务器的一个常见问题是性能变慢，可能是由于瓶颈、缺乏打印机管理或打印缓存所需的存储空间不足所导致的，可以通过为打印服务器添加存储并清理打印队列来解决。日志文件记录了计算机上运行的作业的事件、操作、错误和警告。排查任何软件问题时，应该从查看系统日志文件开始。在 Linux 和 macOS 上，系统日志位于 /var/log 目录。

问题

你正在培训一位新的网络服务器操作员和技术员。不幸的是，他无法登录服务器。而你可以成功登录。可能是什么问题？
1. 服务器已关闭。
2. 他正在使用错误的用户名和密码凭据。
3. 他没有访问服务器的权限。
4. 每次只能有一个管理员账户处于活动状态。
如果你能访问远程网络服务器上的文件夹及其文件，但无法删除过期的文件，那么你缺少什么文件夹权限？
1. 执行
2. 读取
3. 写入
4. 删除
由多种问题引起的通知显示，包括设备驱动程序问题、硬件故障或组件超出其操作限制？
1. 蓝屏死机（BSoD）
2. POST 响应码
3. 闪烁的控制台灯
4. 桌面卡死
当程序未能释放不再使用的分配内存时，出现的条件是以下哪种情况？
1. 内存溢出
2. 内存奇偶校验错误
3. 内存崩溃
4. 内存泄漏
以下哪项可以用来识别硬盘分区上的损坏文件？
1. systemctl
2. GRUB
3. SFC
4. 用户帐户控制（UAC）
以下哪些方法可以用来释放 HDD 上的空间？
1. Windows 磁盘管理
2. 磁盘压缩
3. 虚拟内存
4. fdisk
在 Linux 系统中，哪个命令行命令可以显示文件系统中可用磁盘空间的位置和数量？
1. du
2. df
3. lsof
4. fs
什么功能可以保留硬盘的一部分来扩展主内存的大小和容量？
1. 虚拟机
2. 虚拟内存
3. 虚拟磁盘
4. 虚拟局域网
以下哪个系统工具尝试将文件扇区移动到硬盘驱动器的顺序位置？
1. 降磁
2. 解压
3. 解密
4. 磁盘碎片整理
操作系统创建并维护一个记录，记录了系统上运行的应用程序和服务的事件、操作、错误和警告。这些记录保存在什么类型的文件中？
1. 缓存
2. 队列
3. 日志
4. 索引
5. 注册表

第十七章：常见的网络问题

几乎每个企业和组织都依赖于计算机网络来进行信息处理、分析、应用和媒体共享，此外，还包括电子邮件、网页访问、日程安排和个人生产力应用程序。在大多数情况下，网络已经融入到这些组织的日常工作中，其可用性被视为理所当然。然而，当技术问题导致网络瘫痪时，网络管理员必须迅速识别问题、解决问题并确保网络的完整性——这一切都需要在最短的时间内完成。

本章中，我们将讨论一些常见的网络问题及其原因，以及一些常用的网络操作系统（NOS）工具和资源，这些工具通常是故障排除过程中常用的。将介绍的具体主题如下：

常见的网络问题及其原因
故障排除过程中使用的 NOS 资源

常见网络问题

常见的网络问题列表可能因组织而异。任何组织的常见问题是由多个变量决定的，例如预算、人员、培训和环境。以下部分列出的常见网络问题是 Server+ 认证考试中标明的问题。

Internet 连接

在某些工作环境中，丧失互联网连接可能不会构成太大问题，特别是当网络上的活动是本地的，不需要连接到广域网（WAN）时。然而，在某些时候，访问组织网关路由器之外的互联网是必要的，用户也期待服务可以正常使用。

局域网（LAN）和广域网（WAN）之间的通信链路包括多个组件，每个组件都有可能导致链路中断。以下列表包括这一链路的主要部分，以及它们可能导致互联网连接丢失的潜在原因。当然，在检查这些潜在原因之前，你首先需要检查电源线和插头：

电缆：在有线网络中，松动的连接或故障的连接器通常会导致连接问题。
连接：在无线网络中，主机可能无法连接到接入点或路由器，如果能够连接，则应能看到互联网。
网络接口控制器（NIC）故障：如果主机具有自动私人 IP 地址（APIPA）地址，接下来要检查的是网络接口卡（NIC）或网络适配器，看它是否正常工作。检查其状态的最简单方法可能是在 Windows 设备管理器中查看。如以下截图所示，打开网络适配器的属性可以查看其功能状态。如果它没有正常工作，下一步是确定原因：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/8c528b3b-a472-488a-bb05-90206f34982a.jpg

设备管理器和网络适配器的属性框

网关配置：如果主机无法看到网关设备，但你知道网关有电并且应该正常工作，那么有可能是网关配置被更改、损坏或遭到黑客攻击。
服务可用性：无论你订阅的是哪种类型的互联网服务，如果主机能够连接到网关设备，但无法连接到互联网，问题可能是设备故障或服务提供商存在问题。如果连接的用户端没有任何故障，这可能意味着 ISP 的服务出现了故障。稍后在本章中我们将介绍更多网络状态检查命令。

配置

网络性能和连接的一个常见问题是各种组件的配置，包括硬件和软件。NOS（网络操作系统）、主机及其操作系统、所有网络设备中的网络适配器以及相互连接的交换和路由设备的配置必须兼容，并与网络的目的和功能保持一致。

以下各节介绍了网络中可能遇到的常见配置问题。

动态主机配置协议（DHCP）服务器

互联网，甚至某些内网地址问题的一个常见原因是 DHCP 服务器配置不正确。另一个常见的相关问题是域名系统（DNS），但稍后我们会详细讨论。完全有可能启动一个网络主机，但它没有从 DHCP 服务器接收 IP 配置。如果主机的用户从未尝试访问主机之外的任何资源，通常不会出现问题。然而，若没有有效的 IP 配置，主机在可访问范围方面将非常有限。

主机未能接收 IP 配置的常见原因有两个：没有网络连接和 DHCP 服务器问题。第十五章，常见硬件问题，讨论了网络接口卡（NIC）的问题，但让我们来看一下 DHCP 服务器问题。

APIPA

一个问题可能是，如果 Windows 主机有网络连接，但在启动后，它被配置了一个不寻常的 APIPA 默认地址。这个地址来自一个保留的 B 类地址组 169.254.0.0/16。APIPA 配置的目的是允许启动过程和 IP 配置完成，以便主机能够在本地网络上运行。路由器不会转发 APIPA 地址，但本地网络的资源应该是可以使用的。然而，这种访问依赖于局域网中任何交换机的配置。

在分配默认 IP 地址后，APIPA 服务大约每五分钟检查一次 DHCP 服务器的存在。当 DHCP 服务器再次上线时，它会用 DHCP 配置替换 APIPA 配置。

DHCP 地址

配置 DHCP 服务器时最常见的问题是发放重复的 IP 地址配置、地址池耗尽以及静态地址分配配置错误。

同一 IP 地址分配给两个或多个主机的问题，可能发生在多个设备（如路由器、交换机或网络服务器）启用了 DHCP 服务器功能，并使用重叠的地址范围（称为范围），导致之前分配给主机的静态地址被重复分配。

耗尽（或清空）地址池意味着下一个请求配置的主机将配置为 APIPA 地址。

DHCP 服务器通过三种方式之一将 IP 地址及其相关配置分配给网络主机：

自动：这种分配形式将一个 IP 地址永久分配给主机，即无限租期。
动态：在此分配选项中，DHCP 服务器从预定义的地址范围中分配 IP 地址，租期为预设的时间段。此选项允许进行续租。
静态：分配给主机的特定 IP 地址。静态 IP 地址是一个保留地址，并且永久链接到主机的 MAC 地址。

其他配置错误的设备

如果服务器或网络的一个或多个组件配置错误，可能完全没有影响。或者，它可能导致系统崩溃，通常情况下，根本无法得知原因。在 Server+认证考试中，您可能会遇到有关多个配置错误的设备、服务和协议可能产生的影响的问题。

以下部分将涵盖您可能遇到的问题。

电子邮件问题

大多数情况下，电子邮件问题通常是由于配置错误引起的。一个电子邮件系统通常涉及服务器、传输机制（或协议）和客户端，三者必须协同工作。一些常见的电子邮件系统问题包括以下几种：

客户端无法发送或接收消息：如果您的本地主机能够连接到互联网，那么问题可能出在邮件系统上，通常是用于识别邮箱身份的数据输入错误（如电子邮件地址和密码）。

在 Microsoft Office 中，Outlook 客户端的帐户信息对所有安装的 Office 软件都是通用的。然而，如果 Outlook 无法从服务器下载邮件，则 Office 365 的 Microsoft 支持和恢复助手工具可能能够识别问题，如下图所示：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/ded344b0-1fdc-4f58-88a8-fe3c7189d3e6.jpg

Microsoft 支持和恢复助手可以扫描 Outlook 中的电子邮件错误

Linux 和 Windows 系统也可能使用共享软件或免费邮件客户端，如 Thunderbird（Mozilla）、KMail、Evolution 或 Geary。配置简单，通常只需要一个电子邮件地址和密码，如接下来的截图所示。

客户端可以接收邮件，但无法发送邮件：这种情况通常意味着客户端可能正在尝试将邮件转发到 TCP/UDP 端口 25。这个众所周知的端口曾经是几乎所有邮件客户端发送邮件的默认端口。然而，由于垃圾邮件发送者经常访问端口 25，大多数邮件服务器现在会阻止该端口，而改用端口 587。检查分配给发送邮件功能的端口。
客户端可以发送邮件，但无法接收邮件：这个问题通常由两个条件之一或两个条件共同造成。邮件服务器，尤其是支持互联网邮件访问协议（IMAP）的服务器，会在一个预定的存储空间内存储转发邮件的副本。如果存储空间被占满，邮件转发就会停止。解决方法是访问邮件服务器并删除不必要的邮件。另一个原因可能是入站帐户的配置。确保接收邮件服务器、端口号、电子邮件帐户和密码都正确。可以给自己发送一封测试邮件：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/64d78475-c513-4d01-b9a3-16c19e15fc42.jpg

Thunderbird 邮件客户端是一个免费的电子邮件工具

主机文件配置

在 Windows 系统中，hosts 文件提供了类似本地 DNS 查询的功能，用来提供完全限定域名（FQDN）的 IP 地址。如以下屏幕截图所示，hosts 文件显示了域名及其对应的 IP 地址。此条目消除了与 DNS 服务器通信以获取 IP 地址的需求。如果 FQDN/IP 对的条目不正确，或者 hosts 文件丢失，或者文件保存时带有扩展名，系统将绕过 hosts 文件，发送 DNS 请求：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/aaf55d94-9fe1-4b71-b7f1-136d0b2d9dfb.jpg

Windows 系统上的 hosts 文件

配置错误的网络接口卡（NIC）

尽管 NIC 卡、USB 驱动器和内置网络适配器很少会发生故障，但它们确实有可能出现问题。如果你怀疑网络卡或适配器影响了网络通信，通常问题出在两种情况之一——要么 NIC 卡或适配器损坏，要么 NIC 卡或适配器没有获取执行其工作的所需系统资源。

在大多数情况下，至少对于网卡来说，通常有 LED 指示灯帮助你判断是否工作正常。当系统开机并连接到网络时，如果没有看到绿色指示灯，你就找到了问题所在。不过，网卡可能并没有坏到需要更换的程度，可能是重新安装时出现了问题，或者跳线块或开关设置不正确。查看文档以确认这些可能性。另一个问题是网卡或适配器与另一个 I/O 设备共享相同的系统资源。在 Windows 系统中，设备管理器可以帮助识别资源分配问题，如下图所示。设备管理器还可以检查主板上的网络适配器。无论哪种情况，都要确保使用的是正确且最新的设备驱动程序。

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/4d5b15de-9403-4703-9315-9da5a1d46126.jpg

设备管理器组件属性对话框

路由与交换问题

最重要的是，配置错误的路由器和交换机（以及防火墙）是安全隐患。这些设备最初配置正确，可以服务并保护其网络，且与外部网络交互。然而，网络更改、服务提供商的误导、输入错误以及网络管理员那种“既然进来了，看看还能做些什么”的心态，可能导致配置错误。

除了安全性外，互联设备配置错误也可能导致其后面设备的问题，如内容服务器、代理服务器和局域网交换机。排查这些设备的配置问题可能比在网络服务器上更为复杂。

VLAN 配置错误

在讨论一些与虚拟局域网（VLAN）相关的常见问题之前，让我们回顾一下它的一些术语。本质上，VLAN 是在网络交换机上配置的逻辑广播域。通过将一个（或多个）端口分配到一个 VLAN（除了默认所有端口都属于 VLAN1 外），配置到该端口的工作站现在就在该 VLAN 上。

如下图所示，分散在不同物理局域网段上的主机也可以位于同一个 VLAN 中。图中还显示了直接连接交换机和路由器的链路。这些链路被称为干线，连接干线的接口端口称为干线端口。干线端口运行一种特殊的协议，如 IEEE 802.1Q 或 Cisco 的交换机间链路（ISL）。

VLAN 的两个常见问题通常与 IP 地址有关，如下所示：

配置了错误 IP 地址的网络主机，如 APIPA 地址，或错误的子网地址或掩码，无法访问网络，更不用说 VLAN 了。
未能配置接口端口以支持每个 VLAN 作为网络段或子网。

除了 IP 地址之外，其他 VLAN 问题包括以下内容：

VLAN 被配置为停用状态
VLAN 的终止干道端口必须运行相同的干道协议，并具有相同的配置，无论是带标签（tagged）还是不带标签（untagged）VLAN。

一些 VLAN 问题源于干道端口故障，例如以下情况：

如果两个干道端口的干道模式不同，它们将无法建立连接。
如果一个 VLAN 不在可以访问特定干道端口的授权 VLAN 列表中，它将无法正常工作。
一个干道端口开始波动。这种情况通常与路由器端口有关，但交换机端口也可能发生波动。波动是硬件故障，导致端口交替开启和关闭。

下图显示了 VLAN 配置：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/7d0330d4-dda6-4c3b-8b40-39c2a6e1091b.jpg

VLAN 配置

默认网关不可用

这可能是最常见的网络连接问题。其原因并不明显，而且这些问题都不是网关路由器本身的问题。你唯一知道的是，你突然无法访问互联网或网关之外的任何网站，并且系统提示默认网关不可用（见下图）。以下是导致此问题的常见原因：

杀毒软件或反恶意软件程序：已知这些软件会改变主机的网络配置，包括默认网关的 IP 地址。卸载此程序，并通过重启计算机来重置默认网关配置。如果这解决了问题（你可能需要等一会儿再确认），那就没问题了。
过时的网络适配器驱动程序：这可能会干扰计算机与网络连接之间的通信。在尝试以下修复方法后检查默认网关连接（停止修复时，如果问题似乎已解决）：重新安装驱动程序、更新驱动程序，或更换或添加网络适配器。
Windows 自动登录：已知该功能会在启动时搞乱主机的 IP 配置，包括默认网关的 IP 地址。虽然无法完全禁用自动登录功能，但可以将登录设置为需要用户名和密码，这似乎可以解决问题：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/42f26c2b-f0d6-47c1-9abe-cf2a1caef5c1.jpg

Windows 网络诊断对话框显示默认网关问题

网关错误的结果之一是，任何操作系统的 IP 配置中默认网关地址消失，导致显示消息资源不可用或无法访问。route命令，几乎所有操作系统都提供此命令，用于显示路由表内容，通常应该包括默认网关的地址，如下图所示。Windows 的ipconfig命令或 Linux/macOS 的ifconfig命令也会显示默认网关的地址（如果存在）：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/0fe6cf17-c136-4769-9105-dbdb34878b62.jpg

Linux 的 route 命令结果，默认网关地址已突出显示

防火墙故障

网络防火墙可以是独立的硬件设备，也可以是路由器提供的服务，或者是一个独立的软件系统。无论是哪种方式，防火墙的目的和性能保持不变：保护网络、服务器或主机免受入侵或攻击。像计算机中的其他所有设备一样，防火墙也可能出现问题。以下是你可能遇到的一些防火墙问题：

配置问题：如果防火墙的配置过程过于依赖默认配置，那么最终的配置很可能过于宽泛，缺乏足够的细节。最好将配置过程限制在组织安全政策的核心功能上，作为基础。
货币问题：防火墙往往成为一个 设置后忘记 的设备，但实际上，持续的监控和维护，以确保防火墙与其设置、规则和更新保持同步，应该是正常的操作程序。
处理能力：如果软件防火墙安装在资源不足以应对高峰操作时段需求的计算机上，它可能会成为瓶颈。减少防火墙负载的一种方法是限制或移除那些对设备或软件的主要任务不必要的功能。
IP 地址有效性：一种常见的攻击方式是向本地网络的防火墙发送一条消息，其中源地址或目标地址（或两者）包含虚假的 IP 地址。如果防火墙上定义的允许/拒绝规则没有考虑到虚假或伪造的 IP 地址，且这些地址超出了 IP 标准的限制，那么带有可疑地址的入站消息可能会通过防火墙进入内部网络。

其他常见问题

除了上述问题外，Server+ 目标还列出了几个其他更通用的硬件或软件问题，你应该了解它们的原因和解决方法。你可能不会遇到一个专门涉及这些问题的问题，但如果它们出现在问题的情境中，或作为其中一个答案选项出现，也不要感到惊讶。它们按无特定顺序列出如下：

资源不可用：该错误非常具有上下文依赖性。如果是来自邮件客户端的错误，那就是邮件问题；如果是来自虚拟机的错误，那就是虚拟机问题；如果是网络访问问题，那可能是服务器或网络设备的问题。大多数用户将此错误与 HTTP 及 404 或 503 错误相关联。在任何情况下，这条信息的共同含义是：由于名称更改、文件删除或数据损坏，所请求的文件、服务或设备不可用。
目标主机不可达：该错误与 Linux 或 macOS 系统中的 Packet Internet Groper（ping 命令）相关。在 Windows 系统中，该消息通常是“请求超时”。问题在于，要么没有通向目标地址的清晰路径，要么目标地址不存在。
未知主机：此错误消息是由于目标地址无法访问引起的。这可能是 DNS 问题、配置问题（如 DNS 服务器地址）或目标地址不正确。
服务提供商故障：ISP 实际上是一个单点故障，如果由于某种原因 ISP 的路由服务不可用，访问互联网也会中断。解决这一潜在错误的一种方法是同时订阅多个 ISP 的服务。
无法解析主机名/FQDN：此错误消息表明 DNS 服务器中的信息或使用主机名或相应的 FQDN 访问远程站点时存在问题。

故障排除工具

尽管我们已经讨论了以下列表中的每个工具，但让我们再一次回顾它们在本章故障排除问题中的应用。你应该在 Server+ 考试的以下章节中看到这些工具。

ping

ping 是一个命令行工具，用于验证源主机和目标主机之间的连接。通过输入 FQDN、主机名、域名或 IP 地址，ping 向该目标发送一个 64 字节的 ICMP 回显请求消息。除 IP 地址外，其他地址会通过 DNS 或本地 hosts 文件进行解析。在发送 ICMP 消息后，ping 会等待目标的回显响应。当接收到响应时，ping 会显示传输和接收消息的度量值。

tracert/traceroute

此命令的目的是测试并显示源主机与目标主机或网络之间的通信链路。tracert 是 Windows 版本，traceroute 是 Linux/macOS 版本。此命令使用迭代过程，通过生存时间（TTL）值逐步测试到达目标的每个路由器的路径和连接。最初，它发送一个 TTL 值为 1 的 ICMP 回显请求消息。这意味着路由器在到达一个路由器（跳数）后丢弃该消息，且路径上的第一个路由器会响应回显消息。接着，tracert 发送另一个 ICMP 回显请求，这次 TTL 值为 2。此过程重复进行，直到 TTL 用尽（即跳数等于默认的跳数限制），或直到没有响应的跳数。

以下截图显示了 Windows tracert 命令的结果：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/17447b97-fb53-4834-9683-852dbd230f0a.jpg

tracert 命令的结果

ipconfig/ifconfig

尽管 Windows 互联网协议配置（ipconfig）命令，或类似的接口配置（ifconfig）命令几乎在所有其他操作系统中都可用，但学习主机及其网络接口的配置元素仍然很有帮助。下图显示了其/all选项的摘录。此命令还允许释放或更新 DHCP 配置以及进行其他配置调整：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/9aba92f5-0a58-4389-a067-177f43b8a22e.jpg

ipconfig命令显示的结果示例

nslookup

nslookup命令行工具在几乎所有操作系统中都可用，用于在域名服务器中查找名称和 IP 地址（因此得名）。使用nslookup，你可以查找网络上主机的 IP 地址或域名。下图显示了在 Linux 系统上执行nslookup的示例，它提供了域名的 IP 地址。如图所示，响应为“非权威答案”，这意味着这是当前 DNS 服务器中的信息：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/1416893e-b81b-4812-b9bf-5ddca5a79023.jpg

在 Linux 系统上执行 nslookup 命令的结果

net use/mount

net 命令实际上更像是一组命令，用于创建连接或断开与网络共享资源的连接，显示主机上的所有当前连接，与其他主机共享资源，管理密码，控制打印缓存器等。

mount命令将文件系统或附加存储设备挂载（安装）。挂载设备将其添加到活动的目录结构中，并使其内容可供访问。要卸载一个已挂载的设备或文件系统，umount命令会通知操作系统完成该设备的所有 I/O 操作，然后将其从目录结构中移除。net和mount命令在 Windows、Linux 和 macOS 中均可使用。

nbtstat 和 netstat

TCP/IP 上的 NetBIOS 状态（nbtstat）是一个主要用于诊断或排查 NetBIOS 名称问题的命令行工具。它还可以显示在另一台主机上运行的 NetBIOS 服务，或显示是否有用户登录到特定主机。

网络状态（netstat）显示主机的 IP 配置相关信息，但进一步展示了其连接情况，包括端口、协议以及通信的度量信息。

概述

局域网（LAN）与广域网（WAN）之间的连接包括多个可能导致连接失败的组件，包括电缆、连接、网卡、网关和 ISP。常见的问题是硬件和软件的配置。配置问题常见的领域包括 DHCP 服务器、邮件服务器和客户端、hosts文件、网卡、路由器和交换机、VLAN、默认网关以及防火墙。

在许多情况下，显示的消息描述了一个问题，但不一定是其原因。这些消息包括资源不可用、目标主机不可达、未知主机、服务提供商故障以及无法解析主机名/FQDN。

一些可用的网络故障排除工具包括 ping、tracert/traceroute、ipconfig、nslookup、net use、mount、nbtstat 和 netstat。

问题

在本地网络中，用户可以访问局域网资源，但无法访问并下载网页。以下哪个区域可能是问题的原因？
1. 本地网络服务器
2. 远程 Web 服务器
3. DHCP 服务器
4. Internet 网关
本地网络主机在与 DHCP 服务器成功交互之前无法完成启动过程。对还是错？
1. 真
2. 错
在 Windows 系统中，Class B 网络 169.254.0.0/16 上的地址叫什么？
1. EGRP
2. FDDI
3. APIPA
4. Anycast
替代端口 25 用于 SMTP 电子邮件接口的 TCP/UDP 端口是什么？
1. 端口 80
2. 端口 587
3. 端口 1024
4. 端口 20
Windows 文件中包含一个主机名及其相关 IP 地址的列表，操作系统使用它来查找主机的身份和位置，这个文件是什么？
1. 主机
2. 页面文件
3. WinSxS
4. 注册表
什么是通过交换机端口逻辑上创建广播域的虚拟结构的正式名称？
1. VPN
2. 虚拟机
3. VLAN
4. ISL
连接两个交换机接口端口并运行 IEEE 802.1Q 协议的通信链路被称为什么？
1. 帧中继
2. 标记端口
3. 波动端口
4. 干道端口
以下哪个可能是默认网关变得不可用的原因？
1. 防病毒软件
2. 网络适配器设备驱动程序
3. 自动登录服务
4. 以上所有
5. 以上都不是
一名网络技术员在另一个州的新分公司安装了多个网络主机。为了验证每个新主机是否能够看到总部的网络服务器，应该使用哪个命令行工具？
1. nslookup
2. ping
3. tracert/traceroute
4. ARP/RARP
5. ping 或 tracert/traceroute，或两者
6. 以上都不是
用于显示和修改网络接口配置设置的 Linux 命令行工具是什么？
1. ifconfig
2. ipconfig
3. net config
4. net setup

第十八章：常见存储问题

到目前为止，尚不存在一种能够抵御损坏并能承受意外或恶意删除的磁性存储技术——至少现在没有。与此同时，磁盘、磁带和光学存储设备仍然存在问题、故障和缺陷。在本章中，我们将探讨在 Server+ 考试中你可能会遇到的数据存储问题及其各自的原因。

本章将涵盖以下主题：

数据存储设备问题
常见问题的原因
管理工具
存储监控工具

数据存储设备问题

防止任何数据存储设备发生故障的最终保障是正式定义并严格遵循的数据备份政策和程序。完整的系统备份以及增量备份或差异备份是我们对任何数据存储设备故障的保险政策。为什么我们需要保险政策？ 嗯，我们将组织中最宝贵的资产之一（数据）存储在我们认为可靠的设备上。然后，我们使用计算机中最不可靠、经常发生故障的设备——电源为其提供电力。如果电源没有出现问题，它可能会遭受病毒、物理损坏、不良应用软件和错误的设备驱动程序的影响。除此之外，还有人为因素。难怪数据存储设备会出现问题。

在接下来的章节中，我们将讨论三种主要存储设备类型——硬盘驱动器（HDD）、光存储驱动器和磁带盒驱动器的常见问题。

以下表格列出了一些你应该知道的数据存储设备常见故障原因：

问题原因 恢复机会 删除的文件，格式化的驱动器人为错误良好数据库或文件损坏或丢失恶意软件、软件错误良好文件系统损坏媒体逻辑故障良好无法访问磁盘驱动器或数据乱码媒体物理故障——磁头、主轴电机、执行器一般到良好设备水损自然灾害一般损坏的设备外部硬盘或笔记本电脑跌落一般闪存介质故障闪存设备覆盖限制超出* 一般存储数据乱码磁带介质退化、故障或损坏* 一般存储数据无法读取 CD/DVD 媒介故障* 差

数据存储介质常见故障原因

一些数据存储单元的介质，如闪存、磁带和光学介质，确实会随着时间的推移而磨损，退化到存储在介质上的任何数据都会变得乱码、无法读取或完全丢失。

常见的硬盘问题

很难识别某些硬盘性能问题。有时，故障硬盘的表现可能与恶意软件攻击、内存问题、电源故障，或者可能是太多下载同时进行的症状非常相似。故障硬盘的症状可能是这些问题中的任何一个，甚至更多。你应该了解的硬盘问题包括：

操作系统未找到：计算机启动时，BIOS/UEFI 首先会访问系统硬盘上的操作系统，将其内核加载到内存中并启动系统。此错误表示以下三种情况之一——存在严重的 BIOS 错误，硬盘的全部或部分损坏，或主引导记录（MBR）损坏或丢失。
文件访问慢：当打开文件以进行显示、编辑、打印或其他任何操作时，如果文件显示之前似乎有比平常更长的暂停或迟疑，显然的问题是存储设备变慢了。实际上，存储驱动器需要更长时间来访问、读取和将数据传输到内存及请求程序，可能有几个原因。导致 I/O 操作变慢的最常见原因如下：
- 空间不足：如果显示错误信息说某个驱动器的磁盘空间不足，如以下截图所示，则表示该数据存储驱动器几乎已满。许多进程使用辅助存储，如果没有足够的空间，它们可能无法正常执行：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/46b904b8-358f-4883-94c5-c09f5bd95fc3.jpg

Windows 的低磁盘空间警告

- 损坏的数据：磁盘扇区或簇可能由于多种原因而损坏。硬盘上的损坏数据可能导致数据传输速度变慢。使用错误检查工具，如以下截图所示，检查有问题的硬盘，查找该驱动器上的损坏数据：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/018bfab6-4ce2-4f7a-9bd2-90b7cf05d81d.jpg

显示错误检查工具的 Windows 硬盘属性对话框

文件/数据/对象不可用：尽管不常见，文件、数据，甚至文件系统可能会突然从存储设备中消失——看似没有理由。为了讨论方便，我们假设计算机内部没有任何事情是自己发生的。文件，包括文档、图像、视频、程序、游戏等等，可能变得不可用，找不到，或以其他方式表示它不见了。造成这个问题的潜在原因有很多：
- 自动操作系统（OS）更新：这主要是一个 Windows 问题，但自动下载并应用的升级、补丁或修复程序可能会删除桌面文件和已安装的应用程序，具体取决于它们的存储位置。
- 恶意软件/病毒：是的，这些邪恶的恶作剧者确实可以并且会删除或隐藏系统、应用程序和个人文件。
- 登录：有时，用户使用不同的用户名凭证登录计算机。一个不可用的文件可能确实存在，但其他用户名可能没有权限查看该文件。
- 硬盘故障：硬盘有可能在逻辑或机械上出现故障。总是应该假设硬盘故障，并立即进行备份。
硬盘逻辑问题：如果出现类似驱动器不可用、无法访问逻辑驱动器或无法挂载设备的消息，显然存在问题。有几种可能的原因导致无法访问硬盘上的文件系统、文件或数据。以下是一些常见原因：
- 驱动器字母丢失：硬盘驱动器分区的驱动器字母（例如 C:或 H:）丢失。这可能是病毒的结果，或者是用户无意中操作的结果。
- 隐藏分区：为了保护个人或敏感文件，用户可能决定隐藏某个分区。要访问其内容，必须先取消隐藏文件系统。
- 分区无法访问：此状态表示三种可能原因之一——特定分区的访问权限已损坏或完全丧失；操作系统通过循环冗余校验（CRC）检测到一个错误值；或者主文件表（MFT）或文件分配表（FAT）已损坏，需要重建。
- RAW 分区：RAW 分区不是某种特定文件系统格式，如 NTFS、EXT4 等。之前格式化的文件系统可能会因病毒或格式化过程中出现中断而变成 RAW 格式。
- 未分配的分区：电力突波或电涌可能会损坏硬盘驱动器（HDD）的逻辑分区。一个分区及其内容可能会变成未分配状态。
备份/恢复问题：严格遵循的备份程序为灾难性损坏和丢失提供了保险保障。然而，备份介质可能会故障并损坏。如果电源中断或其他事件导致备份过程被中断，特别是在备份未监控运行的情况下，最终的备份可能毫无价值。发现备份失败可能要等到需要恢复损坏或受损的文件时才会发生。
缓存故障：在数据存储的上下文中，缓存是指磁盘缓存，也称为磁盘缓冲区或缓存缓冲区，这是硬盘上的一小部分磁盘空间。当硬盘繁忙时，磁盘缓存接收并保存数据，以便在读写机制可用时使用。缓存故障可能由于电力故障或任何导致系统停止的错误，如 Linux 或 macOS 系统的内核恐慌或 Windows 系统的蓝屏死机（BSoD）引起。无论如何，当 I/O 操作中断时，缓存会被清空，数据将丢失。
多个硬盘故障：这个故障情况有两种看法——单个硬盘在计算机中逐个故障，或一个硬盘阵列在一个结构中，例如独立磁盘冗余阵列（RAID）、网络附加存储（NAS）或存储区域网络（SAN），所有硬盘同时发生故障。在这两种情况下，首先要怀疑的是电源供应单元（PSU）。
状态/错误灯：大多数机架式或塔式服务器在前面有 LED 灯，显示其内部硬盘的活动、状态和错误情况。大多数硬盘托架和多盘驱动器机箱设备，如 NAS 或 SAN 设备，都有每个托架的指示灯，或者可以独立检查每个托架。

以下表格展示了 LED 状态灯的含义示例：

模式颜色含义关闭 - 空槽稳定绿色在线闪烁缓慢绿色驱动器管理正在进行中闪烁快速黄色驱动器已故障闪烁非常慢绿色/黄色交替硬盘即将故障

常见的硬盘状态灯颜色、模式和含义

常见问题的原因

正如你作为计算机技术员的经验所表明的，导致大多数计算机、软件和组件故障、问题的原因其实并不多。识别设备或组件问题的来源通常涉及寻找一组常见的系统问题。在本节中，我们将列出在 Server+认证考试中可能出现的常见存储设备问题。

媒体故障

存储介质是我们多少有些理所当然的东西，但它其实非常重要。毕竟，数据就存储在这里。然而，由于我们不能，也不应该，看到、触摸甚至闻到存储介质，所以它往往是一个典型的眼不见，心不烦的例子。

硬盘介质

尽管硬盘驱动器外观坚固、金属外壳封闭，但无论是内部还是外部硬盘，实际上都是相对脆弱的设备。其内部组件之间的距离非常小，并且工作速度非常高。任何对系统机箱或机架托盘的外力或突然震动，都可以并且通常会导致磁盘及其存储介质的损坏。停留在磁盘表面的崩溃磁头可能会刮掉基底上的介质材料，带走任何数据。硬盘介质常见的故障之一就是磁盘上出现坏道。坏道有两种类型：

物理坏道：硬盘介质的一部分由于磁头崩溃或磁盘外壳内部的污染物（如灰尘、头发等，通常是制造过程中产生的）而损坏。磁盘控制器和操作系统都无法读写这些区域。硬盘上的物理坏道通常无法修复。
逻辑坏道：与物理坏道不同，硬盘上的这些区域，也被称为软坏道，虽然可访问，但可能会导致 I/O 问题，如延迟增加或读取错误。磁盘控制器和操作系统可以访问逻辑坏道，甚至可以对其进行写入并尝试读取。逻辑坏道是可以修复的。

SSD 介质

SSD 相较于 HDD 的一个优点是没有移动部件。这意味着没有磁头碰撞或污染问题。然而，SSD 是一种电子设备，虽然它的存储介质相对没有错误，但其周围的电子元件却可能出现问题。电容、电路和电源已知会发生故障，如果支持 SSD 的这些元件之一或全部发生故障，SSD 也会随之失效。

SSD 没有坏道问题，但可能会有坏块。以下是一些可能出现的症状：

磁盘控制器无法向存储介质写入或读取数据
I/O 密集型应用程序可能会冻结
复制或移动文件导致系统错误
访问较大的文件比平时花费更多时间

磁带介质

磁带，主要是卡带形式，在数据完整性和系统恢复中扮演着有限但非常重要的角色，特别作为备份介质。不管是哪种版本的备份磁带，都是必要的，但当主要存储设备出现故障时，备份就变得至关重要。不过，磁带也有其问题。以下是你可能会在考试中遇到的最常见问题：

人为错误：操作员、技术人员和那些善意但未受过训练的助手是磁带问题的主要原因。忘记更换或加载磁带、在当前周期放入错误的磁带、将磁带使用时间过长以及将磁带存放在不合适的地方，这些都是人为因素造成的问题。
脚本错误：在某些系统上，系统备份是通过脚本执行的，而不是使用像Bacula或Duplicati（适用于 macOS 和 Linux），以及Windows Server Backup（WSB）和Acronis（适用于 Windows）等软件工具。脚本中的错误、SAN 或 NAS 地址错误，或者文件夹不可用，可能会导致备份不完全，从而无法完全恢复系统。
硬件错误：磁带驱动器和磁带介质可能会发生故障。实际上，其中一个常常是另一个故障的原因。磁带驱动器的问题可能会影响磁带介质的传送，导致磁带拉伸、撕裂或解开，通常发生在卡带外部。

光驱

光盘驱动器，也就是 CD 和 DVD，要么工作，要么不工作。通常，没有任何提示表明光盘或驱动器可能正在出现故障。通常是那种“昨天还好好的”的情况。光驱常见的问题如下：

启动时没有硬盘：如果在启动过程中 BIOS/UEFI 突然无法识别光驱，那么很可能是光驱的电子元件出现问题。试着重新启动。如果这还不能恢复光驱，那么它可能已经损坏。
读取 DVD，不读取 CD：如果光驱能够正常读取 DVD，但完全无法读取 CD，可能是其中一个读取激光器发生了故障。试着清洁光盘和驱动器并重新尝试。如果仍然不行，那么你可能需要更换光驱。
读取错误：通常，读取错误表示光盘脏污。请清洁光盘并重新尝试。如果仍然存在问题，尝试换一张光盘。如果读取错误持续发生，清洁驱动器。
操作不一致：如果您最近对操作系统进行了升级或打了补丁，并且此后光驱的操作变得不稳定，那么请检查光驱的制造商，看是否有固件更新可以修复此问题。

常见存储问题原因

虽然我们在前一节中讨论了一些存储设备问题的原因，但现在让我们聚焦于特定设备或组件故障的具体原因。我将问题的原因分为以下几类——硬盘和连接器故障、控制器和缓存故障以及RAID 和阵列故障。控制器和缓存故障以及 RAID 和阵列故障将在本章后面的硬件相关问题部分中讨论。

硬盘和连接器故障

存储设备问题的潜在风险几乎存在于设备安装后的每个阶段。实际上，仅仅安装设备就可能引入一些最初看不出问题的隐患，随着时间的推移，这些问题可能会发展成严重问题。我们讨论了电源问题对存储设备的影响，但即便是在日常的使用过程中，仍然有很多问题可能导致存储设备无法使用、表现异常或完全故障。

硬盘问题

除了人为错误、电源问题、物理损坏等少数因素外，还有一些问题可能由操作系统、应用软件以及任何需要从存储设备获取数据的程序引起。这些问题的原因如下：

损坏或丢失的 MBR：MBR 提供了启动过程所需的关于硬盘的信息。当启动过程首次访问硬盘以加载操作系统时，它会请求该硬盘的 MBR。MBR 包含关于磁盘大小、逻辑分区的数量和类型等信息。然而，如果 MBR 损坏或丢失，启动过程将忽略该硬盘，基本上就像它不存在一样。MBR 丢失或损坏的三大主要原因是计算机病毒或恶意软件、程序错误地覆盖了 MBR、硬盘丢失了包含 MBR 的簇，或者硬盘完全损坏。
损坏的文件系统表：MBR 的一部分是主文件表或文件系统表，描述了磁盘上的逻辑分区。下表显示了 MBR 文件系统表的内容。MBR 损坏通常也会影响文件系统表。文件系统表通常像下面这样：

字节 长度（字节） 内容 0 1 启动标志 1 3 圆柱-磁头-扇区（CHS）起始值 4 1 分区类型 5 3 CHS 结束值 8 4 第一个扇区 12 4 分区大小（以扇区为单位）

16 字节文件系统表项的内容

不当磁盘分区：磁盘驱动器上有两种类型的分区，即系统分区和一个或多个数据分区。操作系统位于系统分区，通常被指定为 C:盘。数据分区存储其他内容，指定为 D:、E:、F:等。如果在一个分区上安装大量软件、创建大型数据库或主要保存数据，可能会导致该分区满。所有操作系统中都会出现的“磁盘空间不足”提示表明，分区大小可能不适合计算机所需支持的内容。

电缆和连接器问题

在数据中心、机架式服务器、磁盘及磁盘阵列中，磁盘驱动器通过以太网连接器或串行附加 SCSI（SAS）连接到网络。这些系统的电缆和连接器可能会遇到与独立服务器连接相同的问题，但通常发生的频率较低。

独立服务器，无论是独立塔式服务器还是机架式服务器，通常都在系统机箱内安装了某种形式的本地硬盘。此类服务器也可以通过网络连接到 SAN 或 NAS 系统。无论大小和技术如何，存储驱动器故障在各类系统中都会发生。这些故障的原因，在所有系统中基本相同。具体原因包括：

电缆问题：如果内部存储驱动器的电缆安装正确，系统应保持正常运行。如果系统未识别存储设备，请检查连接器和电缆是否存在电源或连接问题。如有必要，重新插拔连接器或更换电缆。由于加热和冷却，连接器的金属接触部分会膨胀和收缩，导致连接器可能从插座中松动。即使是新的电缆，故障电缆也可能导致间歇性问题，或引导过程无法识别设备。
终止不当：这个问题通常与 SCSI 和 SAS 设备以及连接它们的链有关。为了防止信号反弹回链上并创建幽灵设备，需要正确终止每个 SCSI 和 SAS 链的两端。
串行高级技术附件（SATA）连接：大多数时候，SATA 硬盘不自带电缆。确保电缆与特定硬盘制造商和型号匹配。电缆长度不应超过 1 米，否则可能会导致间歇性的数据问题。确保所有连接器干净且插入稳固。

存储系统问题

数据存储设备故障可以分为两类——软件相关故障和硬件相关故障。

软件相关故障

存储在数据存储设备上的数据（即静态数据）就像是一个比喻中的坐鸭子。许多因素可能影响数据的质量、可用性和可访问性。一些常见的软件相关或逻辑存储数据问题如下：

格式化：格式化数据存储设备，无论是故意还是意外，都会删除分区表和文件位置数据。存储在设备上的数据仍然完好无损，但我们无法访问它，因为丢失了存储的地图。
已删除的数据：当删除文件、文件夹或文件系统时，不管是故意还是无意，数据仍然保留在存储介质上。在大多数情况下，这些数据是可以恢复的，尽管操作系统无法找到它。删除文件系统会移除指向文件夹或其中文件的文件索引。然而，在大多数情况下，这些数据仍然是可以恢复的。
损坏的数据：错误的编程指令、病毒或恶意软件感染以及硬件问题都可能是数据损坏的原因。

硬件相关问题

由于其操作距离较近，硬盘驱动器（HDD）几乎是脆弱的，这意味着它相对容易损坏。大多数数据存储设备问题发生在系统启动时。这些问题通常出现在硬盘控制器上，但也可能出现在 HDD 上。然而，其他类型的数据存储设备也可能遇到大部分类似问题。你应当预期看到与 HDD 问题及其对存储数据的影响相关的问题。以下是你可能遇到的问题：

控制器故障：在 SATA 和 IDE 硬盘上，磁盘控制器可能位于磁盘外壳内或作为芯片组的一部分位于主板上，控制器故障会导致操作系统无法从磁盘介质读写数据。硬盘控制器充当操作系统与硬盘设备之间的中介服务。通常，尽管显示的消息表明控制器失败，但故障可能是硬盘设备本身。
主机总线适配器（HBA）故障：HBA 是一个电子电路板，它将 CPU 从数据存储系统的通信和操作中解放出来，这些存储系统可能是光纤通道（FC）SAN、NAS、RAID 或板载数据存储设备。HBA 控制器的故障可能表示安装问题、卡上的组件故障，或者 SAN 控制器的故障。
磁盘缓存关闭：默认情况下，磁盘缓冲或磁盘缓存功能已启用，以帮助硬盘驱动器在忙于其他任务时接收系统数据并写入磁盘，如下图所示。如果在内部硬盘驱动器上禁用此功能，I/O 速度可能会变慢。在外部硬盘上，禁用磁盘缓存是默认设置：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/7964e8a3-e6c0-4f94-95ab-a40521140ad6.jpg

Windows 设备管理器中的写入缓存策略设置

缓存电池故障：RAID 系统通过电池为其写入缓存内存供电，以便在电力故障时，系统能够在关机前清空缓存。当缓存电池电量下降时，缓存中的任何数据将会丢失。

存储阵列问题

网络上可实现的技术和机制通常能有效提高数据 I/O 速度、可靠性、冗余性和可用性，且大多数情况下没有问题。然而，不当配置、不兼容的设备或硬件问题可能会使阵列失效。可能出现的具体问题如下：

不当的 RAID 配置：RAID 是一种磁盘存储技术，它创建一个硬盘驱动器（HDD）网络，用以协调防止数据丢失，同时提高可靠性、性能和冗余性。然而，如果 RAID 配置存在问题，系统可能会适得其反。如果性能是优先考虑的目标，故障发生时可能导致数据丢失。反之亦然。RAID 配置应与系统目标及组织目标相匹配。
RAID 重建：如果 RAID 系统中的某个存储设备发生故障，并且有替换驱动器可用，RAID 阵列将根据其奇偶校验数据在新驱动器上重建丢失的数据部分。不幸的是，在此过程中，用户会看到比正常情况更长的延迟。
不匹配的硬盘：在某些数据存储配置中，如 NAS 或 SAN，大小不同的硬盘可以正常工作，和相同的硬盘一样。但 RAID 要求所有磁盘驱动器的大小一致。如果 RAID 阵列中有大小不同的硬盘，所有硬盘将仅使用最小硬盘的存储大小。
背板故障：实施 RAID 系统的一种常见方法是通过背板电路或卡，如下图所示。背板通常是卡封装的一部分。每个磁盘驱动单元都连接到背板上的插槽或连接器，这样可以消除多个硬盘的电缆杂乱。如果单个背板连接器发生故障，其连接的硬盘将无法访问。如果整个背板故障，与之连接的所有硬盘都无法访问。通常情况下，硬盘本身是没问题的：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/90617102-8033-4af5-a11c-a354c249f084.jpg

一个数据存储设备背板卡

图片来源：kisspng.com

管理工具

管理连接到服务器的数据存储的复杂性取决于多个因素，包括大小、技术、布局以及——别忘了——安全性。根据复杂性，存储管理员的工作可以从一个管理员的兼职职责到多个技术员的全职工作不等。有多种磁盘或存储管理软件包可供选择，其中包括执行以下部分描述的大多数任务所需的功能。

磁盘管理

磁盘管理这个术语有几个含义，但最常用的是指 Windows 操作系统中的一项任务或工具功能。实际上，后者可以帮助你完成前者的任务。如以下截图所示，Windows 磁盘管理工具提供了创建、修改、删除、扩展和重命名磁盘卷和分区的功能。对于 Linux 系统，fdisk 和 disk 命令提供了许多相同的功能：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/b9a93bf0-1093-4346-a8e5-dd04be5de3ac.jpg

Windows 磁盘管理工具

磁盘分区工具

如上图所示，Windows 磁盘管理工具用于管理磁盘分区。然而，也有许多免费的和非免费的工具包可用于此目的，包括MiniTool Partition Wizard和AOMEI Partition Assistant。在 Linux 系统上，fdisk 命令一直是标准工具，但如以下截图所示，GParted 也是一个非常出色的开源工具。

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/715426e1-c56b-4657-a06a-84b1353843be.jpg

GParted 分区工具用于 Linux

图片来源：gparted.org

映射、挂载与网络使用

映射网络资源的过程与挂载存储设备或连接/创建网络资源共享是完全不同的操作。但这三者常常被混淆。我们分别来看一下每个操作：

驱动器映射：映射数据存储资源是通过为其分配一个驱动器标识符（例如 E:）来标识它，并使其对本地网络用户可用。实际上，驱动器映射创建了一个共享，但比仅在一个节点上与特定用户共享的资源要更广泛。不过，在大多数情况下，将资源的快捷方式添加到 Windows 文件资源管理器的网络文件夹中可能是更好的选择。
挂载命令：Windows 和 Linux 都使用 mount 命令使存储设备、文件系统或一组文件对一个或多个用户可访问，并将其连接到活动目录结构中。然而，Linux 的 mount 命令具有更多选项，使其可以与 Windows 的 net use 命令相媲美。
Net use：use选项是 20 多种选项中的一种，帮助管理网络的各个部分，包括设置网络共享、管理用户及其权限等。net use命令可以创建、配置或删除与网络共享资源的连接，包括数据存储驱动器和打印机。net use命令产生的结果与 Windows 文件资源管理器中的“映射网络驱动器”选项基本相同。

磁盘阵列

磁盘阵列，也称为存储阵列，将多个硬盘驱动器（HDD）组合成一个独立于网络服务器运行的单一数据存储系统。存储阵列还将存储设备集中化，以便进行单一资源管理。存储阵列为 SAN（存储区域网络）和 NAS（网络附加存储）提供了基础。

大多数磁盘阵列系统制造商提供一种形式的存储管理软件。此外，还有第三方存储管理软件包：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/f57982c3-e378-41db-9c5e-4b4ba1b4bf48.jpg

常见磁盘阵列管理软件的示例

RAID 阵列

另一种类型的存储设备阵列是 RAID 阵列，与普通磁盘阵列一样，RAID 实施也有特定的软件管理工具。在 Linux 系统中，RAID 管理通过mdadm命令进行。下图显示了该命令的帮助显示：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/2009f556-1fe0-4317-a96d-728899cda100.jpg

mdadm Linux 命令的帮助显示

在 Windows Server 和其他 64 位 Windows 版本中，如下图所示的 HP 阵列配置实用程序等工具，支持 RAID 和其他磁盘阵列的创建、管理和监控：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/3b702a4a-f8f9-49b3-be61-7e1cb23f03cf.jpg

HP 阵列配置实用程序是 RAID 阵列管理软件的一个示例

存储监控工具

所有操作系统都会记录信息性、警告性和错误报警事件到系统日志文件中。Windows 具有强大的日志系统。Windows 事件查看器工具提供了一种查看、管理、归档和自定义每个日志文件内容和显示方式的工具。下图显示了 Windows 事件查看器的屏幕截图：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/fc119aaa-710f-486a-a678-a888c2d9df3d.jpg

Windows 事件查看器显示系统日志文件的内容

在 Linux 系统中，日志文件位于/var/log目录下。下图显示了sysinfo.log文件中的日志条目的显示内容，记录了系统的常规活动：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/ed61eef9-45c3-4d6d-8857-98343ebc8de7.jpg

Linux sysinfo.log 文件的内容

除了板载日志文件工具外，还有几个第三方系统可用于日志文件监控、分析和报告。下图显示了一个事件日志分析工具。监控服务器的日志文件是一项重要任务。正如俗话所说，魔鬼藏在细节中，这在日志文件中尤为明显：

https://github.com/OpenDocCN/freelearn-linux-pt4-zh/raw/master/docs/comptia-svr-cent-gd/img/c84fdc8f-7d2f-4297-b6b1-7b7091cd8f37.jpg

Splunk Enterprise 日志文件分析工具

总结

防止存储设备故障和数据丢失的措施是正式的数据备份程序。系统备份提供了对存储设备故障的保险。一些你应该了解的硬盘驱动器问题包括操作系统未找到、文件访问慢、空间不足、数据损坏和文件/数据/对象不可用。

常见的磁盘故障是硬盘盘片上出现物理或逻辑坏扇区。物理坏扇区是由于读/写磁头接触到磁盘介质表面造成的。逻辑坏扇区可能导致 I/O 问题，包括延迟增加或读取错误。固态硬盘（SSD）的优点是没有活动部件，但其电子元件可能会故障，并且可能有坏块。磁带卡带是常见的备份介质，备份磁带至关重要。磁带确实存在一些问题，包括人为错误、脚本错误和硬件故障。光驱的常见问题包括启动时无法检测到驱动器、只能读取 DVD 但不能读取 CD、读取错误和操作不一致。

设备或组件故障的原因可分为四组——驱动器和连接器故障、控制器和缓存故障、RAID 和阵列故障。硬盘驱动器故障的原因包括损坏或丢失的 MBR、损坏的文件系统表和不正确的磁盘分区。电缆和连接器故障的原因包括电缆问题、不正确的终端和 SATA 连接问题。

存储系统问题的原因可能与软件或硬件相关。软件故障的原因包括格式化、数据删除和数据损坏。与硬件相关的故障原因包括控制器故障、HBA 故障、磁盘缓存关闭和缓存电池故障。存储阵列问题的原因包括 RAID 配置不当、RAID 重建、驱动器不匹配和背板故障。

存储管理软件提供执行以下磁盘管理任务的功能：管理分区、映射网络资源、挂载文件系统以及添加、配置和移除分区。

存储阵列将存储驱动器组合成一个独立于网络服务器操作的数据存储单元。存储阵列是 SAN 和 NAS 的基础。磁盘阵列制造商提供存储管理软件，RAID 实现有特定的软件工具，操作系统在日志文件中记录事件。

问题

以下哪项不是硬盘驱动器的常见问题？
1. 访问缓慢
2. 数据损坏
3. 太快
4. 坏扇区或簇
以下哪种数据存储设备没有与存储相关的活动部件？
1. 硬盘驱动器（HDD）
2. 固态硬盘（SSD）
3. 数字视频光盘（DVD）
4. 光盘（CD）
缩写 HBA 代表什么？
1. 层次化二进制阵列
2. 主机基础算法
3. 主机总线适配器
4. 层次化总线适配器
缩写 RAID 最常接受的含义是以下哪项？
1. 独立磁盘的响应式阵列
2. 冗余独立磁盘阵列
3. 重建的独立磁盘阵列
4. 可读的独立磁盘阵列
以下哪一项是备份失败的常见原因？（请选择所有适用项）
1. 磁带驱动器错误
2. 人为错误
3. 操作系统错误
4. 磁盘错误
以下哪一项不是设备或组件故障类型？
1. 驱动器故障
2. 连接器故障
3. 控制器故障
4. 缓存故障
5. RAID 和阵列故障
6. 电缆终端故障
7. 以上所有
8. 以上都不是
启动过程所需的硬盘分区信息在哪个数据块中找到？
1. 注册表
2. MBR
3. 文件系统
4. 磁盘缓冲区
在 Windows 系统中，哪种系统工具可以用来查看系统日志文件的内容？
1. 任务管理器
2. 设备管理器
3. 控制面板
4. 事件查看器
哪种逻辑结构将存储设备组合成一个独立于网络服务器操作的单元？
1. 数据阵列
2. iSCSI 链
3. 存储或磁盘阵列
4. 数据库