
机架数量直接决定数据中心的空间需求。常规 IT 机架尺寸为600 x 1000 mm(宽 x 深),以每百平米机房容纳约50个机架作为参考。机架的具体尺寸若有变化,结合机架数量即可大致估算所需空间。
数据中心的 Tier 等级决定冗余要求和电源分配路径。Tier2 通常采用 N+1 的电源与冷却冗余即可满足需求;Tier3 常具备 N+1 的冷却冗余、双路电力供给与两路独立配电的架构。因此,等级越高,需要的冗余设计越完善。
设计电源容量时,应以平均功率密度为基准,而非单纯以最大额定功率来计算。机架的平均功率密度乘以机架数量得到最大 IT 负载,再加上数据中心整体的供配电、制冷、网络与存储等系统的功耗。为降低成本并保留未来扩展空间,采用模块化设计以实现更高的成本效益比。
在设计阶段,应遵循以下要点以提升结果的可用性与可维护性:
- 弥补设计人员在系统运行管理方面的知识短板,提升设计质量,避免或消除设计缺陷;
- 充分把运维阶段的需求纳入规划设计,确保投入使用后可顺利运行;
- 深入了解并掌握所维护系统的结构、薄弱环节、历史遗留问题与潜在风险,从而制定有据可依的运维和改造计划。
对于不能正确处理倾向、偏好、限制与约束之间区别的情况,应给出如下建议:
- 避免让审批或决策层面的个人偏好主导,避免因个别意见削减关键功能,导致最终交付的数据中心不能满足运营与维护需求;
- 谨防厂商利益驱动导致的夸大性能、混淆概念等现象,防止影响设备选型与总体方案。
机架级电源方面可能需要部署直流、交流电源,或两者的组合。若用于托管,将倾向于具备交流 UPS 的方案;若定位为电信设施,可能需要直流供电。明确需求后再确定直流或 UPS 的容量规模。备份电池通常以大约15分钟的备用放电时间为基准配置,以控制资本支出,同时确保在发生故障时具备足够的应急缓冲。总体而言,应提升备用发电机组的冗余,而非仅增加电池数量。
行业现状常见的规划与执行偏差包括:轻规划、重施工的现象,先建楼体再进行系统规划、机房与设备安装完成后再进行改造、先确定设备再制定方案导致场地与设备不匹配、以及难以满足机房布局与安装条件的情形,从而增加成本与降低可靠性。
维护性与可修复性直接关系到系统可用性。若在规划阶段未留出维护通道与维护空间,设备距离墙体过近、布线不合理、走线架与线槽阻挡维护操作,都会延误故障处理
yy易游。故障发生时,若应急物资与备件无法快速搬运、替换空间不足,也会拉长处置时间甚至引发重大事故。应尽量采用自动化手段,减少人工操作,降低人为因素带来的不确定性。
系统可用性是数据中心规划设计中的核心目标,但在实际执行中,可靠性推算的依据和数据来源往往不统一,导致对等级和可靠性有不同定义与结果。也存在在施工完成后再回过头来调整等级的案例,这样的做法往往因设计中的关键缺陷而使得最终等级下降。此外,常见问题还包括只关注某一子系统的可用性,而忽略不同子系统之间的相互作用对整体可用性的影响。
在规划初期,主观追求规模大、高可用等级与高机架功率密度,而缺乏严格的论证与可行性分析,容易导致成本浪费与建设周期延长;已建成的机房若无法充分利用,往往需要额外改造以满足实际业务需求;若规划设想的功能无法落地执行,可能出现系统可用性达不到预期、制冷能力无法支持高密度机架、发电机无法实现连续运行等问题。
行业内普遍存在的倾向是偏重设备、忽视系统整体的协调:
- 先确定设备规格与厂家,再进行系统设计调整;
- 供电设计追求最高等级的 2N,但实际可能仅 UPS 部分具备 2N 功能,整套系统仍存单点故障;
- 空调与供电冗余设计不一致;
- 使用柴油发电机但缺乏自动启动能力,未充分考虑连续制冷与持续运行的需求。
提升系统统筹设计能力对于高质量完成规划设计至关重要。数据中心建设中,往往因分阶段、分专业实施、跨专业衔接不足而导致交付的系统无法满足业务与运维需求,需进行大规模改造。不同设计人员只关注自己负责的部分,缺乏全局协调;对未来业务与容量管理、扩展需求缺乏准确把握;对周边资源与环境不熟悉,造成实施可行性低、运维困难增加。
总结而言,数据中心建设涉及多方面要点,掌握上述关键点有助于更贴近真实需求,提升建设质量与运营效率。