《HPC集群机房建设与管理》简介
《HPC集群机房建设与管理》这本书是由.刘光明主编创作的,《HPC集群机房建设与管理》共有159章节
1
前言
本书从HPC集群机房工程建设与管理的实际需要出发,针对HPC集群的特点,科学评估HPC集群机房的各项指标要求,围绕着“场地建设、供配电系统、制冷系统、安全防范系...
2
目录
前言 1.HPC及机房工程概述 1.1 HPC简介 1.1.1 HPC概念 1.1.2 HPC类型 1.1.3 HPC演进 1.1.4 基于Linux系统的HP...
3
1.HPC及机房工程概述
高性能计算(High Performance Computing,缩写HPC)技术已经成为继理论科学和实验科学之后人类进行各种研究的第三大支柱。高性能计算机是信...
4
1.1 HPC简介
...
5
1.1.1 HPC概念
高性能计算(High Performance Computing,缩写HPC)指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单...
6
1.1.2 HPC类型
有许多类型的HPC系统,其范围从标准计算机的大型集群,到高度专用的硬件。大多数基于集群的HPC系统使用高性能网络互连,比如那些来自InfiniBand或Myri...
7
1.1.3 HPC演进
HPC系统设计与传统数据中心机房基础设施设计的一大区别就是选择现成工具或定制系统。现成的系统只能在很小的范围内进行扩展,限制了未来增长。定制可以保持一个开放式的...
8
1.1.4 基于Linux系统的HPC集群
基于Linux系统的HPC集群模型包括四类主要的硬件组成部分:(1)执行技术工作负载的计算节点或者服务器。 (2)一个用于集群管理,工作控制等方面的主节点。 (...
9
1.2 机房工程概述
计算机信息机房工程是一个集电工、电子、建筑装饰、暖通净化、计算机网络、弱电控制、消防等多学科、多领域的综合工程,并涉及网络工程、综合布线系统等专业技术。机房在配...
10
1.2.1 机房工程的分代
随着计算机系统技术和设备的不断更新换代,机房工程也在不断地更新换代。 (1)第一代机房(1957年~1981年)。 第一代机房主要用于国防、科研和一些特殊的领域...
11
1.2.2 机房等级
我国的机房等级分为A、B、C三级,ANSI/TIA标准中分为1、2、3、4级。 依据我国《电子信息系统机房设计规范》(GB 50174-2008),数据中心可根...
12
1.2.3 机房的总体布局
机房的总体布局依据其性质、任务、业务量大小、所选设备类型以及对供电、空调等方面的要求和管理体制确定。 (1)平面布局。 机房要全面考虑到数据处理的工艺流程、路线...
13
1.2.4 机房工程的组成
机房工程是一项复杂的系统工程,具体包括: (1)机房装修工程。其中还包括机房地面工程、机房天花工程、机房隔断工程和机房门窗工程、保温工程。 (2)机房动力供配电...
14
1.3 对机房工程标准和规范的认识
机房工程技术在20世纪50年代开始有了雏形,在21世纪得到了快速发展,现已形成了一定规模的机房及相关产业。我国机房工程的有关标准在20世纪80年代初期开始着手制...
15
1.4 机房工程技术的发展趋势
近年来,随着高性能计算、云计算技术的发展和网络应用的普及,计算机机房由小规模、封闭式、单一功能向大规模、开放式、多功能方向发展,主要表现在工程技术方面和机房管理...
16
1.4.1 安全
安全方面需要重点讨论的内容是防地震、异地容灾、灾难恢复、防火灾和防水灾。 (1)防地震。 地震是无法避免的,给我们带来的是巨灾,机房建设工程要采取有效的措施来防...
17
1.4.2 节能
当前,数据机房的建设规模越来越大,所消耗的能源越来越多,节能是机房和数据中心的一个非常重要的话题,需要重点讨论的内容是空调设计、送风、慎重设置机房外窗、负荷分级...
18
1.4.3 高效
高效是指在相同的时间里完成更多的任务,而且质量更好。机房高效是满足企业的可靠性和可用性要求,能够确保设备的稳定运行,使设备可用性最高,将故障隐患降到最低,在最大...
19
1.4.4 绿色
绿色机房(绿色数据中心,Green Data Center)是指数据机房中的IT系统、机械、照明和电气等能取得最大化的能源效率和最小化的环境影响。 “绿色”具体...
20
1.4.5 环保
环保是指为解决现实的或潜在的环境问题,协调人类与环境的关系,使环境更适合工作和劳动的需要而采取的各种行动的总称。 机房环保需要重点讨论的内容是机房噪声(音)治理...
21
1.5 机房管理的发展趋势
机房的管理十分重要,管理的好坏直接关系到机房的使用寿命,影响机房的运行费用。 在机房管理方面,向多样化、开放化、大型化、智能化和强化管理方向发展。 (1)多样化...
22
1.6 HPC集群机房基础设施
HPC集群机房,相较于普通机房,基础设施建设及管理方面在机房场地、供配电系统、防雷接地系统、制冷系统、综合布线系统、消防系统、管理系统、性能检测与评估等方面有更...
23
2.HPC集群机房综合模型
HPC集群机房综合效能模型是理解、分析、建设及管理机房的出发点和基础,主要包括网络及物理、可靠性/可用度、能效等方面,也要考虑经济和将来容量规划制约等方面的因素...
24
2.1 网络及物理模型
HPC集群机房是完成高性能计算的集中管理、集中存储、集中传输、集中交换,从而实现信息集中效益的综合体,内容涵盖站点、基础架构、技术与系统架构、应用及数据、业务和...
25
2.1.1 网络模型
第一层为边缘层,又称为综合接入层。在上一代通信网络中,不同网络的接入方式是不同的。固定通信网(简称固网)由模块局实现接入,移动通信网采用无线方式接入。因为在NC...
26
2.1.2 物理模型
机房作为通信与IT信息系统的大脑与中,完成信息的集中管理、集中存储、集中传输、集中交换,从而实现信息集中效益。 机房建设及管理的内容涵盖站点、基础架构、技术与系...
27
2.2 可靠性/可用度模型
在日常生活中,人们在购买一种商品或对一种商品进行评价时,总会有这样的问题: 这商品能用多长时间?是否容易损坏?这就是可靠性问题,就是人们对可靠性的一般认识。可见...
28
2.2.1 可靠性研究的发展
可靠性问题涉及社会的各个方面,其概念的历史几乎与人类社会一样的漫长。但是,可靠性作为一种概念最早是在第二次世界大战期间提出的,当时的武器系统远没有现在的武器系统...
29
2.2.2 可靠性参数
可靠性是什么?如何正确描述一个系统的可靠性?不同的人提出了不同的定义和参数,目前还没有一个统一的定论,但大家普遍公认的定义是Roben Lusser于1952年...
30
2.2.3 可靠性和可用性分析
明确可靠性和可用性的定义之后,可靠性和可用性分析的分析方法就显得尤为重要。 2.2.3.1 可靠性特性 可靠性的理论和实践表明,在一个系统的整个寿命周期中,系统...