[技术]详谈服务器的热插拔技术
目前服务器的技术热点主要有:IRISC与CISC技术、处理器技术、多处理器技术(AMP技术、SMP技术、MPP技术、COMA技术、集群技术和NUMA技术)、SCSI接口技术、智能I/O技术、容错技术、磁盘阵列技术、热插拔技术、双机热备份。
服务器在网络中承担传输和处理大量数据的任务,要具备高可伸缩性、高可靠性、高可用性和高可管理性。IA-64体系将带动服务器技术特性的提高,如高性能CPU、多处理器技术、总线和内存技术、容错技术、群集技术、硬件管理接口、均衡服务器平台技术等。
热插拔(Hot Swap)技术
热插拔技术指在不关闭系统和不停止服务的前提下更换系统中出现故障的部件,达到提高服务器系统可用性的目的。目前的热插拔技术已经可以支持硬盘、电源、扩展板卡的热插拔。而系统中更为关键的CPU和内存的热插拔技术也已日渐成熟。未来热插拔技术的发展将会促使服务器系统的结构朝着模块化的方向发展,大量的部件都是可以通过热插拔的方式进行在线更换的。
PCI热插拔,INTEL所支持热插拔属性:
热插拔支持
PCIExpress*技术是一种创新的高性能互连体系结构,可带来显著增强的可靠性、可用性和可维护性(RAS)。本文将重点介绍RAS的其中一个方面:热插拔支持。文章深入介绍了与热插拔支持相关的问题和挑战,并描述了PCIExpress如何能够通过消除平台体系结构中影响可靠性和可维护性的冲突连接,帮助开发人员充分利用过去和现在的输入/输出(I/O)体系结构的优势,同时继续向前发展。
传统PCI热插拔技术
热插拔技术允许用户在不中断系统中其它设备运营的情况下,物理拆卸或添加工业标准的外设组件互连(PCI)设备(如局域网网卡或I/O控制器等)。在添加或拆卸的过程中,只有个别插槽会受到影响,系统将无需重启或关机。
热插拔技术通常要求在不同平台层中的硬件和软件能够实现良好的互操作性,以便为用户提供可靠的热插拔功能――而这也正是问题的所在。不同厂商的组件必须能够结合起来支持热插拔功能。这使得当企业IT和数据中心经理尝试对不同服务器和适配器产品配置(包含定制的服务器平台)的众多服务模式进行分类时,将可能面临极大的可维护性挑战。原因在于,不同的服务模式将导致服务复杂性的加剧和停机可能性的增加。
需要实现无缝互操作以支持传统热插拔功能的硬件和软件组件包括:
·特定平台厂商组件,包括热插拔控制器(HPC)和电脑基本输入输出系统(BIOS)等――操作系统通过此类软件与计算机的HPC和其它平台相关组件进行通信。
·特定操作系统技术,包括操作系统电源管理(OSPM)、高级配置和电源接口(ACPI)驱动程序、ACPI源语言和ACPI机器语言(AML)解释程序、以及操作系统相关应用/API等。
·独立于操作系统之上的技术,诸如ACPI(包括特定平台厂商代码)等。
硬件BIOS和操作系统相关、或与之紧密结合的组件会加大支持的成本与复杂性,并降低整体系统的可靠性。这是因为:
·操作系统直接控制以外的诸多变数――可靠性取决于不同厂商组件中最薄弱的一环。
·不同的BIOS、驱动程序和控制器。
·操作系统API/应用采用的不同使用模式。
·不一致的兼容模式,诸如原始设备制造商(OEM)和独立硬件厂商(IHV)推出的产品等。
·IT/数据中心经理需要提供不同的平台支持模式。