第 5章 网络存储备份技术
随着网络技术的不断发展,应用领域的快速扩张,不论是
Internet还是企业和机构网络上的数据量都在成倍地增长,
因而对数据访问的速度、可用性、可靠性、可管理性等要
求变得非常突出。网络存储和备份技术就是解决上述问题
的非常好的手段。
对于大多数读者来说,存储与备份技术可能比网络、服务
器等常用技术陌生得多,但目前对于大、中型网络系统而
言,存储与备份技术几乎成为必备选项。因此,网络存储
备份技术成为了网络系统集成的重要内容之一。
本章主要内容
? 网络存储技术
? 网络备份技术
? 常用网络系统备份方案
? 基于 CA ARC Serve的典型备份案例
1
2
3
4
5.1 网络存储技术
? 九十年代以前,存储产品大多作为服务器的组成部分之一,这
种形式的存储被称为 SAS( Server Attached Storage 服务器附
属存储)或 DAS( Direct Attached Storage,直接连接存储或
直接附属存储)
? 随着技术的发展,进入九十年代以后,人们逐渐意识到 IT系统
的数据集中和共享成为一个亟待解决的问题。于是,网络化存
储的概念被提出并得到了迅速发展。从架构上来分,当今的网
络化存储系统主要包括 SAN( Storage Area Network,存储区
域网络或称存域网络)和 NAS( Network Attached Storage,
网络连接存储或网络附属存储)两大类。
? 本节介绍当前流行的几种主要的存储技术,
? RAID
? DAS
? SAN
? NAS
? iSCSI
5.1.2 RAID存储技术
? RAID( Redundant Array of Independent Disks)是指独立磁盘冗
余阵列,其最初所指为廉价磁盘冗余阵列。 RAID阵列技术允许将
一系列磁盘分组,以实现提高可用性的目的,并提供为实现数据
保护而必需的数据冗余。 RAID一般是通过磁盘阵列卡控制 SCSI磁
盘驱动器来实现的。
? RAID的实现方式,RAID可以通过硬件实现,也可以通过软件实
现,但二者有着天壤之别。 RAID硬件阵列是使用专门的磁盘阵列
卡来实现的。 RAID软阵列是通过支持 RAID的操作系统进行配置
和管理而实现的,如 Windows NT操作系统就能提供软件 RAID功
能。因软件 RAID需要占用 CPU时间,所以 RAID模式越复杂,对于
计算机系统影响就越大,运行效率也越低;再者,RAID系统受制
于脆弱的操作系统,可靠性也很难保障,因此,除非经费受限,
一般不建议采用。
? 硬件 RAID实现分为两种:一种是内置(或集成) RAID控制器,
一种是外置 RAID控制器。外置 RAID控制器包括从控制器到硬盘
等一套设备。外置 RAID控制器比内置 RAID控制器结构更加复杂,
缓存容量更大,功能也更强大、可扩展性也更强。
磁盘镜像技术( 1)
? 磁盘镜像就是在一台服务器内安装二个(或者多个)独
立的硬盘,即用一块磁盘控制器连接两个性能相同的硬
盘。当系统工作时,将数据同时存入这两个硬盘,这两
份数据称为镜像关系。当一个硬盘出现故障时,可以使
用另一个硬盘,从而保证网络系统正常运行。
磁盘镜像技术( 2)
? 不足之处,
? 不能并行写入,因此存储数据的时候并不能提升速
度。不过,在读取数据的时候镜像可以提升速度。
RAID控制器可以读取镜像的两个设备中的任意一个
的数据,当其中一个使用时,另一个空闲的可以响
应其他的请求;
? 磁盘镜像可以防止单个硬盘的物理损坏,但无法防
止逻辑损坏;
? 一旦磁盘控制器出现故障,整个网络系统就完全不
能运行了。
奇偶校验技术
? 奇偶校验( Parity)是应用于 RAID中的另一种冗余技术。
RAID中的 Parity类似于内存中的技术。
? 不必把数据镜像,对整个硬盘的数据进行奇偶校验运
算,只需一个硬盘就能保证数据完整性,这就是奇偶
校验技术相对于镜像技术的优势。考虑硬盘有可能崩
溃,而多个硬盘同时崩溃的可能性极小,因此通过将
奇偶校验数据分布在磁盘阵列的多个磁盘上,可实现
更为可靠的分布式奇偶校验。奇偶校验技术的主要缺
陷是:①需要进行大量的运算,对于计算机 CPU有着
相当高的要求。每一次读取、写入数据都要进行一次
奇偶校验运算,必须具备硬件 RAID控制器,运用软件
RAID几乎是不可能实现的;②恢复数据比镜像技术复
杂,恢复速度也要慢的多。
条块技术( 1)
? 条块( Striping)技术是把进入 RAID控制器的数据分割成很多部
分,每一部分为一个条块,再采用并行处理方式把条块数据分布 到 RAID阵列的所有驱动器上。
? 举个例子说明条块技术的工作原理:假设需要存储的数据分为了
4块( A,B,C,D),且需要分布到 3个硬盘上,那么第一个字
节存储在第一个硬盘上、第二个字节存储在第二个硬盘上,第三
个字节存储在第三个硬盘上,而第四个字节又存到一个硬盘上,
如此循环。图 5-2给出了条块技术工作原理示意图。
条块技术( 2)
? 如果某一个磁盘出了故障,如磁盘 2有故障,可以通过读取磁盘 1
的数据( A,D,C)以及磁盘 3的数据( C,B,A),恢复原始数
据( A,B,C,D)。当需要移动、传输数据时,控制器将对两个
硬盘同时存取,从而提高性能。条块分割是 RAID中最具代表性的
技术,它使得磁盘系统传输性能成倍提高。在一定的范围内,可 以说 RAID阵列中的硬盘越多,性能的提高就越明显,而硬盘驱动
器数目决定了条块带宽。
? 条块技术的数据分块有两个级别,
? 字节一级的条块
? 数据块一级的条块
? 条块容量的大小是实现 RAID的一个很关键的技术,不同的应用中
应该采用不同的尺寸。条块容量对于最终性能的提高或者降低影
响很明显,条块容量越小,文件被分割的就越多,同时传输性能
将因并行处理能力的提高而提高,但是也会增加文件存储的随机
性。而使用大的条块容量所取得的效果同使用小的条块容量相反,
数据分布和传输的性能将会减低,不过文件存放的随机性也会下
降。
双机集群的磁盘阵列技术
? 双机集群的磁盘阵列见 4.1.4节中的有关内容,示意图
见图 4-3。在硬件上,于双数据库服务器之间设一组可
伸缩的磁盘阵列,并以 RAID-5技术将用户的共同数据
存于共享磁盘组中。双机集群的磁盘阵列控制软件于
多个处理器之间分配负载、应用、数据库,将其连接
起来,使它们成为一个系统出现在用户面前。
? 这样的双机集群磁盘阵列系统,可以克服单点故障的
发生,在操作系统崩溃、网络控制失效或 I/O故障时,
控制软件均可检测出现的问题,并立即将应用操作转
移到另外一个系统上。其故障恢复对用户是完全透明
的。在灾难性事件发生时,仍可提供持续的计算能力,
最大限度地减少停机时间,AdvFS( Advanced File
System)实用程序重新启动系统只需几秒钟。整个系
统的可靠性、可用性和高服务性都将得到提高。
RAID的级别( 1)
? RAID技术是一种工业标准,但各厂商
对 RAID级别的定义不尽相同。目前对
RAID级别的定义可以获得业界广泛认
可的有 4种,即,
? RAID0
? RAID1
? RAID10
? RAID5
RAID的级别( 2)
? RAID0:在阵列中采用了条块算法,即读 /写数据时多
块硬盘同时操作,数据被分散地写在各个硬盘上。具
有成本低、读写性能极高、存储空间利用率高等特点,
适用于音视频信号存储、临时文件的转储等对速度要
求极其严格的特殊应用。但由于没有数据冗余和校验,
其安全性大大降低,构成阵列的任何一块硬盘的损坏
都将带来灾难性的数据损失。通常建议还要在 RAID0
中配置 4块以上的硬盘,目的是减少硬盘损坏的可能性。
? RAID1:是指两块硬盘数据进行完全镜像,即通常说
的磁盘镜像,这种方式安全性高、技术简单、管理方
便、读写性能好。 RAID0的缺点是无法扩展,数据空
间浪费大。 RAID0一般用在操作系统和应用系统硬盘
上。
RAID的级别( 3)
? RAID10:即 RAID0+1。综合了 RAID1和 RAID0的特点,
独立磁盘配置成 RAID0,两套完整的 RAID0互相镜像
( RAID1)。它的读写性能出色,安全性高,但缺点
是构建阵列的成本投入大,数据空间利用率低,不是
经济高效的方案。
? RAID5:是将各块独立硬盘进行条块化分割,相同的
条块区进行奇偶校验,校验数据平均分布在每块硬盘
上。以 n块硬盘构建的 RAID5阵列可以有 n- 1块硬盘的
实际可用容量,存储空间利用率非常高。任何一块硬
盘上的数据丢失,均可以通过校验数据推算出来。
RAID5具有数据安全、读写速度快、空间利用率高等
优点,应用非常广泛。 RAID5的缺点是写操作较慢,
因为要进行校验数据的计算;另外,如果一块硬盘出
现故障,系统要通过计算来恢复丢失的数据,使整个
系统的性能将大大降低。 RAID5是目前应用最广泛的
RAID技术。
RAID的级别( 4)
? 如何为服务器选定 RAID级别:有三个因素影响
对 RAID级别的选择。
? 可用性(数据冗余)
? 性能
? 成本
? 如果不需要可用性,那么 RAID0将带来最佳性
能。如果可用性和性能很重要而价格并不重要,
可选择 RAID1或 RAID10(视磁盘数而定)。如
果价格、可用性和性能同样重要,那么选择
RAID3,RAID- 5(视数据传输类型和磁盘驱
动器数目而定)。
5.1.3 DAS存储技术
? DAS( Direct Attached
Storage,直接连接存储或
直接附属存储)是指直接
将存储设备连接到服务器
上,连接方式有两种,即
SCSI线缆和光纤通道。如
图 5-3所示。
DAS存储方式的特点
? 由于 DAS是采用传统的连接方法,即每个服务器或客户端各自连接自
己的 DAS设备,使得 DAS设备在安装的时候不必考虑其他服务器或客
户端对其的影响,网络架构有固定的模式可以套用; DAS的主要优点
是价格低廉、配置简单、使用方便。
? 但因为网络对 DAS的管理是分散的,随着需求的不断扩大,越来越多
的存储设备和服务器被添加进来,DAS环境将导致服务器和存储孤岛
数量的激增,产生巨大的管理负担,并导致资源利用率低下。其缺
点具体表现在如下几个方面,
? DAS存储系统不能提供不同操作系统下的文件共享。
? 由于 DAS设备与相应服务器或客户端靠 SCSI接口连接,当存储容量不足
时,想在网络中添加新的 DAS设备的时候就会遇到麻烦,如 SCSI接口卡
的槽位数量,向网络中添加新的 DAS设备时必须停顿整个网络服务等。
? DAS存储设备采用分散式管理,数据被存放在不同的地方,每做一次数
据整理或设备维护,需要耗费大量的人力物力,有时结果却事倍功半。
? 备份设备与 DAS分离,进行数据备份时数据由 DAS设备到备份设备中需
通过服务器,因此加重服务器负担。
? DAS数据存储设备不是独立的存储系统,向 DAS设备中存取数据时,数
据必须通过相应的服务器或客户端,加重了负担。
5.1.4 SAN存储技术( 1)
? 所谓 SAN( Storage
Area Network,存
储区域网络或称存
域网络),是指在
网络服务器群的后
端,采用光纤通道
( FC,Fiber
Channel)协议连接
成高速专用网络,
使网络服务器与多
种存储设备直接连
接。 SAN通常由存储
设备(专用磁盘阵
列、磁带机)和光
纤交换机组成。
数据库服务器
应用服务器
交换机 A
交换机 B
磁盘阵列子系统 磁盘阵列子系统 磁盘阵列子系统
U n i x 客户端 U n i x 客户端
U n i x 客户端
光纤通道
5.1.4 SAN存储技术( 2)
? 从图中可以看出,LAN和 SAN分别以各自的中心设备,即以网络
交换机和光纤交换机为核心构建,而服务器是它们的交点。每台 服务器上都有一块网卡用以连接 LAN,同时有一块主机总线适配
卡( HBA,Host Bus Adapter)用以连接 SAN,HBA卡的带宽通常
为 100MB/s。
? SAN是一个以光纤交换机为中心的、独立的数据存储网络,在此
网络上使用的协议是光纤通道协议。 SAN实际上是以数据存储为
中心,通过具有较高传输速率的光通道连接方式,提供 SAN内部
任意节点之间的多路可选择的数据交换,并且将数据存储管理集
中在相对独立的存储区域网内,充分体现了功能分拆的思想,提
高了系统的灵活性和数据的安全性。
? SAN的最大特点就是可以实现网络服务器与存储设备(例如 RAID
和磁带库)之间的多对多连接,而且,这种连接是本地的高速连
接,几个服务器共享存储访问,服务器通过光纤交换机连接到存 储系统。
? 如果 SAN是基于 TCP/IP的网络,则通过 iSCSI技术,实现 IP-SAN网
络。
5.1.4 SAN存储技术( 3)
——SAN的主要优点
? 性能相当高,光纤通道协议在传送大
数据块时非常有效,这使得 SAN非常
适用于存储密集型环境;
? 集中存取,更有效地利用存储资源;
? 简单、集中的存储管理,降低了管理
工作量,节约了时间和金钱;
? 存储设备到服务器的多对多连接方式,
提高了灵活性和可扩充性;
? 集中的存储备份,其中性能、数据一
致性和可靠性可以确保关键数据的安
全,缩短了数据备份和恢复时间,提
高了吞吐量;
? 通过备份软件,可以做到 Server-Free
和 LAN-Free备份,减轻服务器和网络
负担,降低了 LAN拥塞;
? 具备恢复能力的网络设计,为确
保业务连续性提供了更高的数据
可用性;
? 卓越的可扩展性和投资保护,可
以根据业务需求轻松添加更多的
存储设备;
? 服务器和存储设备可以在物理上
分离,确保动态存储分区,存储
环境安全性更高;
? 无需中断业务,即可添加或重新
配置存储资源;
? 保证短期和长期的投资回报;
? 开放的、业界标准的光纤通道技
术还使得 SAN非常灵活。
5.1.4 SAN存储技术( 4)
——SAN存在的主要问题
? SAN解决方案的最大问题是成本较高,一般中小用户
还难以承受每端口 1000美元左右的光纤交换设备和相
对较昂贵的光纤存储设备。
? SAN可以取代基于服务器的存储模式,但 SAN本身缺乏
标准,互操作性也是一个主要问题。
? SAN是独立出的一个数据存储网络,整体网络内部的
数据传输率很快,但操作系统仍停留在服务器端,客
户端不能直接访问 SAN的网络,而是通过相应的服务
器操作系统访问 SAN。即 NT客户端 → NT服务器 → FC交
换机 → 存储设备,而 UNIX客户端 → UNIX服务器 → FC交
换机 → 存储设备。因此造成 SAN在异构环境下不能实
现文件共享。
5.1.4 SAN存储技术( 5)
? SAN和 DAS的比较
? SAN和 DAS相比有很大的优势,SAN的可升
级性、稳定性、可用性和性能都大大加强。
不过,它最大的优势是集中的管理,这就降
低了总拥有成本。
? 无论是 SAN还是 DAS存储方案,服务器与存
储设备交换的都是数据块,所以比较适合于
数据库应用。
5.1.5 NAS存储技术( 1)
? NAS( Network Attached Storage,网络
连接存储或网络附属存储),或称为网
络直联存储设备、网络磁盘阵列。是一
种将分布、独立的数据整合为大型、集
中化管理的数据中心,以便于对不同主
机和应用服务器进行访问的技术。通俗
地讲是直接挂接在网上的、提供数据和
文件服务的存储设备,实际上就是一台
专用的 NAS服务器。如图 5-5所示。
? NAS服务器或称专用数据服务器,一般由
处理器和磁带机、磁带库等存储硬件、
存储操作系统以及其上的文件系统等几
个部分组成。
5.1.5 NAS存储技术( 2)
——NAS的主要优点
? 数据成为了网络的中心,NAS设备是直接连接在网络上并单独作
为一个文件服务器存在的,网络中所有设备的数据全部存储在这 一个 NAS设备中,简化了网络架构。
? 将 NAS设备连接到网络上非常方便。 NAS设备提供 RJ-45接口和单
独的 IP地址,可以将其直接挂接在主干网的交换机或其他局域网
的 HUB上,通过简单的设置(例如设置机器的 IP地址等)就可以
在网络上应用 NAS设备了,完全是即插即用,而且进行网络数据
在线扩容时也无需停顿网络,从而保证数据流畅存储,因此对照 传统的服务器或 DAS存储设备,NAS拥有更大的存储空间和相对
低廉的价格。
? 由于 NAS设备的安装、调试、使用和管理非常简单,因此对于选
用 NAS作为网络数据存储设备的企业用户来说,昂贵的设备管理
与维护费用将不复存在。而且 NAS设备在网络中占用一个 IP地址,
本身就相当于一台高性能的文件服务器,用户选用 NAS设备后只
须购买相应的应用服务器就行了,这样可以节省大量的设备成本。
5.1.5 NAS存储技术( 3)
——NAS的主要优点
? 由于 NAS是直接连接到 TCP/IP网络( LAN或 WAN)上,
支持通用的网络存储数据传输协议,如 NFS( Network
File System,用于 UNIX操作系统环境下,实现文件级
的数据共享)和 CIFS( Common Internet File System,
用于 Windows操作系统环境下,实现文件级的数据共
享)等,所以不需要任何附加软件,即可在几乎所有
平台之间实现跨平台的数据共享。
? NAS设备采用集中式存储结构,摒弃了 DAS的分散存储
方式,网络管理员可以方便地管理数据和维护设备,
同时 NAS设备允许用户在网络上存取数据,有效改善
了网络的性能。
? NAS与应用服务器之间交换的是文件,所以 NAS产品比
较适合于文件存储。
5.1.5 NAS存储技术( 4)
——NAS的主要优点
? NAS设备内置优化的独立存储操作系统,可以有效紧
密地释放系统总线资源,全力支持 I/O存储,因此 NAS
设备的效率较 DAS设备高出 60%以上。同时 NAS设备一
般集成本地的备份软件,可以不经过服务器将 NAS设
备中的重要数据进行本地备份,而且 NAS设备提供硬
盘 RAID、冗余的电源和风扇以及冗余的控制器,可以
满足 7× 24小时的稳定应用。
? NAS设备一般会提供错误恢复系统,并会通过 E-mail系
统将报警信息自动发给系统管理员,同时 NAS设备会
进行动态监测,并提供详细的日志报告,以求全面保
护数据。
? NAS产品是真正即插即用的产品。
5.1.5 NAS存储技术( 5)
——NAS的主要缺点
? NAS是直接挂接在网上的,因此会占用网络带宽资源,好在网络
带宽也在迅速增长。但在进行大型文件传送时,往往引起网络拥 塞。所以,NAS的局限性之一就是其网络传输数据的能力。
? NAS在传输数据的处理过程需要占用处理器资源来中断和重新访
问数据流,如果数据包的处理占用太多的处理器资源,则在同一
服务器上运行的应用程序会受到影响。
? NAS存储的可扩展性也受到设备大小的限制。增加另一台设备非
常容易,但是要像访问一台计算机上的数据那样访问网络环境中
的内容并不容易,因为 NAS设备通常具有独特的网络标识符。
? 由于上述这些限制,NAS环境中的数据备份不是集中化的,因此
仅限于使用直接连接存储设备(如专用磁带机或磁带库)或者基
于网络的策略,在该策略中,存储设备上的数据通过企业或专用
LAN进行备份。
5.1.5 NAS存储技术( 6)
——NAS与磁盘阵列( RAID)的区别
? NAS是一台服务器,有自己的核心,如 CPU、内存、操作系统、
磁盘系统,而 RAID只是一个存储介质。
? NAS直接接到交换机或集线器上,不依赖于服务器。 RAID接到服
务器后端,没有自己文件管理系统,完全依托于服务器,当数据
流量很大时,给服务器造成的压力很大,易形成 I/O瓶颈,使整个
网络系统性能降低。
? RAID技术的出现,是为了提高数据存储的可靠性。 NAS把 RAID技
术融合在它的文件系统中,这样既提高了数据的可靠性,又利用
磁盘的并行操作,提高了系统的整体性能。
? 当通用文件服务器的 CPU进行 I/O操作时,系统发生中断,等待
I/O完成后才能恢复应用运行。在有 NAS的系统中,应用程序需要
进行磁盘 I/O操作时,I/O操作由 NAS完成,在磁盘 I/O操作中最费
时间的是写操作,NAS将写请求先写到 NVRAM(不掉电内存)中,
这个动作完成后,应用程序即可恢复运行,所以效率要高得多。
5.1.6 存储技术的比较
? SAN与 NAS都是为适应高性能和密集的网络存储要求而在 DAS的基
础上发展起来的,是新型数据存储模式中的两个主要发展方向。 DAS,NAS和 SAN三种存储技术的比较见表 5-2。
? 今天,SAN已经渐渐与 NAS环境相结合,以提供用于 NAS设备的高
性能海量存储。事实上,许多 SAN目前都用于 NAS设备的后台,
还有很多企业把 DAS,SAN,NAS的混合配置,以满足存储扩展性
和备份的需要。如图所示。
5.1.7 网络存储新技术
? 虚拟存储技术。
? iSCSI存储技术:可以实现在 IP网络上运行 SCSI
协议( SCSI over IP),类似光纤通道。 iSCSI
在实现上有不同的方式。假设服务器上安装了
iSCSI设备驱动,可以通过 iSCSI协议传送 I/O请
求。这时,目标存储设备可以直接连接到 iSCSI
LAN上,例如 IBM的 Total Storage IP Storage
200i;另一种方式是连接到路由器,通过路由
器连接到基于光纤通道的存储设备,例如 Cisco
5420加 IBM ESS。
5.1.8 存储产品的主要性能指标( 1)
? 数据保护能力,是指在存储设备的设计方面,对各种偶
然性错误和意外情况的预期,以及采取的预防或补救措
施。
? 性能,性能指数主要有两个,带宽和 IOPs(每秒 I/O次
数)。带宽决定于整个阵列系统,与所配置的磁盘个数
也有一定关系;而 IOPs则基本由阵列控制器完全决定。
? 在 Web,E-mail、数据库等小文件频繁读写的环境下,性能主
要由 IOPs决定。在视频、测绘等大文件连续读写的环境下,性
能主要由带宽决定。可见,在不同的应用方式中,需要考察的 侧重点也不同。
? 对 NAS产品来说,主要性能指数也是两个,OPS和 ORT,分别代
表每秒可响应的并发请求数和每个请求的平均反应时间。对磁
带存储设备来说,单个磁带驱动器的读写速度是最重要的性能 指标。
? 容量,用户不仅要关心产品的最大容量,还要关心扩容
成本等问题。
5.1.8 存储产品的主要性能指标( 2)
? 连接性, 选择具有良好的开放性和连接性的产品,不
仅是当前系统正常连接和运行的保障,也为系统将来
扩展提供更大的空间和灵活性。
? 管理性,管理性是任何产品的重要方面之一。首先,
用户应考虑产品所提供的管理功能或方式是否实用可
靠。其次,支持中心化管理和远程管理的产品一定会
令用户省事不少。还有,很多产品的故障自动通知机
制给用户带来了方便,但同时也是数据安全的隐患。
最后,在配置改变或系统扩容时,不需宕机或尽可能
缩短宕机时间,是企业级产品的重要特征。
? 附加功能,如数据快照功能,LUN Masking功能、异地
数据复制功能等。
5.2 网络备份技术
? 网络备份系统是指在分布式网络环境下,通过专业的
数据存储管理软件,结合相应的硬件和存储设备,来
对整个网络的数据备份进行集中管理,从而实现自动
化的备份、文件归档、数据分级存储以及灾难恢复等。
其工作原理是在网络上选择一台应用服务器(当然也
可以在网络中另配一台服务器作为专用的备份服务器)
作为网络数据存储管理服务器,安装网络数据存储管
理服务器端软件,作为整个网络的备份服务器。在备
份服务器上连接一台大容量存储设备(磁带库或光盘
库)。在网络中其他需要进行数据备份管理的服务器
上安装备份客户端软件,通过局域网将数据集中备份
管理到与备份服务器连接的存储设备上。
备份的内容
? 重要数据的备份:重要的数据或数据库;
? 系统文件的备份:例如注册表、
System.ini,Win.ini等系统核心文件;
? 应用程序的备份:用户的应用程序;
? 整个分区或整个硬盘的备份:就是平时所
说的系统镜像;
? 日志文件的备份:动态在线备份。
备份的层次
? 硬件级备份,是指用冗余的硬件来保证系统的连续运行,如果主硬件损
坏,后备硬件马上能够接替其工作。这种方式可以有效地防止硬件故障,
但无法防止数据的逻辑损坏。磁盘双工、镜像及磁盘阵列容错是磁盘系
统安全可靠技术的具体实现,都是典型的 硬件备份措施。
? 软件级备份,是指通过某种备份软件将系统数据保存到其它介质上,当
系统出现错误时可以再通过软件将系统恢复到备份时的状态。当然,用
这种方法备份和恢复都要花费一定的时间,还有可能会使系统间断运行。
但这种方法可以完全防止逻辑损坏,因为备份介质和计算机系统是分开
的,错误不会复写到介质上。
? 人工级备份,人工级的备份最为原始和繁琐,也最有效。但全部数据都
用手工方式恢复是不可取的,实际上也是不可能的。
? 理想的备份系统应该是全方位、多层次的,是在硬件容错的基础上,软
件备份和手工方式相结合的,即应该是一种软硬措施集成的备份方式。
首先,要使用硬件备份来防止硬件故障;如果由于软件故障或人为误操
作造成了数据的逻辑损坏,则使用软件方式和手工方式相结合的方法恢
复系统;如果系统出错,备份之前的数据用软件方法恢复,备份之后的
数据用手工方式恢复。这种结合方式构成了对系统的多级防护,不仅能
够有效地防止物理损坏,还能够彻底防止逻辑损坏,并保证系统在遭受
意外破坏时能够很快恢复,使损失减到最小。
备份的方式
? 完全备份 ( Full Backup):将系统中所有的数据信息全部备份。其优点是数
据备份完整,缺点是备份系统的时间长,备份量大;
? 增量备份 ( Incremental Backup):只备份上次备份以后变化过的数据信息。
增量备份是进行备份最有效的办法,通常与完全备份一起使用提供快速备份,
例如:许多单位在从星期五开始的周末运行完全备份,然后在下个星期一到
星期四运行增量备份。其优点是数据备份量少、时间短,缺点是恢复系统时
间长;
? 差分备份 ( Differential Backup):只备份上次完全备份以后变化过的数据信
息。差分备份需在完全备份之后的每一天都备份上次完全备份以后变化过的
所有数据信息,因此,在下一次完全备份之前,日常备份工作所需的时间会
一天比一天更长一些。其优点是备份数据量适中,恢复系统时间短。
? 各种备份的数据量不同,按从多到少的排序为:完全备份 >差分备份 >增量备
份。在恢复数据时需要的备份介质数量也不一样:如果使用完全备份方式,
只需上次的完全备份磁带就可以恢复所有数据;如果使用完全备份 +增量备
份方式,则需要上次的完全备份磁带 +上次完全备份后的所有增量备份磁带
才能恢复所有数据;如果使用完全备份 +差分备份方式,只需上次的完全备
份磁带 +最近的差分备份磁带就可以恢复所有数据。
备份的类型
? 定期备份。
? 远程磁带库、光盘库备份。
? 远程数据库备份。在与主数据库所在生产机相分离的
备份机上建立生数据库的一个拷贝,通过通信线路将
生产机的数据库日志传到备份机,使备份数据库与主
数据库保持同步。
? 网络数据镜像。
? 远程镜像磁盘。通过高速光纤通道线路和磁盘控制技
术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数
据与主磁盘数据完全一致,更新方式为同步或异步。
网络备份的功能
? 集中式管理网络。备份管理系统对整个网络的数据进行
管理。
? 全自动的备份。备份系统能根据用户的实际需求,定义
需要备份的数据,然后以图形界面方式根据需要设置备
份时间表,备份系统将自动启动备份作业,无需人工干
预。这个自动备份作业是可自定的,包括一次备份作业、
每周的某几日、每月的第几大等项目。设定好计划后,
备份作业就会按计划自动进行。
? 数据库备份和恢复。在今天,数据库系统已经相当复杂
和庞大,用文件的备份方式来备份数据库已不合时宜。
是否能够将需要的数据从庞大的数据库文件中抽取出来
进行备份,是网络备份系统是否先进的标志之一。
? 归档管理。用户可以按项目、时间定期对所有数据进行
有效的归档处理。
5.2.2 主要存储备份介质
? 硬盘存储备份介质
? 内部的磁盘机制(硬盘)
? 外部系统(磁盘阵列等)
? 光学存储备份介质
? CD- ROM
? WORM
? 磁光盘驱动器( MO)
? 磁带存储备份介质
? 4mm磁带机
? 8mm磁带机
? DLT磁带机
? DAT磁带机
? LTO磁带机
5.2.3 网络存储备份软件
? 备份软件技术在整个数据存储备份过程中具有相当的
重要性,因为它不仅关系到是否支持磁带的各种先进
功能,而且在很大程度上决定着备份的效率。有人认
为,最好的备份软件就是操作系统所提供的备份功能,
诸如 Unix的 tar/cpio,Wndows2000/NT的 Windows
Backup,Netware的 Sbackup等。其实不然,因为这些
操作系统仅能提供一些基本的备份功能,缺乏专业备
份软件的高速度与高性能,目前比较流行的专业备份
软件有 CA的 ARCserve2000,Veritas的 BackupExec以
及 Legato的 Networker等。
优秀备份软件应具有的特点
? 安装方便、界面友好、使
用灵活;
? 备份软件应提供集中管理
方式,用户在一台机器上
就可以备份从服务器到工
作站整个网络数据。
? 支持跨平台备份;
? 支持文件打开状态备份;
? 支持在网络中的远程集中
备份;
? 支持备份介质自动加载的自
动备份;
? 支持多种文件格式的备份;
? 支持各种策略的备份方式。
备份策略指确定需要备份的
内容、时间及备份方式。
? 支持多种备份介质,如:磁
带,MO光盘等。
? 支持快速的灾难恢复。
5.3 常用网络系统备份方案
? 对系统进行全面的备份,并不只是拷贝
文件那么简单。一个完整的系统备份方
案,应包括四个部分,
? 备份硬件和软件的选择
? 备份方案的设计
? 日常备份制度
? 灾难恢复措施
5.3.1 备份硬件和软件的选择
? 对备份硬件的要求:备份设备应支持实时数据压缩,
以进一步提高备份速度。备份介质应价格便宜、可靠
性高、可以重复使用、便于移动(备份的数据可以随
时保存到安全的地方),备份介质的容量应不小于现
有系统的平均数据量( GB级)。备份硬件的技术成熟、
可维护性好。
? 备份软件的选择:好的备份硬件是完成备份任务的基
础,而备份软件则关系到是否能够将备份硬件的优良
特性完全发挥出来,在选择上更不能掉以轻心。
? 在选择备份软件时,除了前面的一些要求外,还应考虑以下
几点:软件质量保证程度;软件对系统性能的影响;软件的
可扩充性;软件的运行费用。
? 网络备份系统工具是网络管理人员必不可少的工具,
国外对这方面的研究和开发开始于 80年代中期。到目
前为止,成熟的产品不多,其中使用最广泛的是 CA
( Computer Associates)公司的 ARC Serve。
ARC Serve的特性
? 集中式管理、跨网络备份。
? 灾难的防治与恢复。如果在
网络备份的基础之上实施灾
难恢复措施,在系统毁损而
必须重新安装操作系统及应
用程序的状态下,以简单的
几个步骤跳过重新安装,可
以直接将毁损系统在极短的
时间内恢复原状,包括操作
系统、系统设置、应用程序
及所有的数据。
? 内置防毒软件,备份前扫描病毒,可以实现无毒备份。
? 智慧预警系统。当备份发生
异常或正常作业完成时,可通过传呼,E-Mail、网络广播
等方式自动通知管理员。
? 跨平台支持。可从单一的网
络平台上备份 MS-DOS、
Netware,Windows98/NT、
OS/2,UNIX等不同平台的数
据。支持从服务器到工作站的全面网络备份。
? 支持多种备份介质。
? 使用简单,自动化程度高。
ARC Serve可以实现无人值守
的自动备份,无需派专人管
理,备份过程中还可进行备
份程序自动化与自动化磁带管理。
? 全面保护 NetWare和 Windows
NT操作系统;支持打开文件
备份。
5.3.2 系统备份方案的设计
? 典型的 SAN备份解决方案,BrightStor EB,BrightStor ARCserve Backup、
BrightStor Mobile Backup等备份软件安装在主机和工作站上。主机的数
据通过光纤协议集中到一个 SAN交换机上,然后由该交换机把数据转移
到路由器上,再由路由器控制磁带库进行数据备份,或直接由交换机控
制磁带库的备份。
N T / W 2 K
服务器
磁带库
以太网交换机
W i n d o w s
客户端
应用服务器 应用服务器
U n i x
服务器
N T / W 2 K
服务器
磁带库
B r i g h t S t o r M B 客户端
B r i g h t S t o r E B 控制台
F C 交换机
F C / SC SI 桥
应用服务器
5.3.3 日常备份制度设计
? 日常备份制度( Backup Routines)描述了每天
的备份以什么方式,使用什么备份介质进行,
是系统备份方案的具体实施细则。在制订完毕
后,应严格按照制度进行日常备份,否则将无
法达到备份方案的目标。
? 日常备份制度包括,
? 磁带轮换策略
? 日常操作规程
磁带轮换策略( 1)
? 三带轮换策略
? 这种策略只需要三盘磁带。用户每星期五用
一盘磁带对整个网络系统进行增量备份,因
此,可以保存系统三个星期内的数据。适用
于数据量小,变化速度较慢的网络环境。但
这种策略有一个明显的缺点,就是周一到周
四更新的数据没有得到有效的保护。如果周
四的时候系统发生故障,就只能用上周五的
备份恢复数据,那么周一到周四所做的工作
就都丢失了。
磁带轮换策略( 2)
? 六带轮换策略
? 这种策略需要六盘磁带。用户从星期一到星期四的每天都分别使用一盘
磁带进行增量备份,然后星期五使用第五盘磁带进行完全备份。第二个
星期的星期一到星期四重复使用第一个星期的四盘磁带,到了第二个星
期五使用第六盘磁带进行完全备份。如表 5-3所示。
周一 周二 周三 周四 周五 周六 周日
第一周 磁带 1 增量备份 磁带 2 增量备份 磁带 3 增量备份 磁带 4 增量备份 磁带 5 完全备份
第二周 磁带 1 增量备份 磁带 2 增量备份 磁带 3 增量备份 磁带 4 增量备份 磁带 6 完全备份
磁带轮换策略( 3)
? 祖 -父 -子( GFS,Grandfather-Father-Son)轮
换策略
? 将六带轮换策略扩展到一个月以上,就成为祖 -父 -
子轮换策略。这种策略由三级备份组成:日备份、
周备份、月备份。日备份为增量备份,月备份和周
备份为完全备份。日带共四盘,用于周一至周四的
增量备份,每周轮换使用;周带一般不少于四盘,
顺序轮换使用,用于星期五进行完全备份;月带数
量视情况而定,用于每月最后一次完全备份,备份
后将数据留档保存。这种轮换策略能够备份一年的
数据。
? 根据周带和月带的数量不同,常见的祖 -父 -子轮换
策略有 21盘制,20盘制,15盘制等。下面以 20盘制
为例介绍其轮换策略原理。
磁带轮换策略( 4)
? 每日增量备份( 4盘):周一至周四,每周轮换使用。
? 每周完全备份( 4盘):每周五使用一盘,每月轮换一次。
? 每月完全备份( 12盘):每个月的最后一个周五,每年结束
后可存档或重新使用。如表 5-4所示。
周一 周二 周三 周四 周五 周六 周日
第一周 日带 1 增量备份 日带 2 增量备份 日带 3 增量备份 日带 4 增量备份 周带 1 完全备份
第二周 日带 1 增量备份 日带 2 增量备份 日带 3 增量备份 日带 4 增量备份 周带 2 完全备份
第三周 日带 1 增量备份 日带 2 增量备份 日带 3 增量备份 日带 4 增量备份 周带 3 完全备份
第四周 日带 1 增量备份 日带 2 增量备份 日带 3 增量备份 日带 4 增量备份 月带 1 完全备份
日常操作规程
? 使用 20盘制轮换策略的参考操作规程如下,
? 准备工作:将 20盘磁带分为 4盘日带,4盘周带,12盘月带,并在
磁带标签上标注周一 ~周四、第一周 ~第四周,1月 ~12月。
? 日常操作:如果使用 ARC Serve的自动备份功能,管理人员每天的
备份工作仅仅是更换一下磁带,并看一看最近的备份记录是否正
常;如果使用了磁带库,连磁带也不用人工更换,只需每天查看
备份记录即可。
? 更换磁带要遵循以下三条原则,
? 周一 ~周四使用相应的日带;
? 每月的最后一个周五使用该月的月带;
? 其余周五根据当天是第几个周五使用对应周带。
? 为了避免日带使用过于频繁,1月 ~4月可以先将 5月 ~8月
的月带作为日带使用 4个月; 5月 ~8月时再将 9月 ~12月的
月带作为日带使用 4个月;到了 9月 ~12月才使用真正的日
带。
5.3.4 灾难恢复措施设计
? 灾难恢复措施( DRP,Disaster Recovery
Plan)在整个备份制度中占有相当重要
的地位。因为它关系到系统在经历灾难
后能否迅速恢复。灾难恢复措施包括,
? 灾难预防制度
? 灾难演习制度
? 灾难恢复
灾难预防制度
? 为了预防灾难的发生,需要做灾难恢复备份。灾难恢复备份与一
般数据备份不同的地方在于,它会自动备份系统的重要信息。在 Windows NT下,灾难恢复备份要备份 NT的必要启动文件、注册
表文件的关键数据、操作系统的关键设置等;在 Netware下,灾
难恢复备份要备份驱动程序,NDS、非 Netware分区等重要数据。
利用这些信息,才能快速恢复系统。
? ARC Serve对灾难恢复有充分的支持,备份普通数据的同时就可
以进行灾难恢复的备份,只需选中 ARC Serve中一个选项即可。
用于灾难恢复的软盘,则要使用灾难恢复选件进行生成。灾难恢
复盘必须和灾难恢复备份一起使用,方能恢复系统。
? 关于灾难预防制度,有两点建议,
? 灾难恢复备份应是完全备份;
? 在系统发生重大变化后,如安装了新的数据库系统,或安装了新硬
件等,建议重新生成灾难恢复软盘,并进行灾难恢复备份。
灾难演习制度
? 要能够保证灾难恢复的可靠性,光进行
备份是不够的,还要进行灾难演练。
? 每过一段时间,应进行一次灾难演习。
可以利用淘汰的机器或多余的硬盘进行
灾难模拟,以熟练灾难恢复的操作过程,
并检验所生成的灾难恢复软盘和灾难恢
复备份是否可靠。
灾难恢复
? 拥有完整的备份方案,并严格执行以上的备份
措施,当您面对突如其来的灾难时,就可以应
付自如。
? 灾难恢复的步骤非常简单:准备好最近一次的
灾难恢复软盘和灾难恢复备份磁带,连接好磁
带机,装入磁带,插入恢复软盘,打开计算机
电源,灾难恢复过程就开始了。根据系统提示
进行下去,就可以将系统恢复到进行灾难恢复
备份时的状态。再利用其它备份数据,就可以
将服务器和其它计算机恢复到最近的状态。
5.4 基于 CA ARC Serve的典型
备份案例
? 环境及要求:两台 Netware服务器,一台为文件服务器,另一台为数
据库服务器,运行 Betrieve。要求实现整个网络的数据及系统备份。
? 方案一:将数据库服务器作为备份服务器,软件配置为,ARC Serve
for Netware + Disaster Recovery Option。这种方案可以实现以下功
能:①整个网络中非活跃文件备份;②数据库关闭状态备份;③系统
关键信息( NDS或 Bindery)备份;④系统灾难恢复。
? 方案二:将数据库服务器作为备份服务器,软件配置为,ARC Serve
for Netware + Disaster Recovery Option + Backup Agent for
Betrieve。此可以实现以下功能:①整个网络中非活跃文件备份;②
数据库打开状态备份;③系统关键信息( NDS或 Bindery)备份;④
系统灾难恢复。
? 方案三:将数据库服务器作为备份服务器,使用磁带库作为备份硬件。
软件配置为,ARC Serve for Netware + Disaster Recovery Option +
Backup Agent for Betrieve + Backup Agent for Open Files + Tape
Library Option + RAID Optionfor Tape Library。这种可以实现以下
功能:①整个网络的文件备份,包括活跃状态的文件;②数据库打开
状态备份;③系统关键信息( NDS或 Bindery)备份;④系统灾难恢
复;⑤备份数据的 RAID容错;⑥无人值守的备份。
本章复习重点
? 网络存储产品有哪些种类?存储产品的主要性能指标
? 磁盘镜像技术和条块技术的工作原理
? RAID有哪几种级别
? DAS,SAN,NAS存储技术及其特点,这三种存储技术
的比较
? 备份的方式备份的层次备份的类型
? 日常备份制度设计
? 祖 -父 -子( GFS,Grandfather-Father-Son)轮换策略
? 灾难恢复措施设计
思考与练习题
? 1.网络存储产品有哪些种类?简述
存储产品的主要性能指标。
? 2.简述磁盘镜像技术的工作原理。
? 3.举例说明条块技术的工作原理。
? 4,RAID有哪几种级别?各有何特点?
? 5.什么是 DAS存储技术?有何特点?
? 6.什么是 SAN存储技术?有何特点?
? 7.什么是 NAS存储技术?有何特点?
? 8.试比较 DAS,NAS和 SAN三种存储
技术。
? 9.简述备份的方式、层次和类型。
? 10.常用的存储备份介质有哪些?
? 11.常用的网络存储备份软件有哪些?
? 12.如何设计日常备份制度?
? 13.六带轮换策略和祖 -父 -子轮换策
略的原理是什么?
? 14.如何设计灾难恢复措施?
? 15.详述备份方案的设计步骤。
? 16.请结合网络系统集成实例,设计
一个 SAN备份解决方案。
? 17.请结合网络系统集成实例,设计
一个基于 CA ARC Serve的系统备份方
案。
第 5章完!