最近在做Oracle数据库的灾备方案,选择了DATA GUARD,简称DG,用于Oracle的高可用性,在不影响主库性能的前提下,我们选择使用DG的"最大性能"模式。
DG是Oracle数据库自带的数据同步功能,其基本原理是将日志文件从主库传输到备库,然后在备库上应用这些日志文件,从而使备库与主库保持同步。
Data Guard提供了三种日志传输(Redo Transport)方式,分别是ARCH传输、LGWR同步传输和LGWR异步传输。在上述三种日志传输方式的基础上,提供了三种数据保护模式,即最大性能(Maximum Performance Mode)、最大保护(Maximum Protection Mode)和最大可用(Maximum Availability Mode),其中最大保护模式和最大可用模式要求日志传输必须用LGWR同步传输方式,最大性能模式下可用任何一种日志传输方式。
Data guard原理
Data guard是通过建立一个PRIMARY和STANDBY组来确立其参照关系。
STANDBY一旦创建,Data guard就会通过将主数据库(PRIMARY)的REDO传递给STANDBY数据库,然后在STANDBY中应用REDO实现数据库的同步。
有两种类型的STANDBY:物理STANDBY和逻辑STANDBY
物理STANDBY提供与主数据库完全一样的拷贝(块到块),数据库SCHEMA,包括索引都是一样的。它是直接应用REDO实现同步的。
逻辑STANDBY则不是这样,在逻辑STANDBY中,逻辑信息是相同的,但物理组织和数据结构可以不同,它和主库保持同步的方法是将接收的REDO转换成SQL语句,然后在STANDBY上执行SQL语句。逻辑STANDBY除灾难恢复外还有其它用途,比如用于用户进行查询和报表。
Data guard包含三个服务(日志传输、日志应用、角色转换)
日志传输服务控制REDO数据的传输(传输日志,实施数据库保护模式)--------------STANDBY上通过起用RFS进程接收REDO数据。
日志应用服务则一方面自动应用日志,另一方面自动检测STANDBY缺少的REDO,并从主数据库或其它STANDBY中自动查询出丢失的REDO。
Data guard的几种保护模式:最大保护,最大可用,最大性能
最大保护是指除非REDO在至少一个STANDBY中可用,否则事务不能提交。如果在某个STANDBY中不可用,则主数据库的操作被停止。通常受制约比较多,在生产环境中不是很常用(性价比不好)。
最大可用是指如果STANDBY不可用,主数据库仍然可以处理事务,只是在问题被纠正后,STANDBY和主数据库进行再同步。这样的一个问题是:当再同步之前有FAILOVER时,有些数据可能会丢失。
最大性能是指主数据库的提交操作不等待STANDBY。PRIMARY和STANDBY松耦合,数据保护级别较低。
物理STANDBY可能的模式:只读模式(OPEN READONLY)和恢复模式(MANANGED RECOVERY)
物理Data guard实施简要过程
主数据库的准备工作:FORCE LOGGING,ENABLE ARCHIVING,一个本地归档目的地。
创建STANDBY数据库:
a.关闭主库,冷备份主库数据文件、日志文件和密码文件,然后启动主库,在主库上创建STANDBY的控制文件:alter database create standby controlfile as '文件名'
b.准备参数文件,将参数文件、备份的主库文件和STANDBY控制文件拷贝到STANDBY系统。
需要更改的参数有:standby_archive_dest-----接收的归档日志存放处
db_file_name_convert和log_file_name_convert-----仅当主库和STANDBY库在同一系统下时用
log_archive_dest_1-----本地归档目的地
log_archive_dest_2='service=standby'-----归档到STANDBY的目的地
standby_file_management=auto
remote_archive_enable=true
fal_server
fal_client
instance_name-----当主库和STANDBY库在同一系统下时该参数用于区分主库
lock_name_space-----当主库和STANDBY库在同一系统下时指定STANDBY的实例名和INSTANCE_NAME相同
c.如果是WINDOWS系统,需要创建WINDOWS服务。
d.配置两台机器的tnsnames.ora,双方都能tnsping通
e.在主库和STANDBY库上配置监听
f.起用STANDBY系统上的死连接检测:sqlnet.ora中设置sqlnet.expire_time=2
g.在STANDBY上创建SPFILE
h.启动STANDBY:
startup nomount
alter database mount standby database
i.初始化日志应用服务
alter database recover managed standby database disconnect from session;
3、Data guard维护
a.日志传送服务
有些情况下,你可能需要在归档日志和应用日志之间有个时间间隔,此时可以通过在STANDBY上指定参数log_archive_dest_n中指定delay=minutes属性。
STANDBY上的日志应该与主库上的日志大小相同,另外STANDBY上的日志组应该比主库多,因为这样归档操作才有时间完成。也就是RFS(日志接收)进程在使用STANDBY的日志前,不用等待该日志被归档。最简单判断日志组是否够的方法是查看警告日志和RFS的TRACE文件。
增加STANDBY日志文件的方法:
alter database 语句中使用add standby logfile子句。相关视图v$standby_log,v$logfile
增加STANDBY日志组的方法:
alter database add standby logfile group 10 ('文件名1','文件名2') size 100M对于多个 STANDBY共享归档日志文件目的地,有些情况下需要指定log_archive_dest_n参数的dependency属性,该属性的作用是说明该目的地依赖于父目的地的成功归档。
参数log_archive_dest_n还可以指定reopen、max_failures、sync、async属性。通过给该参数指定LGWR或者ARCH属性以选择是用LGWR还是ARCH进程传送日志。
用于日志接收的几个进程是:LGWR,ARCH,RFS,FAL。FAL进程用于解决日志缝。
设置数据保护模式的语句为:alter database set standby database to maximun(protection|availability|performance)
b.日志应用服务
对于物理STANDBY,日志应用服务涉及到下面几个进程:RFS,ARC,MRP。MRP是管理恢复进程。
启动STANDBY的恢复操作的几个命令:alter database recover managed standby database(启动前台会话);alter database recover managed standby database disconnect from session(启动后台会话,也就是说会话可以继续干别的事情);alter database recover managed standby database cancel(停止日志应用).
可以通过查询视图v$managed_standby查看日志应用情况。
c.数据文件管理
当主库新创建数据文件,可定义参数standby_file_management为auto,让standby也自动创建数据文件。如果主库和standby的数据文件的目录结构不一样,可以设定db_file_name_convert将主库上的文件名转换成standby上的文件名。如果standby_file_management设为auto,则不能在standby上重命名或创建数据文件、日志文件。
每分钟主库会询问standby是否有gap,该行为被称为heartbeat.
可以查询视图v$archived_gap,如果发现有GAP,则可以从主库上将日志文件拷贝到standby,然后将相关文件注册到standby,具体方法是:alter database register logfile '文件名'。当然也可以通过设置参数fal_server,fal_client,让日志应用服务自动处理gap问题。
对于STANDBY日志应用服务,下面几个视图有助于监控:v$managed_standby,v$archived_dest_status,v$archived_log,v$log_status,v$Data guard_status.
可以设置参数log_archive_trace对归档进行不同级别的跟踪。
d.角色转换
ORACLE支持两种形式的角色转换----switchover和failover
switchover包含两个步骤,首先主库被转换成STANDBY,然后STANDBY被转换成主库
switchover的准备工作:完成角色转换需要改变的参数(必须改变所有STANDBY上的 log_archive_dest_n和log_archive_dest_state_n);确保主库和所有STANDBY都有连接;确认没有用户连接到数据库;对于RAC环境确保只有一个实例是活动状态;角色转换之前,主库实例应该是OPEN状态,而STANDBY实例是MOUNT状态,因为这样的话,转换过程中STANDBY数据库也可以应用归档日志,如果STANDBY为READONLY,切换操作仍然可以进行,只是要花一点额外的时间;如果切换操作包含逻辑STANDBY,那么,主库实例和STANDBY实例都必须为OPEN状态;将要转换成主库的STANDBY变成归档模式;取消在该STANDBY库上的日志延迟。
switchover的步骤:在当前主库上,首先确认可以执行switchover操作(select switchover_status from v$database,如果值为TO STANDBY则可以切换,否则需要检查当前Data guard配置是否运行正常),然后将主库切换为STANDBY(执行ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY;这样原控制文件被备份并生成新的STANDBY控制文件,然后只要重新启动该库为STANDBY模式就可以了);以上操作完成后,在原STANDBY数据库上,需要查询原主库的切换信息是否被目标STANDBY接收到(SELECT SWITCHOVER_STATUS FROM V$DATABASE;如果结果为SWITCHOVER PENDING说明STANDBY切换为PRIMARY是可行的,否则需要检查Data guard的配置是否运行正常),然后执行ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;将STANDBY转换成PRIMARY,并重新启动该库。这里需要说明的是如果该库在线重做日志不存在,该切换语句会自动创建它们,然而这样一来,会花费很长的时间。因此ORACLE建议手工增加在线重做日志。手工增加在线重做日志的方法有两种:第一种是将原主库的日志拷贝到原STANDBY,并且定义参数log_file_name_convert,让它将standby和新的日志联系起来。第二种方法是DROP所有目标STANDBY上存在的日志,并且用命令ALTER DATABASE ADD STANDBY LOGFILE创建新的日志。switchover的最后一步是将新生成的STANDBY转换成恢复模式,并将新PRIMARY进行一次归档操作。
failover的准备工作:完成角色转换需要改变的参数(必须改变所有STANDBY上的log_archive_dest_n和log_archive_dest_state_n);确保主库和所有STANDBY都有连接;对于RAC环境确保只有一个实例是活动状态;如果要进行failover操作的STANDBY当前运行于最大保护模式,则应该将它转换成最大性能模式(通过命令ALTER DATABASE SET STANDBY DATABASE TO MAXIMIZE PERFORMANCE;)
failover的步骤:首先发现并解决日志GAP的问题,然后从其它库中将日志号高于本库的日志拷贝过来并应用这些日志,如果你没有手工注册新的日志,那么可以执行下面的语句ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH;否则需要执行的语句为ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH SKIP STANDBY LOGFILE;接下来执行ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;完成切换并重新启动新的主库,可能的话对主库进行一次备份。
e.启动STANDBY
STARTUP NOMOUNT;
ALTER DATABASE MOUNT STANDBY DATABASE;
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;
f.关闭STANDBY
首先确认是否处于恢复状态:SELECT PROCESS, STATUS FROM V$MANAGED_STANDBY;
取消恢复操作:ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;
SHUTDOWN IMMEDIATE;
g.让standby运行于只读访问模式
启动STANDBY为只读模式:
STARTUP NOMOUNT;
ALTER DATABASE MOUNT STANDBY DATABASE;
ALTER DATABASE OPEN READ ONLY;
将恢复模式的STANDBY转换成read only模式:
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;
ALTER DATABASE OPEN READ ONLY;
h.让STANDBY从READ ONLY转变成恢复模式
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;
i.让为只读模式的STANDBY执行排序操作应该注意的问题:
排序操作不能使用非临时表空间,临时表空间必须是本地管理的,并且只包含临时文件
如果在创建STANDBY时主库没有临时表空间,则需要在主库上创建临时表空间,并执行ALTER SYSTEM SWITCH LOGFILE;将redo传给STANDBY。如果要给STANDBY的临时表空间增加临时文件,需要先将STANDBY转换成READ ONLY模式,并执行命令ALTER TABLESPACE temp1 ADD TEMPFILE '/disk1/oracle/dbs/s_temp1.dbf' SIZE 10M REUSE;增加临时文件。
j.可以通过对STANDBY的备份实现对数据库的备份。
k.主库上的操作和STANDBY的应对:
如果你执行ALTER DATABASE CLEAR UNARCHIVED LOGFILE或者打开数据库时使用RESETLOGS,那么必须重新创建STANDBY。
如果你在主库上执行ALTER DATABASE ENABLE|DISABLE,如果你改变表空间的状态,如果你设置了参数STANDBY_FILE_MANAGEMENT为AUTO并创建表空间或者增加数据文件,则不需要对STANDBY进行操作。
如果你在主库上删除了表空间或者数据文件,你需要在STANDBY上等日志应用后在操作系统上删除相关数据文件。
如果你在主库上重命名了数据文件,你也要在STANDBY上重命名(因为是对控制文件的改变,所以没有日志传过去,因此两边都要进行相同的操作)
如果你在主库上改变了控制文件,你就要重新创建STANDBY控制文件或者重建STANDBY数据库。
如果你在主库上增加或删除日志文件,你也需要在STANDBY上进行同步变化。
具体方法为:先取消恢复,如果STANDBY_FILE_MANAGEMENT为AUTO,则改为MANUAL,然后使用命令ALTER DATABASE ADD STANDBY LOGFILE 'prmy3.log' SIZE 100K;增加日志文件或者用命令ALTER DATABASE DROP STANDBY LOGFILE 'prmy3.log'DROP掉日志文件,最后恢复参数STANDBY_FILE_MANAGEMENT的值。
如果你在主库上进行了nologging|unrecoverable等操作,则应该将包含这些变化的表空间拷贝到STANDBY。
如果你改变了主库的参数文件,那么你也应该改变STANDBY的参数文件。
l.监控进程
SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY;
m.监控恢复操作的进程
SELECT ARCHIVED_THREAD#, ARCHIVED_SEQ#, APPLIED_THREAD#, APPLIED_SEQ# FROM V$ARCHIVE_DEST_STATUS;
Oracle data guard 配置实践
现将Data guard配置过程给大家做以分享
1.主库开启归档模式
2.alter database force logging;
3.添加standby logfile
alter database add standby logfile '/data/oracle/oradata/orcl/standby01.log' size 50M;
alter database add standby logfile '/data/oracle/oradata/orcl/standby02.log' size 50M;
alter database add standby logfile '/data/oracle/oradata/orcl/standby03.log' size 50M;
4.配置log_archive_config
alter system set log_archive_config='dg_config=(orcl,dgorcl)';
alter system set log_archive_dest_1='location=/data/arch valid_for=(all_logfiles,all_roles) db_unique_name=orcl';
alter system set log_archive_dest_2 ='service=dgorcl async valid_for=(online_logfile,primary_role) db_unique_name=dgorcl';
5.编辑主库tnsnames.ora文件,将standby实例加进去
DGORCL =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = localhost)(PORT = 1521))
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = dgorcl)
)
)
6.编辑主库listener.ora文件,将standby静态注册进去
# listener.ora Network Configuration File: /data/oracle/product/11.2.0/db_1/network/admin/listener.ora
# Generated by Oracle configuration tools.
LISTENER =
(DESCRIPTION_LIST =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = IPC)(KEY = EXTPROC1521))
(ADDRESS = (PROTOCOL = TCP)(HOST = localhost)(PORT = 1521))
)
)
ADR_BASE_LISTENER = /data/oracle
SID_LIST_LISTENER =
(SID_LIST =
(SID_DESC =
(GLOBAL_DBNAME = dgorcl)
(ORACLE_HOME = /data/oracle/product/11.2.0/db_1)
(SID_NAME = dgorcl)
)
)
7.重启监听
lsnrctl stop
lsnrctl start
8.创建standby库密码文件
cd $ORACLE_HOME/dbs
cp orapworcl orapwdgorcl
9.创建standby的初始化参数文件
cd $ORACLE_HOME/dbs
echo DB_NAME=dgorcl>initdgorcl.ora
10.创建standby库相应的目录
mkdir $ORACLE_BASE/admin/dgorcl
mkdir $ORACLE_BASE/admin/dgorcl/adump
mkdir $ORACLE_BASE/admin/dgorcl/dpdump
mkdir $ORACLE_BASE/admin/dgorcl/pfile
11.创建standby数据文件存放位置
mkdir $ORACLE_BASE/oradata/dgorcl
12.使用standby pfile启动至nomount状态
12.使用rman以auxiliary方式连接standby数据库
export ORACLE_SID=orcl
rman target / auxiliary sys@dgorcl
13.rman 创建standby数据库
run{
allocate channel c1 type disk;
allocate channel c2 type disk;
allocate auxiliary channel stby type disk;
duplicate target database for standby from active database
spfile
parameter_value_convert 'orcl','dgorcl'
set db_unique_name='dgorcl'
set db_file_name_convert='/orcl/','/dgorcl/'
set control_files='/data/oracle/oradata/dgorcl/dgorcl.ctl'
set log_archive_max_processes='5'
set fal_client='dgorcl'
set fal_server='orcl'
set standby_file_management='AUTO'
set log_archive_config='dg_config=(orcl,dgorcl)'
set log_archive_dest_2='service=orcl async valid_for=(online_logfile,primary_role) db_unique_name=orcl' ;
}
14.standby库日志恢复开启
alter database recover managed standby database disconnect from session;
到此已完成Phyical Data guard的相关配置,并为之后调整DG到ADG,做logical Data guard,做报表查询分担主库压力和实现读写分离做准备。