博客
关于我
ORACLE11g 云上Data Guard环境备库down机恢复实战过程
阅读量:550 次
发布时间:2019-03-09

本文共 1664 字,大约阅读时间需要 5 分钟。

Oracle备库故障处理及恢复方法

故障现象

微软云上的Oracle备库意外发生故障,导致ping不通,各种监控报警接连上来。联系微软云后台工程师,告知问题可能出在存储设备上的文件损坏。系统启动检查发现,除非重启系统,否则无法正常启动到登录界面。


故障诊断

系统启动检查发现:

  • /dev/sdc1的superblock损坏,无法识别文件系统。
  • 备用数据库无法启动,报警信息显示文件不一致,数据恢复失败。

  • 故障处理措施

    1. 系统重启

    微软云团队根据建议,进入管理界面,关闭数据库服务并重启系统。3小时后,工程师反馈恢复完成,备库服务器正常启动。

    登录系统后发现:

    • 数据文件目录仍在原位置。
    • 启动数据库时,报错:
      SQL> startupORACLE instance started....ORA-10458: stadby database requires recoveryORA-01196: file 1 is inconsistent due to a failed media recovery session
    • 数据文件恢复失败,提示介质恢复失败。

    2. 启动归档传输

    为了确保数据恢复,启动归档传输:

    SQL> alter database recover managed standby database using current logfile disconnect from session;

    执行后确认完成:

    SQL>

    3. 实时观察日志应用

  • 主库查看
  • # 主库查看归档日志是否已传输SQL> select sequence#,applied from v$archived_log order by sequence#;

    输出显示,归档日志已传输到备库,但还在应用中。

    1. 备库查看
    2. # 备库查看回流进度SQL> select sequence#,applied from v$archived_log order by sequence#;

      输出显示,归档日志已完全传输,但正在进行应用。


      4. 检查日志应用进度

      通过检查v$dataguard_stats

      SQL> set linesize 2000SQL> select name,value from v$dataguard_stats;

      输出显示:

      • transport lag: +00 00:00:00
      • apply lag: +02 01:23:55
      • apply finish time: +00 00:06:31.000
      • estimated startup time: 11

      日志应用仍在进行中。


      5. 结束归档恢复

      随着日志应用逐步完成,后台日志显示:

      Media Recovery Log /oracle/app/oracle/flash_recovery_area/archivelog1_16855_906253421.dbf...Recovery of Online Redo Log: Thread 1 Group 4 Seq 16856 (in transit)

      6. 启用数据库

      尝试打开数据库:

      SQL> alter database recover managed standby database cancel;
      SQL> alter database open;
      SQL> alter database recover managed standby database using current logfile disconnect;

      最终,验证数据库状态:

      SQL> select name,open_mode from v$database;

      输出:

      NAME  OPEN_MODEPOWERDES MOUNTED

      验证修复成果

    3. 数据文件完整性恢复。
    4. 极化传输完成,主备同向一致。

    5. 总结

      通过系统重启、启动归档传输以及实时日志观察,最终成功恢复了Oracle备库,主备数据库保持了数据的一致性和服务可用性。

    转载地址:http://nkjsz.baihongyu.com/

    你可能感兴趣的文章
    Nginx配置TCP代理指南
    查看>>
    Nginx配置代理解决本地html进行ajax请求接口跨域问题
    查看>>
    Nginx配置参数中文说明
    查看>>
    Nio ByteBuffer组件读写指针切换原理与常用方法
    查看>>
    NIO Selector实现原理
    查看>>
    NISP一级,NISP二级报考说明,零基础入门到精通,收藏这篇就够了
    查看>>
    NI笔试——大数加法
    查看>>
    NLP 基于kashgari和BERT实现中文命名实体识别(NER)
    查看>>
    NMAP网络扫描工具的安装与使用
    查看>>
    NN&DL4.3 Getting your matrix dimensions right
    查看>>
    NN&DL4.8 What does this have to do with the brain?
    查看>>
    No 'Access-Control-Allow-Origin' header is present on the requested resource.
    查看>>
    No fallbackFactory instance of type class com.ruoyi---SpringCloud Alibaba_若依微服务框架改造---工作笔记005
    查看>>
    No module named cv2
    查看>>
    No module named tensorboard.main在安装tensorboardX的时候遇到的问题
    查看>>
    No qualifying bean of type XXX found for dependency XXX.
    查看>>
    No resource identifier found for attribute 'srcCompat' in package的解决办法
    查看>>
    Node.js 文件系统的各种用法和常见场景
    查看>>
    node.js 配置首页打开页面
    查看>>
    node.js+react写的一个登录注册 demo测试
    查看>>