为了保障数据的可靠性和安全性,预防灾难发生后造成的数据丢失和系统问题,这里可以采用云平台“多可用区域云服务和数据库跨区域数据容灾”的方式。
这种容灾恢复的方式是指利用技术、管理手段和相关资源确保已建立的关键数据、关键数据处理系统和关键业务数据得以备份在与源数据不同的位置,并在灾难发生后可以恢复的过程。
(一)多可用区实例
利用云平台提供的跨区域云服务,每个区域都包含多个可用区。同一区域中的可用区都被设计为相互间网络延迟很小(3 ms以内),并且彼此间故障隔离的单元。
云平台数据库服务单个可用区主实例运行在同一可用区下的两台物理服务器上,可用区中的机柜、空调、电路和网络具有冗余性。通过异步或半同步的数据复制方式和高效的HA切换机制,它为用户提供的数据库可用性高于物理服务器极限。
为了提供比单可用区实例更高的可用性,支持多可用区实例(也叫做同城双机房或者同城容灾实例)。多可用区实例将物理服务器部署在不同的可用区中,当一个可用区A发生故障时,可在短时间内将流量切换到另一个可用区B。整个切换过程对用户是透明的,而且不需要更改应用代码。
(二)跨域容灾实例(www.daowen.com)
云平台数据库服务多可用区实例的容灾能力仅限于同一地区的不同可用区。为了提供更高的可用性,还支持跨区域的数据容灾。用户可以通过数据传输将区域A的实例a异步复制到区域B的实例b(实例b是拥有独立连接地址、账号和权限的完整独立的实例)。
配置了跨域容灾实例后,当实例a所在区域发生短期不可恢复的重大故障时,用户可以随时在另一区域的实例b进行容灾切换。切换完成后,用户可以通过修改应用程序中的数据库连接配置,将应用请求转移到实例b,从而获得高于地理权限的数据库可用性。
(三)备份恢复策略
平台拥有很多关键应用系统,数据构成了应用系统中最重要的信息资产,所以,一定要建立相应的备份和灾难后快速恢复机制,以保证重要业务的连续性。
项目利用多可用区实例方式实现系统数据备份和恢复的方式来解决该问题。可用区A和可用区B在同一区域作为生产级平台,当用户访问的时候随机访问到A或B,A和B会同步做数据复制,保证数据的一致性。
通过异步复制的方式将数据备份到可用区B中的数据库,由于网络通信延迟,在正常情况下,备份数据库不提供外部数据服务,仅仅用作备份数据库。当可用区A中发生重大的短期不可恢复的故障时,用户在可用区B的实例随时可以进行容灾切换。切换完成后,用户可以通过修改应用程序中的数据库连接配置,将应用程序请求转移到可用区B实例,然后获得数据库的可用性。[11]
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。