客户是一家制药公司,使用的ERP由三个服务器组成,一个是应用程序,一个是数据库,另一个是专门从事金融图像扫描服务。因为作者的单位。采用财务共享中心模式,主要存储财务扫描上传的各种图片数据。自2015年系统启动以来,服务器中存在大量数据。问题描述,有一天,系统突然无法访问。经调查,系统瘫痪是由服务器硬盘损坏引起的。服务器最初是由四个硬盘构建的RAID5模式。其中一个之前已经损坏了,但经理并不在乎。后来又损坏了一个,直接导致系统瘫痪。由于服务器由单位业务部门自行管理,仅限于专业性和系统管理员离职更换等原因,导致管理疏忽,数据未备份,单位业务被迫停顿。鉴于系统数据的重要性,单位最终不得不花费大量资金帮助外部专业公司恢复数据。幸运的是,恢复成功使系统重新启用,然后业务恢复运行。
反思检查和处理过程。
为什么这么被动?从上述教训中吸取教训后,我们安全公司还对单位内部进行了一系列的安全检查和梳理,发现了许多类似的问题和风险点,主要包括以下内容。有两个服务器携带重要的业务系统。虽然它们做了热准备或RAID5,但它们也损坏了单个硬盘。重复上述错误只有一步之遥。还有两个非常重要的服务器,它们运行着单位相对核心的印章、MES(生产执行系统)服务系统,这些服务非常重要。但服务器配备了简单的RAID1,由于数据量大,硬盘空间资源紧张。如此重要的系统只有RAID1,在安全性方面难以满足要求。此外,最核心、最重要的ERP数据库服务器实际上只运行单盘RAID0模式,没有保护措施。
基于上述情况,由于这些服务器运行5年或更长时间,存在硬件老化风险,系统停机的可能性很大,缺乏安全保护的数据库服务器。急需更新和改进。为此,作者制定了全面的整改计划,具体内容如下。将上述重要和核心服务器(ERP数据库、印章和MES)升级为RAID5+热准备,扩大空间,提高安全性;部分过热准备和单个硬盘损坏服务器,及时更换故障硬盘,恢复热准备功能。在处理过程中,作者遇到了几个问题:一是ERP数据库服务器,由于与其他业务系统的接口开发,如果RIAD方案升级,需要重新安装系统,现在ERP服务提供商不熟悉原始开发,不能保证新系统中开发的所有接口;第二,由于服务器使用时间长,业务数据大,虽然业务部门反复备份,确保安全,技术部门重新安装。
为此,单位多次与技术工程师进行讨论。后来,我们抱着试一试的心态,采用非主流方法和镜像GHOST进行全面备份和恢复,顺利完成了过渡和迁移。笔者找到了一台过渡服务器。WINPE首先通过GHOST在原服务器上进行全面备份,然后在新服务器上采用全面恢复的方式恢复系统,将系统原封不动地恢复到过渡服务器中,然后用同样的方法将系统恢复到升级后的正式服务器中。这样,系统就不需要重新安装,服务器中的各种系统和数据都保留了,从而实现了最稳定的过渡。
还没有评论,来说两句吧...