在云计算产品迭代的时候,提供给用户的操作界面是可以参考当前的主流思想进行对比和设计的,但是作为不暴露给用户的云管理端技术体系该如何构建,这是一个比较复杂的问题。
360安全云产品和技术团队结合公司私有云体系的相关经验,已经着手设计并形成了完整的云后端技术管理体系架构,在本文中将与大家分享。
在云计算技术体系架构中,后端技术管理提供IaaS、PaaS、SaaS三层资源的全生命周期管理工作,不但需要实现物理资源和虚拟资源的统一管 理,更为重要的是,还需要提供资源管理、统计、监控调度、服务监控等端到端的综合管控能力。在这种场景下,产品设计必然会和公司内部的传统运维模式产生差异。
修炼之一:数据集中化
为了避免出现传统系统各个层面数据各自为政的情况,云计算中需要将机房信息、网络信息、主机信息、虚拟资源信息、产品业务信息、功能逻辑信息等各种信息统一用一套信息管理系统进行整理,并提供标准的接口和权限识别能力,并允许其他系统间的相互调用。
修炼之二:资源池化
云计算体系下所有的原始资源,如机器、存储、网络等需要做到可标识、无状态,并将同类体系的资源全部通过资源池进行管控;对申请的新资源在资源池内进行合理的规划分配,保证资源的利用率;对释放的资源进行垃圾回收,并定期对资源池内资源分布进行定期的归并收敛操作。
修炼之三:自动化
在云计算层面的管理和运维,需要收集、索引和分析各个云资源的基础数据,并对系统进行容量、性能、稳定性等方面的预测。这些操作需要功能强大的数据收集、传输、处理、分析和展示工具,并能够在短时间内将系统的状态进行汇总和告警。
整个告警系统除了针对配置、性能和状态三个维度采集信息并分析告警外,云计算的运维自动化还包括持续不断的基于云基础设施开发和维护各种自动化运维 工具。比如配置管理工具用来设置参数或者开启一个新服务器上的服务;命令执行工具可以让管理员在紧急情况下不受各种体系的制约地对各类服务器执行操作;服 务器自动构建工具可以加速部署速度,并可以在短时间内大规模部署服务器,同时也可以让构建过程更容易复制,并且在发生严重故障时,还可以重建架构。
修炼之四:流程化
云计算下的管理和运维比传统方式要复杂许多,需要新的流程化技术方案以提高管理效率,降低系统资源投入。
360云在运维架构设计上除了引入了ITIL的技术框架外,还结合当前公司的运维体系,针对事故管理、问题管理、配置管理、变更管理、可用性管理、 能力管理、服务水平管理、例常报告、定期巡检、用户反馈等十几种管理需求设计了丰富且有效的技术方案,使整个流程能够快速有效地运转。
修炼之五:个性化
云计算的管理除了适配当前的技术方案外,还需要不断适应当前新技术和新用户的需求。为了能够快速适应变化,除了适配当前的主流运维体系,360还创 新地使用一些新技术、新理念,不断地孵化新的运维工具和运维方式。有些工具和技术方案已经开源,并在开源领域有了一定的影响力,它有效地降低了云计算的门 槛,正在帮助越来越多的小型开发团队涉足云计算领域。
例如我们开发了功能完善的后台管理门户系统,该系统不但支撑基础设施资源、平台资源和应用资源以服务的方式交互给用户,还提供基础设施资源、平台资 源和应用资源服务的定价、检索、资源使用情况统计等自服务功能,而且还可以根据不同的用户需要提供不同的展示,并有效隔离多用户的数据。
修炼之六:权限与用户管理
权限本身是为了提供数据存取方面的安全控制,这在云计算中尤为重要。我们在云管理系统中会提供身份访问管理能力,只有授权的用户才能访问相应的功能和数据,未授权的用户在使用之前必须对资源服务提出使用申请,经批准后才能正确使用。
除此之外,还收集、储存并实时更新的用户的信息,状态,等级等内容,并在此基础上完成工单、销售、客服等支持功能,后续还可以融入需求分析和智能推荐等高级功能。
修炼之七:产品与服务管理
云管理端还需要建设完善的产品与服务管理体系。产品与服务管理定义了云平台提供的基础设施资源的名称,定价以及前端的套餐等,除此之外,还需要定义 云服务的名称、基本信息、服务区域、配额和权限,并提供云服务信息的注册、配置、发布、注销、变更、查询等管理功能供用户使用。
服务质量管理则需要遵循SLA要求,主动按期审核和管理资源的实际使用情况,针对未达到预先约定的SLA要求,自动化地进行资源调配,并对产品功能进行迭代演进,以满足SLA的要求。
修炼之八:调度管理
调度管理是云计算中重要一环,服务调度是其中之一。360云服务调度系统基于各个云服务的特点,接受上层的请求,进行资源的调度、运行顺序逻辑的管理,并进行展示和存储。
资源调度是云计算调度体系里的另一环,通过查询基础资源和服务资源,判断当前资源状态,提供不同种类资源的合理分配算法,并配合调度系统来分配、部 署资源,实现实时响应服务请求,并根据需求实现云服务的自动化生成、分配、回收、迁移、数据收敛等工作,用以支持云计算的资源弹性特性。
修炼之九:安全运维管理
一个稳定的云平台,必须具备健康状态的自我感知能力。这部分360采用了内部一套自研的安全运维系统,负责对底层资源和对外提供服务的上层资源进行 分别的监控管理。对外提供服务的监控管理通过自定义插件形式实现,能够进行实时监控、捕获资源部署状态,获得使用和运行指标、各类告警信息并按自定义的逻 辑发送给对应的人或组。通过安全运维系统,可以实时保障云平台的高可用性,给用户提供不间断的云服务。
而资产统计巡检则按照资源的实际使用情况进行统计和分析,每天按照报表的形式通过云统计功能的维度进行资源的汇总和告警。
修炼之十:财务管理
如果提供一个成熟的公有云平台,那么一个完善的财务系统是必不可少的,其中重要部分是订单和计费系统。360会按照当前的业务模型和产品逻辑,记录 用户的购买历史,在计费方式上实现包年、包月、按量计费的收费模型。在业务逻辑上能够实现单产品代金券、多产品通用代金券等扩展功能;在用户逻辑上能够实 现获取用户等级并进行相应的扣费。
除了计费,还需要支持账单管理。需要系统能够针对用户的充值、发票,消费账单等进行记录,能够从多维度查找信息并支持后台的灵活操作,能够定期与公司的财务系统进行对账和结算。