IT 运维工作报告作为整个企业的IT“管家”,首先要了解管理的资产情况。比如:现在的IT规模是多少?网络链路的总长度是多少?网络设备和服务器的数量和类型是什么?都是什么牌子?还有每台服务器上运行的数据库,中间件的类型和数量等,这些情况要有条不紊的梳理,弄清楚“有什么”这个问题之后,还要做一个比较,目前的资产状况与往年相比有哪些变化?是增加还是减少?这些变化体现在哪里。
所以在IT运维-2/staff的总结中,难免缺少对业务系统保障的描述。首先也要勾勒出“业务”的大致形象:目前我们所有的业务系统是什么?核心业务是什么,在解决什么问题,在为用户提供什么服务?这些服务运行在哪些服务器上,它们的运行状态如何?这样,我们先把“业务系统”直观的介绍给大家。
1、企业究竟需要什么样的IT 运维?运维,更倾向于业务产品的支持,更倾向于背后的英雄,运维团队需要对业务的稳定性和成本负责!企业需要的IT 运维系统也需要从稳定性和成本的角度来建立。(1)稳定性:稳定性是服务获取不良甚至不可获取的指标。业内流行的稳定性公式是总在线服务时间/总服务时间,具体指标数据用几个9来表示。比如一般的云计算服务提供中,承诺的稳定性指标是三个9: 99.9%(即年宕机时间不超过8.75小时),而对于大型互联网公司的业务来说,运维的指标是99.99%(年宕机时间)。
监控系统。现在开源软件大大提高了企业的运维能力,比如zabbix、nagios等,已经被很多企业广泛使用。同时,随着人工智能的兴起,监控的智能化和精细化水平也在不断提高。比如传统的监控无非是发现异常后报警,但加入智能后,可以自动分析异常的根源在哪里,并以此为基础继续做自动恢复,避免人力成本。
2、(转ITOM领域的大部分从业者一直将ITOM(ITOperationManagement)翻译成IT 运维 管理,并相应地称为ITOperations IT 运维。近两年,越来越多的人开始使用“IT运营管理”和“IT运营”这样的表达方式,对应的英文也是一样的,但是在这里“运维”和“运营”的意思是一样的?两者有何异同?