it运维技术服务的前提分为以下5点:
1、第一级称作野蛮生长的阶段。叫做先抗住再优化。所以我这里用了很多的反驳式的词语,大家可能会非常熟悉,就是性能是有瓶颈的,架构是一个巨石架构,成本都是靠堆砌,根本没有流程,组织结构是无序的,数据监控都是缺失的,甚至没有,安全防御是脆弱的,测试是一种黑盒,并且只是单单覆盖路径。
2、第二级,边重构边生活。至少把大家约束到相对可控局面,还有初步的能力管理,相应解决局部的性能问题,数据做追溯并且测试方法是逐步逐步的走向一个规范化。
3、第三级叫做快速沉淀的过程,是从被动到主动的过渡。架构相对来说是合理的,柔性的,分层的,多重性分布式,相应局部场景是能够做到自动化。工具是能够收敛一些流程,流程太多不是好事。
4、相信现在业界能做到三级的公司已经非常棒了,说到的四级顶多也就是BAT,叫做精进的稳定期,自动化程度非常高,对于数据管理运营能力是非常突出的,我们把它叫做半智能化,现在也是一线公司往全智能化过渡的一个过程。
5、第五级就是我们智能化技术服务,也是我们追求的最终目的地。所以大家可以对号入座看到大家自己所处的位置。
京东it运维技术服务场景化
运营部可能会有垂直的三个部门:安全、it运维和数据。所以它是一个比较综合化的技术it运维部门,其他公司可能也有这种称呼。
1、智能it运维。我们现在团队把很多的职能内聚并作相应的融合,包括整个大团队的质量,自动化的测试和it运维,所以把它称为技术服务体系。就是把研发后一层的所有东西包装成一个部门来支撑,所以也是一种组织结构的方式。
这里通常大家说的it运维简单挪列在第一个纬度,现在发展最快的就是根因分析、预测、精准化推送、场景化的故障自愈、无人职守。
2、用户体验是庞大的一个模块。因为现在互联网公司都是以用户为中心,以技术为驱动,所以用户的体验跟数据是深度钻研的,包括对于用户反馈的一些分类。
3、技术驱动业务。技术应该驱动业务发展,解决自己痛点的同时挖掘一些业务层面的排错。
4、其他技术服务,包括自动化测试,包括之前听过360Case++的平台,包括相应模块自动化已经把所有的case全部做好了。这些都是通过一些算法和一些大数据来决定它最终的控制策略是怎么样的,性能是一个大专题,风控也是一个大专题。
京东是怎样预测的?
下面以一个智能化it运维案例来说。
1、预测数据,我们经常会有各种的数据做预测,现在会对所有的核心数据做一些相应归类,所以会有定期的,基本上是拿15天的数据作相应的数据预处理。
2、预测模型。逐步的到达一个预测模型,这里有相应的周期性的加权的均值算法,然后对一些季节型的大促模型算法,因为大促可能就是十倍以上的增长,所以对于时间和周期或者特定的场景还会做细分。
3、比较器,相应的阈值,还有同比,环比,最终输出相应的告警。
同创双子it运维www.itgemini.net 。
专注数字化方案建设,推动智慧企业生态圈的升级发展