企业级PaaS解决方案

来自CloudWiki
124.128.158.173讨论2020年9月7日 (一) 07:43的版本
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

一、简介

蓝鲸智云:

蓝鲸智云,简称蓝鲸,是腾讯游戏技术运营部“腾讯智营”下的一个子品牌。 它是一套基于PaaS的技术解决方案,提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统( SaaS应用)。 它是腾讯游戏技术运营部沉淀多年的技术运营支撑体系,助力技术运营解决方案落地,承担着数百款业务线上运营的使命。

二、诞生背景

十年前,我们的业务运维忙于这些工作:服务器、网络、OS、DB、发布、变更、监控、故障处理、运营环境信息维护提取等等。

这些工作大多是被动的,或者说是"需求驱动型的",运维大多数时候在被动的为产品、策划、运营、开发等合作岗位的同学提供操作服务,而且很多是重复性的操作服务。运维人员总是处于救火员的状态,好评?没有。

八年前,我们的一个运维小组发起了转型尝试,目标是使我们的运维团队从“操作服务输出”,转型为“解决方案服务输出”。

六年前,也就是2012年,依据这个先行试点团队的效果评估,整个腾讯游戏的十余个运维团队(目前200+运维)走上了艰难的转型之路,作为落地承载方案的蓝鲸智云体系同时开始构建。


三、我们为什么要转型?

当年促使我们决心转型的原因,可以归结为以下三点:

1、业务红海化

激烈的行业竞争,使精细化运营变得越来越重要。

产品和运营人员忙于更贴近用户体验的业务设计和运营设计,开发团队忙于更快更可靠的交付和实现,运维团队则希望为用户提供更高的可用性,不论是刮风下雨,还是发布变更,都能将业务可用性保持在无限接近7*24。

在此之上,还需要能为产品策划运营等其它岗位提供各类运营工具以提高“产品运营”的效率,甚至能为运营决策提供准确的数据依据。

2、“传统运维”生存空间塌缩

几年前我们就预感到“传统运维”的职能空间会被逐步压缩。


一些新技术比如云计算等会对传统运维的工作造成一定冲击,而开发团队出于追求更高可用性等原因,在运维不给力的情况下会直接涉足精细化运营领域。


虽然我们认为运维始终是不可或缺的,但也不得不承认传统运维的需求量会有一定的减少,岗位的萎缩对所有从业者都不是好消息,出于自救我们必须尝试转型。


四、转型之后的目标

基础运维服务:

将基础运维服务(发布变更、监控处理、数值调整、数据提取等)尽可能做到运维无人值守,运维提供解决方案(工具);

提供运维解决方案:

负责随时调整解决方案,但不提供重复性的操作服务,由使用者自助或者外包团队操作;

提供增值服务:

运维分出一部分精力,尝试“用户体验优化”和“运营决策辅助”等运维增值服务。


​==五、运维人员需要做的事==


在蓝鲸智云平台上,运维人员需要做两件事,将原子自动化和将原子集成为工具,这是蓝鲸智云体系武装运维的切入点。

1、将原子自动化

运维通过命令可以做的步骤,在蓝鲸作业平台上封装个脚本,就变成了原子,而运维通过其他运营系统页面操作的步骤,由蓝鲸集成平台中的ESB平台与其对接好接口之后,也变成了可集成的自动化原子。

2、将原子集成为工具

运维/运营工具的开发对传统运维是有一定障碍的,蓝鲸通过四大方面的工作来解决这个问题。


集成平台

在“蓝鲸集成平台”(蓝鲸体系目前的九大平台之一)中构建了一个PaaS模块,业务运维(DevOps)无需关注找服务器、部署环境(各种包、Mysql、Nginx等)等步骤,只需要写好工具本身的逻辑代码上装到PaaS容器就行了,同时还免除了工具的运维成本(高可用、故障修复等)。基于Docker技术,工具的部署也是一键式的。


六、六大平台简介

1、集成平台

包含PaaS、ESB、开发框架、Web样例等模块,是运维制作工具APP的平台。

2、移动平台

蓝鲸体系的移动端操作入口。

3、作业平台

各种大小文件传输,含参脚本执行类的动作,可以在蓝鲸作业平台封装,通过接口操控。

4、配置平台

从业务的各层分级结构到子节点的各类属性,都可以直观的存储于蓝鲸配置平台,通过接口存取。

5、管控平台

一套基于海量标准设计的管控系统,为作业平台提供文件管道和任务管道,为数据平台提供数据管道等,整个蓝鲸体系对OS及容器单元、大数据的所有管控,只依赖管控平台的一个智能Agent。

6、数据平台

基于Kafka、Storm构建的供应用运维使用的实时计算平台,为上层蓝鲸集成平台上的智能决策类工具族、数据视图类工具族、辅助决策类工具族提供大数据处理及实时计算能力。

Storm之类的技术早已不新鲜,但供运维"使用"的比较少见。上述平台大多是由运维"维护"的,为了适应运维的技能树,蓝鲸数据平台包括如下特性:

提供了在线IDE,运维可以用相对熟悉的YAML语言描述运算逻辑,而不需要学习Java;


通过各种渠道对接了大量常用的运营环境数据(客户端数据、服务端数据、网络数据、自定义数据源、在线、登陆、发布变更、营销活动、故障等运营事件);


提供了数据字典供运维针对个性化的业务选用实时数据组合来做“运维自动决策”或者“辅助运营决策”。