近年来,企业云对it复杂性产生巨大影响,越来越多的企业需要能够解决云复杂性上升或加速数字化转型的有效方案,而人工智能正在成为解决这些问题的不二之选。在全球智能运维浪潮下,不少公司都选择重写代码,颠覆自我,作为apm领导者的dynatrace也同样走上了云端转型的重构之路,如今又转变为“软件智能”公司,专为瞬息万变的云原生和混合环境打造可实现智能监控的解决方案。
云与ai的重构
数字化转型的时代,不少企业都实施了“云优先”战略。大规模创新应用的爆发式增长为监控和运维带来了新的挑战。比如,在传统架构中监控对象比较少,能达到千量级实例,而到了云时代,由于容器、微服务的发展,实例将达到数十万甚至百万量级,传统的监控工具扩展性差,无法满足需求。
dynatrace在2014年开始重建之路,2016年推出智能平台,2018年推出了面向企业云环境的人工智能全栈式监控运维平台。dynatrace完成了从最早的以apm为基础开展服务,到提供云基础设施监控、人工智能运维及数字化体验监控服务的拓展与升级。dynatrace在2018年重新定义,全面升级为“软件智能”公司。
dynatrace 全球销售总裁stephen pace
dynatrace 全球销售总裁stephen pace认为在当前数据爆炸的时代,ai在监控方案中应当发挥“决策引擎“的作用。现如今,应用交付方式以云为主,而大规模的数据之间形成错综复杂又相互依赖的关系,如果没有ai的帮助,很难实现对软件平台进行云环境中的管理。他分享到:“dynatrace 的整个产品线都以ai为核心,并且所有的产品功能紧密相关。然而与市场上其他公司所谈的ai的一个重要区别是,dynatrace始终以创新为原始动力,打造了能够判断因果关系的确定性ai。它可以在复杂的云环境下,对问题进行根因分析,并迅速定位问题,成为用户的决策引擎。”
dynatrace亚太地区副总裁maurizio garavello
dynatrace亚太地区副总裁maurizio garavello解释了重构软件的一个根本性原因,是因为技术生态的变化,传统软件交付走到了云端。就传统应用性能监控而言,it部门仅关注服务器的运行既可以保障运维,而今天的应用正处于混合的云环境中,用户体验与应用运行环境也同样重要,这正是dynatrace 以ai为核心的软件智能发挥功效的时候。就是因为生态和环境都变了,才需要采用新的技术去面对新的问题。
dynatrace全球技术副总裁chuck miller
dynatrace的智能监控方案引进了集群概念,多台服务器协同运作,在逻辑上作为一个分析引擎来使用。“这样不管我们是在saas上面部署,还是本地化的部署,都可以通过这个集群做横向的扩展,来扩展我们的监控范围和能力。这样就能做到最大程度上,基本上支持所有用户。”dynatrace全球技术副总裁chuck miller说道。
而升级为智能平台的一个优势是打造闭环后的自增长逻辑,chuck miller以智能运维为例进行了说明,他认为自动化的运维只是把运维自动化,但aiops既能自动化运维,也有数据的基础。它会把dynatrace软件智能平台收集到的关联性数据提供给自动化运维工具,自动化运维工具根据数据做出反应操作之后,其结果又会回传到智能平台,形成闭环,不断优化学习。
自增长逻辑是包括saas厂商和所有打造ai能力的企业都在强调的,但是数据的沉淀需要时间,不可能一蹴而就。
需要一个oneagent?
据悉,升级后的dynatrace智能平台核心是oneagent——单一代理体系结构,可以自动进行规模部署,在没有人工干预的情况下捕获包括来自微服务和容器的高保真数据,实现基础架构可见,获取的数据和可见性为其定制化ai引擎davis提供支持,进行问题回溯的根因分析。
安吉星应用监控项目负责人茅烨隽
2009年成立的上海安吉星信息服务有限公司主要为上汽通用汽车提供停车安全和车载信息服务保障,作为与dynatrace的一路同行者,见证了dynatrace从第一代到现在的升级。安吉星应用监控项目负责人茅烨隽介绍,几年前安吉星的系统已经相对复杂而且黑盒状况较多,而当时正是dynatrace的监控方案给予安吉星非常大的帮助。经过几年的发展,安吉星的需求进一步提升,希望能够把零散的各个层面的应用整合起来,从原先应用监控层面提升到服务性能监控的层面。
茅烨隽坦言当一线发生问题的时候,想要在庞大繁复的系统架构中第一时间找到问题犹如大海捞针。升级后的dynatrace利用oneagent抓取环境中包括技术、应用、网络信息等所有客户真实数据,通过内在的拓扑多维度呈现,比如数据库、服务器、服务接口、应用等层面都可以通过相关拓扑呈现出来,再经过简单配置和归纳,就可以呈现出整体系统健康度,从大局上让一线人员了解整体的结构和互联。“只要一看就能了解整体的运维情况。”运维人员有了充足的响应时间发现并解决问题。同时,dynatrace具备problem展示模式,可以在第一时间发出警告并进行系统恢复,也能通过对发现的问题进行回溯分析找到根因,对安吉星以后的研发、测试都有极大的帮助。
此外,通过oneagent部署会大大节省时间。茅烨隽介绍,oneagent所有的部署时间可以“天”为单位来计算,效率相差数倍。在系统迭代频率极高的当下,部署效率尤为重要。
根据有关报告指出,2019年全球应用监控市场收入约41亿美元,年复合增长率(cagr)超过10%。巨大的市场空间下能够满足云端需求的智能化平台是大势所趋。ai的自增长逻辑需要打造一个数据反哺的闭环,dynatrace也正是基于此实现根因分析的智能监控解决方案。尽管越来越多的新监控方案厂商投入到这一领域,但仍需要更多对数据的积淀与探索。
在云、ai时代,传统的应用监控方案厂商也在进行重构升级,面对云、容器、微服务所带来的挑战,一个智能化的平台是企业所需,但是要整合庞杂的应用与服务除了自身的技术过硬,也需要构建合作伙伴生态,dynatrace在大中华市场目前也不断发展了众多的合作伙伴,建立起健康的生态系统。开拓“软件智能”的新时代,dynatrace已经在路上。