什么是运维?运维主要做哪些工作?_运维是做什么的_牛奶咖啡13的博客-程序员秘密

技术标签: 运维工程师  什么是运维  运维的工作内容  运维/测试  

  今天先探讨下运维主要做什么,至于需要的具体技能、需要会的(MySQL? Apache? python?)首先还是要重申一下,我们这里的运维不是指工厂设备维护,也不是办公IT支持,我们这里讨论的运维工作只限于大型业务系统的运维,比如阿里、美团、京东做运维的攻城狮们,需要过硬的技术、敏捷的头脑、还有,还有就是强悍的体魄。

一、什么是运维

  运维顾名思义就是运行维护,运维工程师就是要做好生产系统的稳定运行维护工作。是不是很好理解?但是光这一句稳定运行,需要运维工程师们具备各方面的能力,以至于一人无法完成全部维护工作,从而形成了各类运维工程师的分工协作,比如应用运维、系统运维、网络运维等。最近很火的devpos概念,可能有人已经有所了解了,现在说的devpos工程师就是开发与运维的结合,提出运维需要开发技能。个人认为有些扯淡,运维本来就要会些开发技能的,但是运维和开发还是有本质区别的,其思考方式就不一样,开发人员考虑的是系统实现功能马上投产,运维工程师关心的是系统好不好用,是不是具备高性能,高可用?怎样去保证每天长治久安的安全稳定运行?所以个人以为运维就是运维,运维本身也需要开发技能,但是从总体上说还是运维工程师,我们会的比开发工程师还要多,开发只是我们工作的很小一部分。

二、运维工程师主要做哪些工作

  既然工作目标是保证系统的安全稳定运行,那么我们的工作就是围绕着这个目标转。我们需要:

2.1、构建系统监控体系

  没有监控就等于是瞎子,系统出了问题都不知道,要是哪天支付宝不能支付了,支付宝的运维工程师肯定是第一时间知道的,总不见得等用户投诉,媒体报导了自己才知道吧?关于监控体系我之前已经说过了。

2.2、应急处理

  系统出故障了怎么办?着急的看着束手无策肯定不行,这时一个优秀的运维工程师的价值就体现出来了,一个有经验的运维工程师能第一时间确定故障原因,并迅速恢复业务,保证对外影响时间最小。当然,这里故障是多方面的,有应用故障,数据库故障,甚至是网络线路故障。

2.3、 技术问题分析

  出了问题就需要分析,这里需要具备一些必备能力,比如网络抓包分析、tcpdump抓包及分析、代理的机制等。

2.4、业务问题处理

  就是在业务层面进行统计分析,比如统计系统的每日交易量,成功率,错误码的分布情况,这对这些错误码分析原因,找出集中在哪个环节,集中在哪家商户,找到他,然后冲过去帮商户解决问题。

2.5、版本测试

  开发发布版本后运维工程师需要进行相应的性能和高可用测试,不具备高可用的系统建议还是不要上线了,否则后果不堪设想。

2.6、版本上线

  这个就需要体能储备了,在晚间业务量小的时候悄悄的进行,要让用户无感知,熬个夜完成系统的升级改造,第二天给广大用户一个惊喜,有没有发现有时候一夜之间支付宝,京东啥的换了个页面,出了啥新功能啥的?

2.7、系统演练

  养兵千日用兵一时,平时不努力,故障时吃苦头。所以平时自己要安排些实际故障的演练,验证下系统的强制性,再考验下一线工程师的应变能力。

2.8、工具开发

  运维没有工具怎么行?包括监控工具、交易成功率统计分析工具、变更自动化工具等等。

2.9、业务分析

这个你需要具备一项新技能:“统计分析”。各种统计分析工具,数学建模是必须要掌握的内容。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/xiaochenXIHUA/article/details/118524169

智能推荐

nodemon : 无法加载文件 因为在此系统上禁止运行脚本。_昊哥的HelloWorld的博客-程序员秘密

nodemon运行 提示错误:无法加载文件 C:\Users…\AppData\Roaming\npm\nodemon.ps1,因为在此系统上禁止运行脚本。这是你机子禁止运行脚本,解决办法1.管理员身份打开powerShell2.输入set-ExecutionPolicy RemoteSigned如果未成功,提示如下内容……内容省略……要更改当前用户的执行策略,请运行 "Set-Exe...

ubuntu 网卡驱动安装_insmod 安装网卡 ubuntu_深圳阿莫的博客-程序员秘密

1, 解压 alx2, 安装src目录下:sudo make install 3, 安装完毕后执行sudo insmod alx.ko 如果重启后不出现网卡的上下箭头 就到src目录下运行一下sudo insmod alx.ko即可

中断屏蔽mask interrupt_clam_zxf的博客-程序员秘密

不得不说,随着技术的积累和发展,适应当今的社会,就连看似很基础,很简单的中断,也开始变幻莫测了。如果以前只懂得正常normal的中断注册、中断响应、中断优先级。还是不太能完全推理出程序中中断上下文的执行流。而对于程序员而言,程序的执行流就是他的生命轨迹,没有清晰的程序执行流基础,其他的功能实现都无从说起。文章转载自:https://blog.csdn.net/dongyanxia100...

Ipython Kernels_ainuanwei5320的博客-程序员秘密

1. Ipython 安装 :http://ipython.readthedocs.io/en/stable/install/install.htmlpip install ipython2. Ipython 安装 KernelKernels for Python2 And Python3安装Python2 的Kernelpython2 -m pip ...

.NET 的JIT编译方式_.net jit编译_ssyyll的博客-程序员秘密

CLR只执行本机的机器代码。有两种方式产生本机的机器代码:实时编译(JIT)和预编译方式(产生native image)。CLR使用类型的方法表来路由所有的方法调用。类型的方法表由多个入口项组成。每个入口项指向一个唯一的存根例程(stub routine)。初始化时,每个存根例程包含一个对于CLR的JIT编译器的调用(它由内部的PreStubWorker程序公开)。在JIT编译器生成本机代

如何使用awr_set_report_thresholds控制AWR报告里的sql语句数量_cuiqiong6888的博客-程序员秘密

AWR报告里和sql语句有关的section有SQL ordered by Elapsed Time、SQL ordered by CPU Time、SQL ordered by User I/O Wait Time、SQL o...

随便推点

修改密码_我是谁不重要。的博客-程序员秘密

1.jsp<%@ taglib prefix="form" uri="http://www.springframework.org/tags/form" %><%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8" %><%@...

虚拟机安装Ubuntu16并安装Ros(Kinetic)_命令行安装ros 虚拟机16_Studying_swz的博客-程序员秘密

文章目录1.虚拟机安装镜像教程2.ROS各个版本3.ROS简单介绍4.安装ROS环境——Kinetic1)先选择下载服务器位置2)设置sources.list3)设置key(公钥已更新)4)更新package5)安装ROS kinetic完整版6)初始化rosdep(问题最大处!!!)第一步第二步a.直接建在了/etc/ros/建了相应的目录。b.修改20-default.list脚本文件,需要超级权限。c.继续修改7)配置ROS环境8)安装依赖项9)测试ROS是否安装成功虚拟机、ubuntu16.0

Vue的简单绑定、以及渲染_寥若晨星.的博客-程序员秘密

1.所有的内容要需要一个根节点包起来<template> <div> </div></template>2.data中定义数据(变量)<template> <div>{{name}}--{{age}}</div></template><script>export ...

原北京计算机学院并入那个学校了,北京高校合并历史,仅存一所本科“联合大学”的诞生..._GreedyAbyss的博客-程序员秘密

原标题:北京高校合并历史,仅存一所本科“联合大学”的诞生提起“联合大学”,大家的第一反应是高校重组和赫赫有名的西南联合大学。除西南联大外,国内还有这么6所大学曾使用过“联合大学”之名,而如今以“联合大学”命名的只剩北京一所。北京联合大学1985年开始组建,名字的由来是因为期初由十五所分院联合组建而成。今天小编为您梳理20世纪90年代以来,特别是在2000年前后北京市高校在高校重组、合并浪潮中的变化...

.Net 5.0 API命名空间功能说明_斯内科的博客-程序员秘密

微软于2020年11月发布了.net 5.0【.net core 的升级】。参考文档:https://docs.microsoft.com/zh-cn/dotnet/api/?view=net-5.0现在我们浏览下各个.net 5.0 托管API【命名空间,如 System】的主要说明:.NET API 参考version 5.0名称 说明 AccessibilityNamespace Represents a managed wrapper for the Comp..

zookeeper没有ls2命令问题_kuifanshu3027的博客-程序员秘密

在老版本的zookeeper中可以在客户端输入 ls2 命令查看某个路径下目录列表并输出路径的节点状态属性,比如在网上找的一个例子:![ls2命令](https://img-blog.csdnimg.cn/20200531110619235.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2t1aWZhbnNodTMwMjc=,size_16,col

推荐文章

热门文章

相关标签