从招聘角度看运维的一些工作职能

发布时间 2024-01-08 11:24:32作者: jinzi

 

   系统运维是什么? 简单来说运维(Operation and maintenance)是指对公司硬件和软件的维护。但是运维内容实际又分技术层面的也有管理层面的,技术层面又分硬件、软件,所以它是一个体系 。管理层面来说一般包括作业流程管理(sop)、应急事件处理流程管理(eop)、问题和故障管理、变更管理、发布管理、基础设施标准作业流程管理(mop)、知识管理、综合分析管理等诸多内容。具体技术层面包括如: openstack,k8s,mysql,oracle具体技术的内容的实施、维护与管理以及硬件如自建机房设备如交换机、ap、路由器、服务器、ups管理等,甚至包括网络布线、安防等一系列问题。 我们这里所说的还是信息技术相关的系统运维,区别于像电站、电气行业、水电等行业的维护。很多人实际误解了运维的概念,甚至可笑的认为就是修电脑、配置下路由器等简单工作。


下面我们从招聘的角度看一些职位的描述和要求

一.系统运维工程师(system)

Responsibilities of operation and maintenance engineer

岗位职责:
1、参与公司云计算平台产品的系统研究;
2、负责云平台部署开发及单元测试工作;
3、主要包括各种云平台服务,如云主机、负载均衡、自动部署、存储、网络等功能的开发;
4、负责基于docker,k8s,OpenStack的云平台部署、运维工作;
5、 解决部署、运维过程遇到的技术问题;
6、 负责云平台的架构优化和性能优化
7、 参与docker,k8s,OpenStack运维系统的研究工作。
 
任职要求:
1、熟悉CentOS/ Ubuntu等linux系统的安装、使用、调优等;
2、熟悉Bash、Python等脚本编程语言;
3、熟悉KVM、Xen等虚拟机技术,有5年以上部署和运维经验;
4、熟悉docker,k8s,OpenStack安装和配置,有1年以上部署和运维经验;
5、有参与docker,k8s,OpenStack云计算的项目开发及运维经验优先。
6、良好的沟通能力和团队合作能力;
7、良好的学习能力,优秀的文档编写能力;
这种就是偏保障网络环境的正常运行、相关专业技术的维护等。需具备一定的网络基础如交换机、路由、域名、脚本开发、tcp/ip协议的理解以及对专业技术内容的掌握能力。

二、sre运维工程师(网站稳定性工程师)
 岗位职责:
1、负责公司线上系统运维,提升业务稳定性,制定和优化运维解决方案,包含容灾/弹性扩容等;
2、配合各研发方向合作,提供高效的监控、故障快速处理的手段和能力,提升运维工作效率;
3、参与业务系统容量测算和规划设计,优化资源运维成本;
4、审查架构合理性,梳理、识别应用架构风险,解决或推动业务研发解决架构风险;
5、完善相关应用的监控告警、降级与预案建设,组织故障演练、应急止损、事故复盘等稳定性工作;
6、参与设计、开发稳定性相关工具与产品,包括稳定性架构治理、监控报警、预案与演练、定位与止损等相关方向工具平台;
职位要求
1、5年及以上工作经验,本科及以上学历,计算机、通信等相关专业;
2、有较丰富的应急处置、应用稳定性建设经验,有大型网站或者B端产品应用运维经验加分;
3、具有一定的Kubernetes实际使用经验,有社区贡献者优先;
4、熟悉互联网技术架构和相关开源产品,对网络通讯协议、应用服务器、负载均衡、微服务架构有较深入的理解;
5、熟悉应用高可用架构,对架构治理、稳定性架构有较深入理解;
6、熟练掌握Shell或Python开发,有Golang或Java开发经验优先;
7、优秀的逻辑思维能力及沟通能力,高效的执行力,责任心强。

sre主要是为 IT 运营开发软件系统和自动化解决方案。SRE 做的是传统上由 IT 运营完成的工作,所不同的是,
sre 有软件专业知识,他们会利用这些知识来解决复杂的 IT 运营问题。
因此,网站可靠性工程可以被认为是一套实践,将软件工程的各个方面纳入 IT 运营,
从而提高软件系统(IT 运营的运营对象)的效率和可靠性,改善工作流程。
devops于sre密切相关,可以被看做sre的核心原则。所以sre的核心是实现自动化。


三、DBA(数据库管理员)
任职资格:
1.计算机相关专业专科以上学历,3年以上Oracle/SQL Server DBA工作经验;
2.熟练使用高可用、读写分离、负载均衡等解决方案;
3.精通Sql Server/Oracle数据库体系架构设计;
4.了解Sql Server/Oracle存储引擎及事务处理机制熟悉Sql Server/Oracle的体系架构,熟悉Sql Server常用存储引擎功能特点和应用场景。
岗位职责:
1、具备数据库的基本概念、结构和原理,并能够进行数据库的创建、配置、备份和恢复。能够监控和调优数据库性能,确保数据库的稳定运行。
2、了解数据建模和数据库设计的基本原则,能够根据需求进行数据库的设计和规划。考虑数据结构、数据完整性、性能需求等因素,并决定如何划分和组织数据表、索引、视图等数据库对象。
3、具备数据库安全管理的知识和技能,包括用户授权管理、权限控制、数据加密、审计和漏洞扫描等方面。保护数据库免受未经授权的访问、数据泄露。
4、能够快速诊断和解决数据库故障,包括数据库崩溃、数据损坏、性能下降等问题。你需要熟悉数据库日志和备份恢复机制,并能够有效应对各种常见故障情况。
5、数据库技术在不断发展和演进,保持学习的态度,持续关注最新的数据库技术和最佳实践,不断更新自己的知识和技能。

DBA的职责广泛且复杂,包括以下方面:
数据库设计:DBA负责根据业务需求设计数据库结构,以确保数据的准确性和完整性。
数据安全:DBA需要制定和实施安全策略,以保护数据库和数据免受未经授权的访问和更改。
性能优化:DBA需要监控数据库性能,并根据需要进行调整和优化,以确保数据的快速访问和处理。
备份与恢复:DBA需要制定并执行备份和恢复计划,以防止数据丢失,并确保在发生硬件故障或灾难时能够迅速恢复数据。
故障排除:当数据库出现故障时,DBA需要迅速排除故障,以最大限度地减少对业务的影响。
数据库监控:DBA需要实时监控数据库性能,以便及时发现并解决问题。

 
四、网络运维工程师(Network operation and maintenance Engineer)

1、熟悉电脑维修、系统安装维护、熟悉监控系统产品,网络布线施工安装调试。
2、负责单位网点监控安防、网络设备安装调试及售后运维;
3、配合系统工程师完成项目后期的实施工作。
任职资格:
1、从事过弱电智能化相关工作,对智能化、安防设备、技术了解;在工程项目有一定的经验;
2、有一定IT基础设施系统运行维护经验和项目经验优先
3、工作主动性强,性格开朗善于沟通、吃苦耐劳,具备良好的沟通能力,服从上级指挥,对待客户耐心细致,有责任心,具备团队合作精神。

有的单位在这个职位要求并不一样,要根据公司的业务性质决定。

五、运维经理
岗位职责

1. 负责数据中心基础设施运维管理工作(设施维护、保养、资产管理、故障演练,故障管理、供应商管理等); 

2. 负责数据中心运维服务团队的日常管理、培训及团队建设;

3. 负责数据中心运维标准化体系的建设(包括SOP、EOP、MOP的制定和发布;相关数据、文件、表格的检查、整理和归档);

4. 负责内外部协调沟通;负责大客户售前支持;

5. 负责对系统资料进行整理归档;

6. 负责数据中心运营成本控制,能耗管理;

7. 负责客户售前支持,项目管理和交付管理;

8. 负责完成上级领导布置的其他工作。

上面只是很小的一部分,不同的行业也决定了运维内容的差异性,比如:云计算、IT行业、光伏、IDC、弱电、数据中心等,他们的运维经理职能也有诸多不同。
但是需具备更多的管理职能和要求。

 当然我们实际工作中会遇到很多可能归维运维内容相关的,比较琐碎也列下:
1、域名购买、变更、续费、备案等。
2、nginx证书的更换。
3、网站三级等保、二级等保等。
4、招标购买服务(包括制作标书、组织评标)。
5、运维相关人员的招聘需求制定。
6、自建机房包括自动温度监控系统配置、ups、交换机购买等硬件设备的选购、配置等。
7、cdn的服务选购、购买。
8、短信服务购买。
9、云服务提供商的选型与服务购买,财务对账等。
10、监控设备维护。
11、相关技术合同管理。
12、svn代码、vpn、运营等账号管理与维护。
13、资产清点、成本控制等。
14、安全审计与系统漏洞扫描。
15、与开发一块审议运维成本支付等。
16、sop、mop、eop等流程的制定。
17、云服务迁移(如果云计算厂商的底层服务的物理机过老,会出现不稳定,不定时宕机情况发生)。
18、知识库搭建和管理
19、办公网络环境的治理具体有分配ip、屏蔽游戏、娱乐访问等。