Home

Awesome

运维工具

实现一些运维场景中用到的记录及提醒功能,目前包含以下功能

功能

Demo

告警管理

对接Promethues AlertManager WebHooks,平台控制哪些告警信息发送给哪些人。

示例参考

告警内容

[Prometheus AlertManager]


状态:firing  
名称:Node主机CPU利用率过高
告警实例:172.16.1.53:9100
Namespace:monitoring/k8s
告警级别:严重

描述信息:
172.16.1.53:9100: CPU利用率过高于75% (当前值: 92.73333333355065)

恢复内容

[Prometheus AlertManager]


状态:resolved
名称:Node主机CPU利用率过高
告警实例:172.16.1.53:9100
Namespace:monitoring/k8s
告警级别:严重

描述信息:
172.16.1.53:9100: CPU利用率过高于75% (当前值: 92.75000000023283)

报警截图示例

提醒管理

项目管理

事件管理

故障管理

部署文档

创建数据库

create database `codo_tools` default character set utf8mb4 collate utf8mb4_unicode_ci;

修改配置

初始化表结构

python3 db_sync.py
#也可以直接source doc/codo_tools.sql

Docker部署方式(建议)

本地部署方式

建议使用虚拟环境 具体参考Dockerfile 内的安装步骤

pip3 install --user --upgrade pip
pip3 install -U git+https://github.com/ss1917/ops_sdk.git
pip3 install -r /var/www/codo-tools/doc/requirements.txt

服务注册

由于我们每个模板都是单独部署的,微服务需要在API网关进行注册

示例

rewrite_conf = {
    [gw_domain_name] = {
        rewrite_urls = {
            {
                uri = "/tools",
                rewrite_upstream = "tools.opendevops.cn:8040"  #nginx配置的域名
            },
            {
                uri = "/mg",
                rewrite_upstream = "mg.opendevops.cn:8010"
            },
            {
                uri = "/accounts",
                rewrite_upstream = "mg.opendevops.cn:8010"
            },
        }
    }
}