What’s Changed
- feat(biz-group): 业务组名称设置成
分组名-名称
格式后业务组列表自动以分组形态展示 - refactor(quick-view): 快捷视图样式优化,修复规则名称或标签值过长会渲染错位问题
- refactor(quick-view): 图表面板标题栏新增图标可查看当前图表完整的 PromQL
- refactor(account): 更多联系方式处添加链接可跳转到联系方式配置页面
- refactor(event): 本地缓存查询的时间范围
- fix(explorer): 修复 ES 8.x 查询报 “unknown field [interval]” 问题
- fix(alert-subscribes): 修复告警级别显示错误问题
- fix(dashboard): 修复时序图开启 stack 后曲线颜色和 legend 颜色不对齐问题
- fix(event): 修复活跃告警事件无法被批量删除问题
- fix(cli): 升级程序查询不到数据源
- fix(alert-subscribes): 告警订阅数据源类型更新不生效 @shardingHe
- fix(target): 机器列表心跳时间颜色展示
- feat: 将前端 pub 文件编译到了二进制中,部署更简单了,感谢 @tanxiao1990
- feat(dashboard): 大盘 hexbin 图新增详情链接设置 @masterjyq
- refactor(edge): 增加了 n9e-edge 模块,可以在边缘机房部署,支持 数据转发 和 告警 的能力
- refactor(explorer): 当即时查询数据源为空时弹窗提示
- refactor(datasource): 数据源配置关联告警引擎自动设置默认值
- refactor(targets): 将心跳时间移动到状态列位置并且去除状态列,状态作为心跳时间背景颜色
- refactor(dashboard): guest 用户访问大盘隐藏所有编辑按钮
- refactor: 告警策略、监控大盘等表格显示修改人和时间
- fix(dashboard): 修复大盘表格图在暗黑主题下单元格颜色和背景色异常问题
- fix(dashboard): 修复大盘新增 hexbin 图异常问题
- fix: 使用标签筛选机器,填写多个标签时,筛选出错问题
- fix: 全局 webhook 备注更新不生效
- 等等
夜莺简介
- 夜莺重点解决的是告警管理,一套规则自动生效到多个集群,灵活的告警规则、屏蔽规则、订阅规则、权限控制,可以和 Prometheus、VictoriaMetrics 等无缝集成
- 正在尝试从监控系统往观测平台发展,引入了 metrics、logging、tracing 数据源管理,争取未来真正做到 all-in-one,做到良好的数据串联
- 夜莺项目共计 95 contributors,6000+ stargazers,100+ releases,github 地址:github.com/ccfos/nightingale
组件安装
夜莺安装依赖 mysql、redis,这两个组件都是开源软件,请大家自行安装,这里也提供一个小脚本来安装这 2 个组件,大家可以参考:
# install mysql yum -y install mariadb* systemctl enable mariadb systemctl restart mariadb mysql -e "SET PASSWORD FOR 'root'@'localhost' = PASSWORD('1234');" # install redis yum install -y redis systemctl enable redis systemctl restart redis
上例中 mysql 的 root 密码设置为了 1234,建议维持这个不变,后续就省去了修改配置文件的麻烦。
安装夜莺
mkdir -p /opt/n9e && cd /opt/n9e # 可以去 https://github.com/ccfos/nightingale/releases 找最新版本的包,文档里的包地址可能已经不是最新的了 tarball=n9e-v6.0.0-ga.6-linux-amd64.tar.gz urlpath=https://download.flashcat.cloud/${tarball} wget $urlpath || exit 1 tar zxvf ${tarball} mysql -uroot -p1234 < n9e.sql nohup ./n9e &> n9e.log & # check logs # check port
如果启动成功,n9e 默认会监听在 17000 端口。上面使用 nohup 简单演示,生产环境建议用 systemd 托管。nohup 和 systemd 的使用教程
配置文件 etc/config.toml
中含有 mysql 的连接地址配置,如果连接数据库报错,可以检查一下用户名和密码
夜莺服务端部署好之后,浏览器访问 17000 就可以体验相关功能了,默认用户是 root
,密码是 root.2020
,夜莺 v6 可以支持对接 Prometheus like、Elasticsearch、Jaeger 三种数据源,可以点击 系统信息 - 数据源 菜单,配置对应的数据源,即可在夜莺平台查看 metrics、logs、traces 的数据。
categraf 对接 v6
categraf 对接 v6 版本,建议升级到最新版本,并且将配置文件 config.toml 里的 heartbeat 开关打开
v5 升级 v6 步骤
第 0 步。操作之前,记得备份下数据库!
第 1 步。需要先将你正在使用的夜莺数据源表结构更新到和 v5.15.0 一致(当然,如果你现在已经是 v5.15.0,就可以跳过这里的第 1 步,进入第 2 步),release 页面有每个版本表结构的更新说明,可以根据你正在使用的版本,按照说明,逐个执行下更新表结构的语句
第 2 步。解压 n9e 安装包,导入 upgrade.sql 到 n9e_v5 数据库
mysql -h 127.0.0.1 -u root -p1234 < cli/upgrade/upgrade.sql
第 3 步。执行 n9e-cli 完成数据库表结构升级,webapi.conf 为 v5 版本 n9e-webapi 正在使用的配置文件
./n9e-cli --upgrade --config webapi.conf
第 4 步。修改 n9e 配置文件中的数据库为 n9e_v5,启动 n9e 进程
nohup ./n9e &> n9e.log &
第 5 步. n9e 监听的端口为 17000,需要将之前的 web 端口和数据上报的端口,都调整为 17000
还没有评论,来说两句吧...