最近项目上出现mysql的主机cpu和内存飙升,大于90%了,接近系统崩溃边界了。
如何持续监控mysql的性能,发现问题呢??
zabbix在mysql性能监控中可通过自定义脚本、内置模板、自动发现等功能,实现对关键性能指标、健康状态、慢查询等的实时监控与告警,以下是具体运用及实践方法:
一、核心监控指标及配置
zabbix可监控mysql的核心性能指标,覆盖连接状态、查询效率、资源占用、复制状态等,通过自定义脚本或内置模板实现数据采集。
1. 关键监控指标示例
- 连接与线程:
threads_connected
(当前连接数)、threads_running
(活跃线程数)、max_used_connections
(最大连接数); - 查询性能:
qps
(每秒查询数)、tps
(每秒事务数)、slow_queries
(慢查询数量)、com_select
(select查询次数)、com_insert
(insert查询次数); - 资源占用:
innodb_buffer_pool_read_requests
(innodb缓冲池读请求数)、innodb_buffer_pool_pages_dirty
(脏页数量)、bytes_sent
(发送字节数)、bytes_received
(接收字节数); - 复制状态(主从架构):
seconds_behind_master
(主从延迟)、slave_io_running
(io线程状态)、slave_sql_running
(sql线程状态)。
2. 配置方法
自定义脚本采集:通过shell脚本调用mysql命令(如
mysqladmin
、show global status
)获取指标,再通过zabbix agent的userparameter
传递给server。
示例脚本(chk_mysql.sh
):#!/bin/bash mysql_user="zabbix" mysql_pwd="your_password" mysql_host="localhost" mysql_port="3306" args=$1 case $args in uptime) result=$(mysqladmin -u$mysql_user -p$mysql_pwd -h$mysql_host -p$mysql_port status | cut -f2 -d":" | cut -f1 -d"t");; com_update) result=$(mysqladmin -u$mysql_user -p$mysql_pwd -h$mysql_host -p$mysql_port extended-status | grep -w "com_update" | cut -d"|" -f3);; slow_queries) result=$(mysqladmin -u$mysql_user -p$mysql_pwd -h$mysql_host -p$mysql_port status | cut -f5 -d":" | cut -f1 -d"o");; *) echo "usage: $0 (uptime|com_update|slow_queries)";; esac echo $result
配置
zabbix_agentd.conf
添加userparameter=mysql.status[*],/path/to/chk_mysql.sh $1
,重启agent后生效。内置模板使用:zabbix提供template db mysql by zabbix agent模板(需导入),支持自动发现mysql实例并监控基础指标(如cpu、内存、磁盘i/o、连接数),简化配置流程。
二、自动发现与多实例管理
对于一台服务器部署多个mysql实例(不同端口)的场景,zabbix可通过自动发现规则动态识别实例,并应用监控模板,避免手动配置每个实例。
1. 实践步骤
- 步骤1:创建自动发现脚本:通过脚本获取mysql实例端口(如
netstat
、ps
命令),输出为json格式供zabbix解析。
示例脚本(discovery_mysqlport.sh
):#!/bin/bash echo '{ "data": [ {"{#mysqlport}": "3306"}, {"{#mysqlport}": "3307"} ] }'
- 步骤2:配置自动发现规则:在zabbix web界面中,创建“自动发现”规则,键值使用上述脚本,定义监控项原型(如
mysql.status[{#mysqlport},com_select]
); - 步骤3:关联模板:将自动发现的实例关联到mysql监控模板,自动应用监控项。
三、告警与通知机制
zabbix可通过**触发器(trigger)设置阈值,当指标超过阈值时触发告警,通过动作(action)**发送通知(邮件、短信、钉钉等),确保问题及时响应。
1. 示例:慢查询告警
- 触发器配置:设置表达式
{mysql:mysql.status[slow_queries].last()} > 10
(慢查询数超过10条),级别为“警告”; - 动作配置:当触发器激活时,发送邮件通知管理员,包含实例ip、慢查询数、时间等信息。
四、可视化与仪表盘
zabbix的**仪表盘(dashboard)**功能可将监控数据可视化,直观展示mysql性能趋势(如qps变化、连接数波动、慢查询趋势),帮助管理员快速定位瓶颈。
1. 实践方法
- 在zabbix web界面中,创建自定义仪表盘,添加**图形(graph)**组件,选择mysql监控项(如
qps
、slow_queries
); - 支持趋势图(展示历史数据)、实时图(展示当前状态),可按时间范围(小时、天、周)筛选。
五、实际应用案例
zabbix在mysql监控中的实际运用场景包括:
- 电商秒杀场景:监控
threads_connected
(连接数)骤增,提前扩容数据库或优化连接池配置,避免活动期服务雪崩; - 金融交易系统:通过
slow_queries
监控高频交易sql,优化索引或sql语句,提升订单处理速度; - 日志分析平台:跟踪
bytes_received
(接收字节数)、bytes_sent
(发送字节数),动态调整存储引擎(如innodb)或索引,确保海量日志高效入库。
六、注意事项与最佳实践
- 权限管理:为zabbix创建专用mysql用户(如
zabbix@localhost
),仅授予必要权限(process
、replication client
、select on *.*
),避免安全风险; - 脚本安全:确保监控脚本的权限最小化(如
chmod +x chk_mysql.sh
),避免敏感信息泄露(如密码存储在.my.cnf
文件中,权限设置为600
); - 阈值调整:根据业务需求和历史数据调整触发器阈值(如慢查询阈值从10调整为5),避免误报或漏报;
- 日志排查:定期检查zabbix server和agent的日志(如
/var/log/zabbix/zabbix_server.log
),解决数据采集失败问题(如网络连通性、权限错误)。
总结
zabbix通过自定义脚本、内置模板、自动发现等功能,可全面监控mysql的性能指标与健康状态,结合告警通知和可视化仪表盘,帮助管理员实现数据库的实时监控、故障预警、性能优化。实际应用中需根据业务场景调整监控指标与阈值,确保监控的有效性和准确性。
到此这篇关于zabbix在mysql性能监控方面的运用及最佳实践记录的文章就介绍到这了,更多相关zabbix mysql性能监控内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论