VPS服务器部署Prometheus监控系统全流程教程
在VPS服务器上部署Prometheus监控系统,是实现服务器性能监控、故障预警的关键操作。无论是个人开发者还是企业运维团队,掌握这一技能都能显著提升系统稳定性。本文将从准备工作到最终验证,详细拆解每一步操作,帮你快速搭建属于自己的监控体系。

部署前的必要准备
在正式安装前,需确保VPS服务器满足基础条件:
- 系统要求:推荐使用Ubuntu 20.04+或CentOS 7+等主流Linux发行版;
- 权限要求:需拥有root权限或具备sudo权限的用户(后续命令需sudo执行);
- 网络要求:服务器需能正常访问互联网,以便下载Prometheus及Node Exporter安装包。
Prometheus核心组件安装
以Ubuntu系统为例,Prometheus的安装可分为下载、配置、服务化三个阶段:
1. 下载与解压
打开终端执行以下命令,下载Prometheus 2.37.0稳定版:
wget https://github.com/prometheus/prometheus/releases/download/v2.37.0/prometheus-2.37.0.linux-amd64.tar.gz
解压压缩包:
tar -xvf prometheus-2.37.0.linux-amd64.tar.gz
2. 文件迁移与权限配置
将解压后的目录移动至/opt路径:
sudo mv prometheus-2.37.0.linux-amd64 /opt/prometheus
为避免权限冲突,创建专用系统用户:
sudo groupadd --system prometheus
sudo useradd -s /sbin/nologin --system -g prometheus prometheus
调整文件归属权限:
sudo chown -R prometheus:prometheus /opt/prometheus
3. 服务化启动配置
创建systemd服务文件,实现开机自启:
sudo nano /etc/systemd/system/prometheus.service
在打开的文件中输入以下内容(注意路径与用户需匹配):
[Unit]
Description=Prometheus Monitoring System
Wants=network-online.target
After=network-online.target
[Service]
User=prometheus
Group=prometheus
Type=simple
ExecStart=/opt/prometheus/prometheus \
--config.file /opt/prometheus/prometheus.yml \
--storage.tsdb.path /opt/prometheus/data
[Install]
WantedBy=multi-user.target
保存后执行以下命令启动服务:
sudo systemctl daemon-reload
sudo systemctl start prometheus
sudo systemctl enable prometheus
Node Exporter指标采集配置
Node Exporter用于收集CPU、内存、磁盘等系统指标,安装步骤如下:
1. 下载与部署
下载Node Exporter 1.3.1版本:
wget https://github.com/prometheus/node_exporter/releases/download/v1.3.1/node_exporter-1.3.1.linux-amd64.tar.gz
解压并移动核心二进制文件:
tar -xvf node_exporter-1.3.1.linux-amd64.tar.gz
sudo mv node_exporter-1.3.1.linux-amd64/node_exporter /usr/local/bin/
2. 服务化配置
创建systemd服务文件:
sudo nano /etc/systemd/system/node_exporter.service
输入配置内容:
[Unit]
Description=Node Exporter Metrics Collector
Wants=network-online.target
After=network-online.target
[Service]
User=root
Group=root
Type=simple
ExecStart=/usr/local/bin/node_exporter
[Install]
WantedBy=multi-user.target
启动并启用服务:
sudo systemctl daemon-reload
sudo systemctl start node_exporter
sudo systemctl enable node_exporter
监控链路打通与验证
1. Prometheus配置关联
编辑Prometheus主配置文件`/opt/prometheus/prometheus.yml`,在`scrape_configs`部分添加Node Exporter监控目标:
scrape_configs:
- job_name: 'node_exporter'
static_configs:
- targets: ['localhost:9100'] # 本地Node Exporter默认端口
保存后重启Prometheus生效:
sudo systemctl restart prometheus
2. 安装结果验证
通过浏览器访问`http://<vps服务器公网ip>:9090`,若看到Prometheus控制台界面,说明核心服务启动成功;访问`http://<vps服务器公网ip>:9100/metrics`,若能看到以`node_`开头的指标数据,证明Node Exporter已正常采集系统信息。
常见问题与解决思路
- 下载速度慢:GitHub Releases偶尔会因网络问题导致下载延迟,可尝试使用`wget -t 3`命令重试,或通过镜像站(如Gitee镜像)获取安装包;
- 服务启动失败:优先检查systemd服务文件路径是否正确(如`ExecStart`中的二进制路径),其次通过`sudo systemctl status prometheus`查看错误日志,常见问题多为权限不足或配置文件语法错误;
- 指标采集不到:确认Node Exporter服务状态(`sudo systemctl status node_exporter`),并检查防火墙是否放行9100端口(可通过`ufw allow 9100`开放)。
通过以上步骤,你已在VPS服务器上搭建起基础的Prometheus监控体系。后续可根据需求添加更多监控目标(如数据库、中间件),或集成Grafana实现可视化展示,进一步提升运维效率。vps服务器公网ip>vps服务器公网ip>