在前文中,我们详细介绍了网络遥测(Network Telemetry)的诞生背景和优势。本文我们将继续深入探讨和学习网络遥测技术的架构及部署方案。
Network Telemetry与传统网络监控手段对比Telemetry与常见网络监控技术在工作模式、采集精度等方面的区别如下表所示:
对比项
Telemetry
SNMP Get
SNMP Trap
CLI
SYSLOG
工作模式
推模式
拉模式
推模式
拉模式
推模式
精度
亚秒级
分钟级
秒级
分钟级
秒级
数据范围
所有数据
所有数据
仅有告警
所有数据
仅有事件
结构化
YANG 模型定义结构
MIB 定义结构
MIB 定义结构
非结构化
非结构化
网络负载
低
中等
低
高
低
响应时间
几乎实时
延迟较高
实时
取决于命令执行
实时
数据完整性
高
中等
取决于告警配置
高
取决于日志配置
可扩展性
高
中等
中等
低
中等
配置复杂性
中等
中等
简单
高
简单
应用场景
实时监控、性能优化
日常监控、数据报告
关键事件监控
手动排查和配置
故障排查和日志存档
部署方案部署示意图:+-----------------------------------------------------+
| Collector |
+-----------------------------------------------------+
| - 从网络设备、服务器、虚拟机和容器中采集数据 |
| - 支持多种数据协议(NetFlow、sFlow、gRPC 等) |
| - 推送或定期拉取数据 |
| - 预处理数据并传输给分析器 |
+-----------------------------------------------------+
| Analyzer |
+-----------------------------------------------------+
| - 接收、过滤并解析来自采集器的数据 |
| - 实时分析和历史趋势分析 |
| - 机器学习、行为分析和异常检测 |
| - 生成告警、报告和可操作的洞察 |
| - 将策略或建议传输给控制器 |
+-----------------------------------------------------+
| Controller |
+-----------------------------------------------------+
| - 基于分析器的反馈调整网络配置 |
| - 与网络编排工具集成,执行策略调整 |
| - 负载均衡、流量优化和安全策略实施 |
| - 支持自动化和手动配置 |
+-----------------------------------------------------+
方案逻辑:步骤
目的
建议
选择遥测工具或平台
选择支持数据收集和分析的遥测工具。
考虑工具的兼容性和扩展性,如选择 Prometheus、InfluxDB + Grafana或Cisco's DNA Center 等。
配置网络设备
在支持的网络设备上启用遥测功能。
提供详细的配置指南和命令示例。例:telemetry ietf subscription 1 encoding encode-kvgpb ... 确保采用加密协议。
设置数据接收和存储
配置服务器来接收、存储和处理遥测数据。
使用高可用性存储解决方案,考虑数据压缩和时间序列数据库优化。
构建监视仪表盘
使用数据可视化工具创建仪表盘。
提供自定义仪表盘选项,同时展示实时和历史数据。
设置告警和通知
根据业务需求配置告警和通知。
引入 AI 异常检测技术,支持多种通知渠道(邮件、短信、Webhooks)。
测试和调整
进行性能测试并根据结果调整系统。
执行性能基准测试,根据反馈持续优化系统配置。
集成和自动化
将遥测系统集成到其他 IT 管理系统,开发自动化响应策略。
确保遥测平台具备完善的 API 支持,开发自动化脚本如自动故障隔离等。
处理数据的规模和复杂性
使用大数据技术处理和分析遥测数据。
利用 Apache Spark 或 Flink 等工具处理大规模数据,为 IT 团队提供专业培训。
使能网络设备相关协议或功能功能/协议
描述
配置命令示例
NetFlow
收集和分析网络流量数据
Cisco 设备配置:
ip flow-export version 9
ip flow-export destination <collector_IP> <port>
interface <interface_name>
ip flow ingress
sFlow
实时流量采样
Arista 设备配置:
sflow enable
sflow collector <collector_IP> port <port>
interface <interface_name>
sflow polling-interval 30
sflow sampling-rate 1000
IPFIX
IP 流量导出协议
Juniper 设备配置:
set forwarding-options sampling input rate 1000
set forwarding-options sampling family inet output
flow-server <collector_IP> port <port>
set forwarding-options sampling family inet output
format ipfix
SNMP
网络管理协议
Cisco 设备配置:
snmp-server community <community_name> ro
snmp-server location <location>
snmp-server contact <contact>
snmp-server enable traps
gRPC
远程过程调用协议
Cisco NX-OS gRPC Agent 配置:
feature grpc
grpc
port 50051
max-request-per-second 500
max-response-time 300
tls
no shutdown
Telemetry Streaming
高效数据流遥测
Cisco 设备配置:
telemetry
destination-group DG1
address-family ipv4 <collector_IP> port <port>
sensor-group SG1
path "show system resources"
subscription SUB1
sensor-group SG1
destination-group DG1
encoding gpb
sample-interval 30000
!!!【点赞】、【关注】不走丢^_^
!!!【点赞】、【关注】不走丢^_^