网络遥测NetworkTelemetry的技术架构和部署方案

龅牙兔谈科技 2024-05-13 02:48:44

在前文中,我们详细介绍了网络遥测(Network Telemetry)的诞生背景和优势。本文我们将继续深入探讨和学习网络遥测技术的架构及部署方案。

Network Telemetry与传统网络监控手段对比

Telemetry与常见网络监控技术在工作模式、采集精度等方面的区别如下表所示:

对比项

Telemetry

SNMP Get

SNMP Trap

CLI

SYSLOG

工作模式

推模式

拉模式

推模式

拉模式

推模式

精度

亚秒级

分钟级

秒级

分钟级

秒级

数据范围

所有数据

所有数据

仅有告警

所有数据

仅有事件

结构化

YANG 模型定义结构

MIB 定义结构

MIB 定义结构

非结构化

非结构化

网络负载

中等

响应时间

几乎实时

延迟较高

实时

取决于命令执行

实时

数据完整性

中等

取决于告警配置

取决于日志配置

可扩展性

中等

中等

中等

配置复杂性

中等

中等

简单

简单

应用场景

实时监控、性能优化

日常监控、数据报告

关键事件监控

手动排查和配置

故障排查和日志存档

部署方案部署示意图:

+-----------------------------------------------------+

| Collector |

+-----------------------------------------------------+

| - 从网络设备、服务器、虚拟机和容器中采集数据 |

| - 支持多种数据协议(NetFlow、sFlow、gRPC 等) |

| - 推送或定期拉取数据 |

| - 预处理数据并传输给分析器 |

+-----------------------------------------------------+

| Analyzer |

+-----------------------------------------------------+

| - 接收、过滤并解析来自采集器的数据 |

| - 实时分析和历史趋势分析 |

| - 机器学习、行为分析和异常检测 |

| - 生成告警、报告和可操作的洞察 |

| - 将策略或建议传输给控制器 |

+-----------------------------------------------------+

| Controller |

+-----------------------------------------------------+

| - 基于分析器的反馈调整网络配置 |

| - 与网络编排工具集成,执行策略调整 |

| - 负载均衡、流量优化和安全策略实施 |

| - 支持自动化和手动配置 |

+-----------------------------------------------------+

方案逻辑:

步骤

目的

建议

选择遥测工具或平台

选择支持数据收集和分析的遥测工具。

考虑工具的兼容性和扩展性,如选择 Prometheus、InfluxDB + Grafana或Cisco's DNA Center 等。

配置网络设备

在支持的网络设备上启用遥测功能。

提供详细的配置指南和命令示例。例:telemetry ietf subscription 1 encoding encode-kvgpb ... 确保采用加密协议。

设置数据接收和存储

配置服务器来接收、存储和处理遥测数据。

使用高可用性存储解决方案,考虑数据压缩和时间序列数据库优化。

构建监视仪表盘

使用数据可视化工具创建仪表盘。

提供自定义仪表盘选项,同时展示实时和历史数据。

设置告警和通知

根据业务需求配置告警和通知。

引入 AI 异常检测技术,支持多种通知渠道(邮件、短信、Webhooks)。

测试和调整

进行性能测试并根据结果调整系统。

执行性能基准测试,根据反馈持续优化系统配置。

集成和自动化

将遥测系统集成到其他 IT 管理系统,开发自动化响应策略。

确保遥测平台具备完善的 API 支持,开发自动化脚本如自动故障隔离等。

处理数据的规模和复杂性

使用大数据技术处理和分析遥测数据。

利用 Apache Spark 或 Flink 等工具处理大规模数据,为 IT 团队提供专业培训。

使能网络设备相关协议或功能

功能/协议

描述

配置命令示例

NetFlow

收集和分析网络流量数据

Cisco 设备配置:

ip flow-export version 9

ip flow-export destination <collector_IP> <port>

interface <interface_name>

ip flow ingress

sFlow

实时流量采样

Arista 设备配置:

sflow enable

sflow collector <collector_IP> port <port>

interface <interface_name>

sflow polling-interval 30

sflow sampling-rate 1000

IPFIX

IP 流量导出协议

Juniper 设备配置:

set forwarding-options sampling input rate 1000

set forwarding-options sampling family inet output

flow-server <collector_IP> port <port>

set forwarding-options sampling family inet output

format ipfix

SNMP

网络管理协议

Cisco 设备配置:

snmp-server community <community_name> ro

snmp-server location <location>

snmp-server contact <contact>

snmp-server enable traps

gRPC

远程过程调用协议

Cisco NX-OS gRPC Agent 配置:

feature grpc

grpc

port 50051

max-request-per-second 500

max-response-time 300

tls

no shutdown

Telemetry Streaming

高效数据流遥测

Cisco 设备配置:

telemetry

destination-group DG1

address-family ipv4 <collector_IP> port <port>

sensor-group SG1

path "show system resources"

subscription SUB1

sensor-group SG1

destination-group DG1

encoding gpb

sample-interval 30000

!!!【点赞】、【关注】不走丢^_^

!!!【点赞】、【关注】不走丢^_^



0 阅读:0

龅牙兔谈科技

简介:感谢大家的关注