470 likes | 783 Views
《计算机网络管理》 主讲教师:王继龙 清华大学信息网络工程研究中心 wjl@cernet.edu.cn. 第四章 网络测量和监控. 第一节 网络测量技术综述 第二节 网络测量技术专题 第三节 网络测量系统举例. 第一节 网络测量技术综述. 网络测量的概念和举例 测量内容 测量指标 测量方法 测量工具 测量系统. 什么是网络测量?. 获取网络信息(动态、静态)的手段、技术、行为. 为什么测量?. The blind Internet. “ The Internet will experience a Gigalapse this year”
E N D
《计算机网络管理》 主讲教师:王继龙 清华大学信息网络工程研究中心 wjl@cernet.edu.cn
第四章 网络测量和监控 • 第一节 网络测量技术综述 • 第二节 网络测量技术专题 • 第三节 网络测量系统举例 wjl@cernet.edu.cn
第一节 网络测量技术综述 • 网络测量的概念和举例 • 测量内容 • 测量指标 • 测量方法 • 测量工具 • 测量系统 wjl@cernet.edu.cn
什么是网络测量? 获取网络信息(动态、静态)的手段、技术、行为 wjl@cernet.edu.cn
The blind Internet “The Internet will experience a Gigalapse this year” -- Bob Metcalfe “Is the Internet about to crash?” -- The Site “The Internet hasn’t worked for the last week” -- An AOL user “We have no packet loss or delay” -- ISP engineer “We are not seeing any packet loss or delay” -- IXP Manager wjl@cernet.edu.cn
Why the Confusion? • 缺乏认知途径; • 用户期望过高(缺乏对真实现状的了解) • ISP过渡宣传 • 缺乏对不同用户需求的了解、分类和支持(different requirements for latency, loss, bandwidth, variance) • 技术问题 • 如何测量 • 测量什么 • 数据管理和分析 wjl@cernet.edu.cn
Users call help desk complaining of poor connectivity. Diagnosis? ? ? wjl@cernet.edu.cn
那一种测量? • End-user measurements (black box) • ISP measurements • Routine Measurements versus Problem Diagnostics • 网络层测量 versus 应用层测量 wjl@cernet.edu.cn
了解什么 • Monitor QoS(throughput, variance, and latency) • Validate level of service from your provider • Monitor service provided to your users on Intranet and to the Internet • Problem diagnosis • Measure availability, stability wjl@cernet.edu.cn
Problem Diagnosis • Routing problem? • Link failure? • Just heavy traffic • Is policy correct -- what should happen? • How to debug? wjl@cernet.edu.cn
TCP Problems • Many (most?) commercial TCP implementations are seriously flawed • S. Dawson, V. Paxson, IETF TCP Implementors BOF • draft-ietf-tcpimpl-prob-03.txt • Rentransmit, ignore slow start, etc wjl@cernet.edu.cn
Web Performance • Common (unsubstantiated claim) is overloaded servers • Measurements indicate problems with TCP/IP and HTTP • Man ignoring congestion control wjl@cernet.edu.cn
Packet Loss Common • Despite provider claims, significant packet loss common on Internet • As little as 1% loss significantly impact large flows • Most problems inter-provider (at exchange points) wjl@cernet.edu.cn
The IXPs are the Problems? • Yes and No • Big pipes and Small pipes • Head of the line blocking • Settlement issues • Convoluted Routing wjl@cernet.edu.cn
Routing Issues • Multihoming difficult and often counter-productive • Lack policy not do more than “hot-potato” routing • Routing Instability significant problem • loss of connectivity • packet loss • delay convergence • “route flap” storms wjl@cernet.edu.cn
Measurement During NSFNet wjl@cernet.edu.cn
Measurement Today… wjl@cernet.edu.cn
Short term effect of routing change 3 sites sites seen from an XIWT monitoring site for 3 days in November 1998 November 21 400 Response time in msec. 200 0 November 1998 wjl@cernet.edu.cn
Importance of Reducing ISPs/AS’s Crossed Note diagonal terms are good Off diagonal worse wjl@cernet.edu.cn
测量项目 • 静态配置信息:SNMP • 网络拓扑和路由 • 故障发现和定位 • 性能(效能):延迟、丢包、利用率 • 安全:弱点、热点、防御、追踪、取证、内容 • 使用:时间、带宽、字节、应用、服务 • 行为:时间规律、空间规律、内容规律、“品行”规律 wjl@cernet.edu.cn
参数系统 • 端到端的测量指标 • 延迟 、延迟抖动 、丢包 、吞吐率 、跳数 、传输病理 • 面向网络的测量指标 • 利用率 、局部性 、突发性 、有效负载 • 路由:路由病理、路由规模(路由直径、聚合度)、路由稳定性 • 面向数据流的指标 • 协议分布、尺寸分布、持续时间、 • 面向网元的指标 • CPU利用率、内存余量、吞吐量、丢包率、误码率 wjl@cernet.edu.cn
测量方法 • 主动式测量方法 • 利用网络对“探测包”的反映来测量 ping、Trace • 通过网络对“探测包”的服务情况来实现测量treno测量吞吐率 • 可能会产生“Heisenberg”效应,即由于“探测包”影响了网络的性能,从而影响了测量结果的客观性 • 被动式测量方法 :不可感知 wjl@cernet.edu.cn
测量方法 • Router-Based • 端口流量(端到端流量) • Router-Aided • 拓扑测量 • Stand alone • 时延(时钟同步)、拓扑(时延拓扑推测、丢包拓扑推测)、性能推测(已知拓扑)、带宽测量(线路带宽、可用带宽、瓶颈带宽)、网络距离、路由器参数推测(调度器类型和参数、瓶颈节点缓存大小和策略) wjl@cernet.edu.cn
一种观点 wjl@cernet.edu.cn
一些测量项目解释 wjl@cernet.edu.cn
测量的工具 • 硬件工具:网络测试仪,Mobile测试。 • 软件工具: • Ping • Trace • Path • Netflow/SNMP • TCPDump like • treno wjl@cernet.edu.cn
基本工具 • Ping • arp • Netstat • Trace • Nslookup and dig • Tcpdump • Tcpwrappers • Treno and ttcp • RMON、sniffer、tcpdump/ethereal • Scotty(http://wwwhome.cs.utwente.nl/~schoenw/scotty) • Netflow • Gnuplot • Tcl/tk(www.scriptics.com) • Rcs/cvs(http://www.fsf.org) • NetXRay wjl@cernet.edu.cn
Best Current Practices: PING • Biased by path from source • PINGs treated differently by routers • Some providers filter ICMP • Poor scalability MIDs Weather Report wjl@cernet.edu.cn
Best Current Practices: SNMP • Most devices have MIBs (routers, hubs, etc.) • Large number of commercial and public domain clients • Limitations • Only monitor devices in your domain • Micro-view, not holistic view of network • Limited to MIB variables • Scaling issues, Security wjl@cernet.edu.cn
SNMP Clients SunNet Manager MRTG wjl@cernet.edu.cn
Best Current Practices: RMON • Remote network monitoring • Sniff network traffic (or collect via hub/switch) • Statistics on packet counts and flows • RMON2 now supports higher-level protocols • OC3Mon (vBNS/NLANR) even supports OC3 speeds! • Limitations • Lacks scalability, remote domains, correlation wjl@cernet.edu.cn
Best Current Practices: NetFlow • Cisco NetFlow switching tracks “flow” statistics • IP src/dst traffic • Protocol counts • AS/AS Matrices CFlowd Output wjl@cernet.edu.cn
PathChar Sample Pathchar to www.mci.com (199.249.18.22) doing 256 probes at each of 64 to 4096 by 128 0 localhost | 15 Mb/s, 431 us (3.07 ms) 1 pinot (192.172.226.1) | ?? b/s, 191 us (3.11 ms) 2 cs-f-vbns.sdsc.edu (198.17.46.43) | ?? b/s, 25.2 ms (53.0 ms) 3 cs-atm0-0-2.dng.vbns.net (204.147.129.94) -> 204.147.130.254 (78) -> 204.147.130.101 (2) | 16 Mb/s, 11.5 ms (78.0 ms), +q 36.2 ms (72.7 KB) *2, 3% dropped wjl@cernet.edu.cn
仪表 • 协议测试仪 • 协议一致性测试以及协议性能测试 • IPv4协议簇、IPv6协议簇、路由协议(OSPFv2,OSPFv3,BGP4,BGP4+,ISIS,RIPv12,RIPng等)、MPLS(LDP,RSVP,CR-LDP) • 路由协议压力测试、路由协议抖动测试、LDP,RSVP,CR-LDP建立极限测试 • Agilent公司的RouterTester,BSTS,Adtach。 • RouterTester仪表可选10/100M以太网模块、1000M以太网模块、STM-1/4/16/64POS模块。主要测试路由协议一致性(当前实现IPv4路由协议一致性)、IPv4路由协议压力测试、IPv4路由协议抖动测试、MPLS协议一致性测试、MPLS协议压力测试 • BSTS和Adtach主要测试ATM协议一致性 wjl@cernet.edu.cn
性能测试仪 • 设备性能测试、网络性能测试 • Agilent公司的RouterTester,NetCom公司的SmartBit,和Sprint公司的IXIA • RouterTester仪表可选10/100M以太网模块、1000M以太网模块、STM-1/4/16/64POS模块。还可以配合协议压力测试作性能测试 • SmartBit可配置10/100M以太网接口、1000M以太网接口、STM-1/4/16/64POS接口或者以太网接口和ATM接口。拥有一定的协议仿真功能,也可以配合协议压力测试使用 • IXIA可配置10/100M以太网模块、1000M以太网模块、STM-1/4/16POS模块。可以用作常规性能测试。 wjl@cernet.edu.cn
协议分析仪 • 监听分析协议 • Agilent公司的Internet Adviser、WG公司的仪表和RED公司的仪表等 • 这些仪表共同的特点通常接口速率较低,不超多155。用作在低速端口例如10/100M以太网端口上分析协议。 wjl@cernet.edu.cn
特殊仪表 • 测试专门的协议或能力 • 例如呼叫发生器用作测试IPPhone网关能力 wjl@cernet.edu.cn
http://netman.cit.buffalo.edu/ • http://www.simple-times.org • http://www.nlanr.net • http://www.merit.edu • http://www.caida.org • http://www.ietf.org • http://rdweb.cns.vt.edu • http://www.networkviginia.net • http://internet2.edu • http://www.gnuplot.info wjl@cernet.edu.cn
测量系统 • 协作方式 • 被动式协作:自发行为,如ping • 主动式协作:自觉行为,如单程延迟测量、路由的对称性测试。 • 单点测量 :一个节点独立完成 • 多点协作测量 :多个节点协作完成 • 单方测量 :一个管理域完成 • 多方协作测量 :多个管理域协作完成 wjl@cernet.edu.cn
关键问题 • 基于精简功能模型的独立于互连节点的专用测量单元体系结构 • Passive device:OCMON、CERNET计费 • 跨越多个管理域的透明的分布式协同测量模型 • 面向精密测量的网络状态参数系统 wjl@cernet.edu.cn
Internet 思考题 • 线路吞吐量测试 最大可能入流量 wjl@cernet.edu.cn