UpPerformanceAnalyzer

Manual de uso del interfaz gráfica de acceso al UpPerformanceAnalyzer.

Introducción

El UpPerformanceAnalyzer obtiene mediciones no disponibles en otras herramientas de medición entre las cuáles se encuentran:
  • Limitación al aumento de throughput
  • Capacidad disponible por usuario, y throughput medio por usuario
  • Porcentaje de pérdida de paquetes
  • Round trip time de conexiones activas
  • Cantidad de conexiones activas por tipo de limitación
El UpPerformanceAnalyzer analiza el tráfico en línea , a partir del estudio de los encabezados de nivel 2, 3 y 4, y del timing de los paquetes que lo componen. El análisis contempla la performance extremo a extremo de cada flujo, es decir el camino completo.
El procesamiento se realiza a nivel paquete y a nivel flujo (cada conexión tiene 2 flujos), y luego se consolida la información en combinaciones estadísticas. Cada Combinación estadística agrupa la información del intercambio de tráfico entre grupos de redes, definidos en la configuración.

Las variables calculadas para cada combinación por el UpPerformanceAnalyzer son luego colectadas por el servidor estadístico via SNMP. Que luego las publica en forma gráfica a los usuarios autorizados.
A continuación se describen algunos de los gráficos y los conceptos involucrados en cada uno.

Gráficos: Volumen de Tráfico por Estado de Limitación

Estos gráficos muestran la evolución temporal del volumen de tráfico según su tipo de limitación.

Por default se muestra el volumen de tráfico de nivel 4 (TCP, UDP, ICMP). Más abajo se explica como habilitar la visualización del volumen de datos de nivel 3 (IP) y/o nivel 2 (Ethernet).

No se debe confundir volumen de tráfico (cantidad de bits transmitidos en cada intervalo de medición) con el bit rate ni el throughput de los flujos que lo componen, y que se incluye en otro gráfico explicado más abajo.

Referencias del gráfico:

El tráfico rojo (NL) es tráfico compuesto por flujos TCP limitado por la red. Es decir que si aumentara la capacidad del cuello de botella de la red que está atravesando, aumentaría el throughput de los flujos que lo componen.

El tráfico verde claro (FC) está compuesto por flujos TCP limitados por quienes reciben los datos, es decir por TCP FLOW CONTROL. Si la capacidad de la estación que recibe los datos, o si la aplicación que recibe los datos, leyeran más rápido, entonces aumentaría el throughput de esos flujos. A veces también ocurre cuando el que recibe tiene una versión vieja de TCP.

El tráfico verde oscuro (DG) está compuestos por flujos TCP limitados por quienes generan los datos. Es decir que hay pocos datos para enviar, o son generados a un ritmo menor a la capacidad disponible de red.
El tráfico está compuesto por flujos o transacciones UDP, y su throughput y volumen no dependen de la capacidad de la red

El tráfico púrpura está compuesto de mensajes ICMP.

El tráfico negro, se corresponde a flujos pertenecientes a este tráfico, pero que no se ven porque no están pasando por el UpPerformanceAnalyzer. Sino que se deduce su existencia y volumen a partir de los acknowledgments de los flujos en la dirección opuesta. El tráfico negro implica la presencia de ruteo asimétrico (diferencias entre el camino de ida y de vuelta).

Opciones de visualización:

Para visualizar el volumen total de tráfico de nivel 2 y/o de nivel 3, hay que marcar los check-box correspondientes:    .

El volumen total de nivel 2 /o nivel 3 será imperceptiblemente mayor o apreciablemente mayor al volumen total de nivel 4, dependiendo de si se trata de flujos con gran porcentaje de acknowledgments TCP puros, o si contienen gran porcentaje de datos. Como se vé en los siguientes ejemplos de tráfico entre un proveedor y un caché:



Para visualizar los porcentajes de cada tipo de tráfico, hay que marcar la casilla correspondiente:   


Cuando el porcentaje de tráfico limitado por la red varía apreciablemente con el horario como en este caso, está indicando para el horario crítico (anochecer en este caso) demasiada saturación en el cuello de botella común a la mayoría de los flujos que componen el gráfico.


Gráficos: Throughput y Capacidad Disponible por Usuario

Estos gráficos miden la evolución temporal de la capacidad disponible media por usuario.

Se mide a partir del throughput de los flujos TCP limitados por la red, es decir aquellos que conforman el tráfico de color rojo en los gráficos de bit rate por tipo de limitación.

Los flujos TCP limitados por red (NL), adaptan su bit rate a la capacidad disponible, y son estos los que interesa medir su throughput. En cambio aquellos flujos TCP limitados por la velocidad de generación (DG) o por control de flujo (FC), su bit rate puede ser muy bajo, y no brindan información sobre el servicio de la red.


El gráfico de ejemplo es relativo al mismo tráfico del ejemplo anterior de porcentajes de cada tipo de tráfico, y se observa como el throughput medio por usuario baja de aproximadamente 2.5Mbps a casi 1Mbps cuando el porcentaje de tráfico limitado por red aumenta del 40% al 80%.

El throughput calculado tiene en cuenta únicamente los datos recibidos efectivamente por el destinatario. Es decir que no contempla encabezados, retransmisiones, ni tampoco segmentos sin datos (acks).

Gráficos: Round Trip Times

Estos gráficos miden el round trip time entre el paso de un segmento de datos por el UpPerformanceAnalyzer, y el paso del ack correspondiente en la dirección opuesta.

Se miden 2 round trip times:
  • desde el UpPerformanceAnalyzer y un lado de la combinación,
  • y desde el UpPerformanceAnalyzer y el otro lado de la combinación.
El round trip time total será la suma de ambos round trip times.

Se grafica además el valor medio de:
  • los round trip time mínimos de cada conexión
  • los round trip time medios de cada conexión

Dado que TCP transmite los datos en ráfagas de paquetes, al llegar al cuello de botella del camino, la espera que experimentará el primer segmento de la ráfaga sera bastante mayor a la espera del último segmento de la ráfaga.

El valor mínimo puede a veces ser bastante mayor al correspondiente a un buffer vacío en el cuello de botella, ya que al ser compartido por muchas conexiones, es posible que el primer paquete de cada ráfaga nunca lo encuentre vacío.

Estos gráficos de round trip time ayudan a diagnosticar problemas de bufferbloating, causados por el algoritmo estándar de control de congestión de TCP combinado con buffers sobredimensionados en routers, o token buckets mal configurados en los policers con los que se limita al usuario final, etc.


Gráficos: Porcentaje de pérdidas de segmentos

Estos gráficos miden el porcentaje de segmentos TCP perdidos. Cabe recordar que las estadísticas son relativas al flujo de punta a punta, y por lo tanto las pérdidas pueden estar en cualquier parte del camino entre el sender y el receiver. Sin embargo se distinguen claramente los diferentes tipos de problema al observar las variaciones en el tiempo de las pérdidas. Cuando las pérdidas varían junto con la variación del porcentaje de tráfico limitado por la red (NL), entonces son pérdidas causadas por el cuello de botella.

Cuando son pérdidas altas y que no varían significativamente junto con el porcentaje de tráfico limitado por la red (NL), entonces se deben a algún problema de transmisión, como por ejemplo un transciever defectuoso, una fibra dañada, etc. En el siguiente gráfico se observa un ejemplo en el que las pérdidas se deben a un transciever defectuoso, y se mantienen constantes hasta la hora en que es revisado y reparado (14hs), momento en el que pegan un salto y luego se normalizan.

Las pérdidas pueden ser de segmentos que transportan datos en un flujo, o de acknowledgments el flujo opuesto. El UpPerformanceAnalyzer puede distinguir entre ambos tipos de pérdidas y contabilizarlas correctamente.

...Este manual se encuentra en construcción. En los próximos días se completará con los gráficos faltantes.