High Performance FICON para z/OS

¿QUÉ ES ZHPF?

El zHPF es una funcionalidad que nos permite mejorar el rendimiento de nuestros canales FICON reduciendo entre un 10% y un 30% el uso de este tipo de canales. Activando el zHPF se mejora el número de I/O por segundo. Con el System z High performance FICON se eliminan los Command Control Word (CCW) por los Transport Control Word (TCW). Este cambio implica que en el mismo control block se procesen múltiples “information units” (IUs) reduciendo así el número de operaciones I/O.

Esta funcionalidad de los canales FICON mejora:

  • Capacidad adicional ante micro-cortes. Con zHPF se controla el estado de los I/O más eficientemente. Controla los estados de CU y Canal.
  • Uso de canal FICON reduciendo los tiempos de respuesta en picos de I/O
  • Accesos del tipo BSAM, QSAM y BPAM.
  • Mayor ratio Mb/segundo.
  • Mejora el uso del List Prefetch Optimizer del DB2 .

Existen numeroso documentos sobre zHPF generados por IBM y el SHARE donde podéis encontrar multitud de gráficos e información útil.

    ACTIVACIÓN DE ZHPF

Para la activación de esta nueva funcionalidad es necesario certificar que tanto los zEnterprise, las cabinas de discos y en el caso de que exista SAN los switch´s esten en el nivel apropiado de microcódigo. Después de certificar que tanto las cabinas de discos, la SAN y los zEnterprise se encuentran con el nivel de microcódigo necesario y aplicar mantenimiento a los sistemas z/OS (ver FIXCAT y PSP´s) se puede activar la funcionalidad de forma dinámica con el comando “SETIOS ZHPF=YES” o de forma estática en el miembro de PARMLIB IECIOSxx.

Para comprobar el impacto real se puede utilizar el monitor RMF. Con RMF spreadsheet reporter tenemos la posibilidad de extraer gráficas en los report predefinidos de DASD, IOQ y CHAN.

Se hace difícil comparar los datos ya que no todos los días existe la misma carga de acceso a disco. Normalmente se toma en cuenta la ventana BATCH que suele ser “más homogénea” en cuanto a acceso a disco.

Se debería tener en cuenta:

  •  Inventario de los recursos que disponemos.
  • Inventario de nuestras cargas de trabajo.
  • Recoger datos necesarios de SMF.
  • Separar de los datos recogidos información del HARDWARE (común para todas las LPAR´s) o SOFTWARE sólo para una LPAR. Este punto es importante porque no veremos las mejoras de esta funcionalidad hasta que todas las particiones se encuentren con ZHPF activo dentro de un mismo CEC.
  • Comprender la Jerarquía del Almacenamiento (Discos compartidos, Unidades de control físicas, Unidades de control lógicas, Volúmenes lógicos, Ficheros, etc).

Es necesario tener en cuenta que los informes de canal son comunes para todo el CPC. Los informes respecto a los discos y a IOQ son los únicos que podemos mirar a nivel de LPAR para observar el impacto de esta funcionalidad en cada nodo. Estos informes deberían de repetirse una vez todos los nodos en el sysplex se encuentren con zHPF activo.

Las métricas que pueden ayudar a ver la mejora son:

I/O Intensity: Es el producto de multiplicar el tiempo de respuesta por la tasa de actividad del canal. La unidad de medida se mide en milisegundos por segundos de solicitudes esperando el dispositivo.

Response Time (RT) : Tiempo de respuesta. Este dato se obtiene a través de la formula: RT= IOSQ + CONN + PEND + DISC

I/O Supervisor (IOSQ) = Encolamiento en la UCB de operaciones I/O. (Con el Hyperpav activo se elimina prácticamente la espera).

Connection time (CONN) = El tiempo en que el volumen lógico está conectado al canal. Con el ZHPF este dato se calcula de forma distinta (mirar documento ZSW03059USEN.pdf)

Disconnect time (DISC) = Es el tiempo de espera de desconexión del canal. Es decir cuando la operación de lectura o escritura utiliza la cache de la CU o escribe en disco y ya no depende del canal.

Pending time (PEND) = El tiempo de espera provocado por un retraso por Canal ocupado + CU ocupada + Disco ocupado. Con el ZHPF este dato se calcula de forma distinta (mirar documento ZSW03059USEN)

Service Time (ST) : Tiempo de servicio. Tiempo que el disco necesita para completar el I/O. Sería la suma del ST = CONN + DISC

RT/ST: Ratio de tiempo de respuesta por tiempo de servicio. Es una dato que nos muestra el grado de encolamiento que tiene una CU o Disco.

@erobertoruiz