Página 1 de 1

Notificación de errores por parte de los agentes

Publicado: 1 de abril de 2019 - 14:08
por cchatoux
Hola,

desde mediados de la semana pasada, casi un tercio de nuestras máquinas aparecen como desconectadas en WAPT, aunque son accesibles desde la red.

En los registros del agente, encuentro lo siguiente:

2019-04-01 13:49:16,072 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:50:16,082 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:51:16,095 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:52:16,108 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:53:16,121 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:54:16,134 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('
2019-04-01 13:55:16,970 ADVERTENCIA Parámetros de conexión de Websocket: HTTPSConnectionPool(host='srv00-wapt01', puerto=443): Se superó el número máximo de reintentos con la URL: /get_websocket_auth_token (Causado por NewConnectionError('

¿Cómo puedo solucionar esto?

Versión 1.7.3.5 instalada en un servidor Windows Server 2016 (1607).

Gracias por su ayuda.

Re: Error de los agentes informantes

Publicado: 3 de abril de 2019 - 19:54
por cchatoux
Hola,

he intentado avanzar en este problema.
Parece que los agentes están abriendo muchos sockets al servidor y, llegado un punto, no quedan puertos disponibles para la comunicación. Pensaba que esto se debía a los puertos de escucha del servidor, pero parece que el problema está en las máquinas cliente.
Instalé un nuevo servidor WAPT en CentOS 7 y tengo el mismo problema con 3 de las 5 máquinas que se comunican con este nuevo servidor.

Según el mensaje de error (10055) y numerosas publicaciones en foros, parece que Python (o Windows) no cierra las conexiones correctamente y que el sistema operativo agota rápidamente los puertos disponibles. ¿

Alguna vez te has encontrado con este problema?

Saludos cordiales,

Re: Error de los agentes informantes

Publicado: 4 de abril de 2019 - 10:20 a. m.
por htouvet
Hola,
no recuerdo haber visto este problema antes...
Sería interesante ver por qué la solicitud `/get_websocket_auth_token` al servidor es rechazada inicialmente (y posiblemente liberada incorrectamente, dejando un socket abierto).

En un símbolo del sistema con privilegios elevados, ejecute `runwaptservce.bat -ldebug` y observe el comportamiento.
Verifique si algún programa antivirus local o remoto está interceptando las conexiones HTTPS.

También puede ejecutar `netstat -a -n` en el cliente para ver todos los sockets y verificar que hay demasiados conectados al servidor WAPT en el puerto 443.

Normalmente, hay un socket permanentemente en modo ESTABLISHED (la conexión WebSocket del cliente al servidor para acciones desde la consola) y otros posiblemente en modo TIME_WAIT debido a actualizaciones u otras solicitudes anteriores.
Los sockets en modo TIME_WAIT o CLOSE_WAIT no deberían permanecer abiertos durante más de cuatro minutos.

Re: Error de los agentes informantes

Publicado: 12 de abril de 2019 - 10:44 a. m.
por cchatoux
Hola,

tengo problemas para proporcionarles los registros del servicio.
Cuando ocurre el problema y ejecutamos el comando, el servicio se reinicia y funciona... Intentaré dejar el depurador funcionando durante varios días en una máquina.

Saludos,