tenemos un servidor biztalk (uno virtual (1!) ...) en nuestra empresa, y un servidor SQL donde se guardan los datos. Ahora tenemos mucho tráfico de datos. Estoy hablando de cientos de miles. Así que en realidad ni siquiera estoy seguro de si un servidor es bastante seguro, pero nuestra empresa no es tan fácil de convencer.Problema del servidor BizTalk
Ahora, recientemente tenemos muchos problemas.
Permitir que yo sitúo en detalle, así que no me falta nada:
Nuestro servidor tiene 5 aplicaciones:
- Uno con 3 orquestaciones, 12 puertos de envío, 16 ubicaciones de recepción.
- Uno con 4 orquestaciones, 32 puertos de envío, 20 ubicaciones de recepción.
- Uno con 4 orquestaciones, 24 puertos de envío, 20 ubicaciones de recepción.
- Uno con 47 orquestaciones (sí 47), 37 puertos de envío, 6 ubicaciones de recepción.
- Uno con aplicación común con un par de recursos.
Nuestros problemas han ocurrido desde que desplegamos las aplicaciones con las 47 orquestaciones. Muchas de estas orquestaciones usan formas de asignación que usan el código C# para realizar la asignación. Esto se debe a que utilizamos extensiones HL7 y esto es algo especial, por lo que al usar el código C# & xpath fue mucho más fácil hacer la asignación porque muchos de estos esquemas se parecen. El C# lee en XmlNodes recibidos a través de xpath, y devuelve XmlNode que luego se asignan nuevamente a los mensajes de biztalk. No estoy seguro de si esta podría ser la causa, pero pensé que lo mencionaría.
Los puertos de envío y recepción tienen muchos tipos diferentes: Archivo, MQSeries, SQL, MLLP, FTP. Cada uno de estos tipos tiene instancias de host diferentes para equilibrar la carga. Nuestras orquestaciones usan el host BiztalkApplication.
En este servidor también se ejecutan un par de scripts, en su mayoría scripts de carga ftp & también un script zipper, que comprime archivos cada media hora en un zip diario y elimina los archivos zip después de un mes. Usamos este zipscript en nuestros archivos de copia de seguridad (realizamos muchas copias de seguridad, las copias de seguridad también están en nuestro servidor), lo hicimos porque el servidor tenía problemas para enviar archivos a una ubicación donde había un montón (MUCHO) de archivos, entonces después los archivos se redujeron a las cremalleras, fue mejor.
Ahora los problemas que estamos teniendo recientemente son principalmente dos problemas principales:
- Nuestro problema más importante es la siguiente. Mantuvimos una ubicación de recepción con muchos mensajes en cola para probar. Después de que comenzamos esta ubicación de recepción que usa las 47 orquestaciones, las instancias de servicio en ejecución comienzan a destellar. Ok, esto es bastante normal. Digamos aproximadamente 10000, y luego detenemos la ubicación de recepción para ver cómo biztalk maneja estas 10000 instancias. Normalmente bajan bastante rápido, y algunas veces lo hace, pero después de un tiempo comienza a "acelerarse", lo que significa que simplemente dejan de procesarse y las instancias del servicio permanecen en el mismo número, por ejemplo, en 30 segundos baja de 10000 a 4000 y luego se queda en 4000 y baja muy muy muy lentamente, como 30 en 5 minutos o algo así. Esto significa que todas las demás instancias de servicio de las otras aplicaciones también están atrapadas aquí, y tampoco se procesan.
Notamos que después de reiniciar nuestras instancias de host, el número de instancia volvió a bajar rápidamente. Intentamos reiniciar selectivamente diferentes instancias de host para localizar el problema. Notamos que finalmente reiniciar la instancia de host de envío/recepción de archivos haría el truco. Así que pensamos que el envío de archivos sería el problema. Concordando que hacemos muchas copias de seguridad. Así que reemplazamos las copias de seguridad de tipo de archivo con copias de seguridad de mqseries. El mismo problema ocurrió, y lo curioso, reiniciar el host de envío/recepción de archivos aún soluciona el problema.
No se encontraron errores en el visor de eventos tampoco.
- Un segundo problema que tenemos es. Que a veces alrededor de las 6 a. M., Se detienen todas o parte de las instancias del host.
En el visor de sucesos nos dimos cuenta de los errores siguientes (estos son más de uno):
The receive location "MdnBericht SQL" with URL "SQL://ZNACDBPEG/mdnd0001/" is shutting down. Details:"The error threshold has been exceeded. The receive location is shutting down.".
The Messaging Engine failed to add a receive location "M2m Othello Export Start Bestand" with URL "\m2mservices\Othello_import$\DataFilter Start*.xml" to the adapter "FILE". Reason: "The FILE adapter cannot access the folder \m2mservices\Othello_import$\DataFilter Start. Verify this folder exists. Error: Logon failure: unknown user name or bad password. ".
The FILE adapter cannot access the folder \m2mservices\Othello_import$\DataFilter Start. Verify this folder exists. Error: Logon failure: unknown user name or bad password.
An attempt to connect to "BizTalkMsgBoxDb" SQL Server database on server "ZNACDBBTS" failed. Error: "Login failed for user ''. The user is not associated with a trusted SQL Server connection."
Se woould parece que hay una falta de la conexión en este momento y que, debido a que otros servicios también están experimentando problemas y, finalmente, se cierran.
El caso es que nuestro usuario es administrador, y es imposible que su contraseña sea incorrecta "a veces". Hemos llegado a la conclusión de que el problema podría deberse a un problema de infraestructura, pero ese no es el departamento.
Sé que es una publicación larga, pero ya no estamos seguros de qué hacer. ¿Sumaríamos otro problema al agregar otro servidor y al equilibrar la carga? ¿Hay alguna manera de medir nuestro equilibrio y saber por dónde empezar a dividir? ¿Cuáles son los números normales de carga, etc.?
Agradezco cualquier respuesta porque estos problemas están empeorando y también estamos en una fecha límite.
¡Muchas gracias por las respuestas!
tenemos el mismo problema, ¿tenía más documentos? –