No, definitivamente puede manejar más que eso.
Es importante recordar que, en el fondo, suponiendo que ejecuta una máquina de núcleo único, la CPU realmente solo ejecuta una instrucción * a la vez.
A saber, la CPU solo puede ejecutar un conjunto muy limitado de instrucciones, y no puede ejecutar más de una instrucción por ciclo de reloj (muchas instrucciones incluso toman más de 1 tilde).
Por lo tanto, la mayoría de concurrencia de la que hablamos en ciencias de la computación es concurrencia de software. En otras palabras, hay capas de implementación de software que abstraen de nosotros la CPU de nivel inferior y nos hacen pensar que estamos ejecutando código al mismo tiempo.
Estas "cosas" pueden ser procesos, que son unidades de código que se ejecutan simultáneamente en el sentido de que cada proceso piensa que se está ejecutando en su propio mundo con su propia memoria no compartida.
Otro ejemplo son los hilos, que son unidades de código dentro de los procesos que también permiten la concurrencia.
La razón por la cual sus 4 procesos de trabajo podrán manejar más de 4 solicitudes es que dispararán hilos para manejar más y más solicitudes.
El límite de solicitud real depende del servidor HTTP elegido, O, SO, hardware, conexión de E/red, etc.
Buena suerte!
* las instrucciones son los comandos más básicos que la CPU puede ejecutar. ejemplos: agregue dos números, salte de una instrucción a otra
Gunicorn ahora admite subprocesos "reales" desde la versión 19. Consulte [this] (http: //docs.gunicorn. org/en/stable/design.html # how-many-threads) y [this] (http://docs.gunicorn.org/en/stable/settings.html#threads). –