Depende de la complejidad de la escena. Si la imagen contiene una bola roja, delante de una escena que no contiene otros objetos rojos es fácil:
Selecciona píxeles con valores altos en el canal rojo, elimina píxeles sueltos individuales (por ejemplo, con "apertura"), y calcula el centro de gravedad de los píxeles restantes.
Si la escena es solo un poco más compleja, el algoritmo necesario debe ser mucho más complejo y debe comenzar a leer documentos científicos, como los mencionados por el TC. La ya mencionada Hough Transform es un algoritmo relativamente simple que puede reconocer formas parcialmente oscurecidas. Por lo tanto, si quiere salirse con un algoritmo simple, configure la escena cuidadosamente y use buena iluminación con lámparas múltiples.
Para las bibliotecas que realizan las operaciones básicas de análisis de imágenes, OpenCV y Camellia, que ya se mencionaron, son los tipos de bibliotecas que necesita. Para algoritmos simples y cuando no necesita tiempo real, también puede probar el image analysis module desde Scipy.
Juro que AMD/ATi publicó una vez una detección de objetos en tiempo real con una implementación de la transformada Hough en la GPU, pero ya no puedo buscar en Google :( –