Esto no es una respuesta completa, pero si hay varias imágenes en el tif y si conoce el tamaño de antemano, puede estandarizar las muestras de imagen antes de clasificarlas. Cortarías la imagen en todos los rectángulos posibles en el tif.
Así que cuando crea un clasificador (no menciono los métodos aquí), el resultado final sería una síntesis de la clasificación de todos los rectángulos más pequeños.
Por lo tanto, si se le da un tif, las imágenes de 'flecha' o 'flor' son 16px por 16px, por ejemplo, puede usar Python PIL para crear las muestras.
from PIL import Image
image_samples = []
im = Image.open("input.tif")
sample_dimensions = (16,16)
for box in get_all_corner_combinations(im, sample_dimensions):
image_samples.append(im.crop(box))
classifier = YourClassifier()
classifications = []
for sample in image_samples:
classifications.append (classifier (sample))
label = fuse_classifications (classifications)
Una vez más, no me refiero a la etapa de aprendizaje de escribir realmente YourClassifier
. Pero espero que esto ayude a explicar parte del problema.
Hay mucha investigación sobre el tema de aprender a clasificar imágenes, así como a trabajar para limpiar el ruido en las imágenes antes de clasificarlas.
Considere la posibilidad de navegar a través de esta bonita colección de bibliotecas existentes de aprendizaje automático de Python.
http://scipy-lectures.github.com/advanced/scikit-learn/index.html
hay muchas técnicas que se relacionan con las imágenes también.
¿Has echado un vistazo a http://code.google.com/p/pytesser/? –
¿Esto reconoce iconos dentro de la imagen o solo texto? ¿Hay alguna manera de entrenarlo por lo que usted sabe? – KingBOB
¿Hay algún fondo detrás de las figuras? ¿Cambia su orientación, tamaño o color? Cuanta más información obtenemos mejor podemos ayudar – P2bM