2009-08-13 8 views
7

estoy usando letter_regcog ejemplo de OpenCV, que utiliza datos de la UCI que tienen estructura como esta:imagen FOM datos como "Carta de reconocimiento de imágenes conjunto de datos" Cómo crear a partir de la UCI

 
Attribute Information: 
    1. lettr capital letter (26 values from A to Z) 
    2. x-box horizontal position of box (integer) 
    3. y-box vertical position of box (integer) 
    4. width width of box   (integer) 
    5. high height of box   (integer) 
    6. onpix total # on pixels  (integer) 
    7. x-bar mean x of on pixels in box (integer) 
    8. y-bar mean y of on pixels in box (integer) 
    9. x2bar mean x variance   (integer) 
    10. y2bar mean y variance   (integer) 
    11. xybar mean x y correlation  (integer) 
    12. x2ybr mean of x * x * y  (integer) 
    13. xy2br mean of x * y * y  (integer) 
    14. x-ege mean edge count left to right (integer) 
    15. xegvy correlation of x-ege with y (integer) 
    16. y-ege mean edge count bottom to top (integer) 
    17. yegvx correlation of y-ege with x (integer) 

ejemplo:

 
T,2,8,3,5,1,8,13,0,6,6,10,8,0,8,0,8 
I,5,12,3,7,2,10,5,5,4,13,3,9,2,8,4,10 

ahora tengo una imagen segmentada de la letra y quiero transformarla en datos como este para ponerla a reconocer pero no entiendo la media de todos los valores como "6. onpix total # en píxeles" ¿qué significa? ¿Puedes explicar la media de estos valores? Gracias.

Respuesta

5

No estoy familiarizado con el ejemplo letter_recog de OpenCV, pero este parece ser un vector de características o un conjunto de estadísticas sobre la imagen de una letra que se usa para clasificar las apariciones futuras de la letra. Los resultados de su segmentación deberían dejarle una máscara binaria con 1 en la letra y 0 en el resto. onpix es simplemente la cantidad total de píxeles que caen en la letra, o en otras palabras, la suma de tu máscara binaria.

La mayoría de los valores restantes de la lista deben calcularse en función del conjunto de píxeles con un valor de 1 en su máscara binaria. xey son solo la posición del píxel. Por ejemplo, x-bar es solo la media muestral de todas las posiciones x de todos los píxeles que tienen un 1 en la máscara. Debería poder encontrar fácilmente referencias en la web para definiciones matemáticas de media, varianza, covarianza y correlación.

14-17 son un poco diferentes, ya que se basan en píxeles de borde, pero los cálculos deben ser similares, justo sobre un conjunto diferente de píxeles.

3

Mi nombre es Antonio Bernal. En la página 3 de este artículo, encontrará una buena descripción para cada valor. Letter Recognition Using Holland-Style Adaptive Classifiers. Si tiene alguna duda, hágamelo saber. Estoy tratando de hacer que este algoritmo funcione, pero mi problema es que no sé cómo escalar los valores para ajustarlos al rango 0-15. ¿Tienes alguna idea de cómo hacer esto?

+0

Hola Anotnio, no he leído el documento, pero los valores de reajuste deberían multiplicarse por un factor de escala. Por ejemplo, si tengo onpix = 0 a 255, entonces puedo volver a escalar tomando: scaled_onpix = (onpix * 15)/255 ¿Es esto lo que estabas buscando? –

+0

También estoy luchando con cuál es la mejor manera de escalarlo. Supongo que los autores deben asumir un límite superior en el tamaño de la imagen. Parece que, dado que la mayoría de las letras ocupan solo una fracción del cuadro delimitador, algo así como el n. ° 6: onpix tendría un valor máximo mucho mayor que cualquier otro personaje real. – emschorsch

Cuestiones relacionadas