2010-06-20 42 views
8

Soy un estudiante de pregrado y es mi último año en este programa. como en cualquier grado de computación, tengo que hacer un proyecto (individual) con respecto a cualquier tema que se someterá a computación. Quiero algo que esté bajo la supervisión de la computadora (detección o seguimiento de objetos para ser exactos). Mientras busca información sobre este tema descubrí que ya hay tanta gente que ha hecho este tipo de proyectos. Mi pregunta es si para hacer un proyecto como el seguimiento de un objeto en video ¿tengo que encontrar mi propio algoritmo o hay algún algoritmo disponible? para que haga la codificación. (soy familiar en java y empecé un poco de Python)visión por computadora, ideas para proyectos?

favor, me guía en la escogencia de un tema y una pequeña idea de cómo iniciar o desde dónde empezar

+0

¿Cuánto habrá estudiado el procesamiento de imágenes y la visión artificial antes de realizar el proyecto? La cantidad de experiencia previa tendría un gran impacto sobre qué proyectos son viables. –

+0

@kigurai no he seguido ningún curso de CV, solo estoy interesado en él – peedarpk

+0

Entonces probablemente me enfocaré en implementar algo que sea genial pero no demasiado difícil. Seguir un objeto en video no es muy difícil si no hay oclusión, para tomar un ejemplo simple. –

Respuesta

1

Hay hay muchos algoritmos de visión artificial y análisis de imágenes que ya existen. Tomé una clase en la escuela de posgrado hace unos años que fue interesante, por lo que sugiero buscar en la biblioteca de la universidad o en la librería un texto sobre el tema para obtener un buen manejo de lo que está disponible.

Existen aplicaciones del mundo real para esta tecnología. El Reconocimiento Óptico de Caracteres (OCR) es un campo que ha visto una aplicación de alto perfil a lo grande.

Escogiste un tema interesante, ¡diviértete! :)

6

Hice un curso básico de visión por computadora durante mis estudios de posgrado y uno de los primeros proyectos que realizamos fue implementar un sistema que une una serie de imágenes en un panorama de 360 ​​grados.

Implicaba:

  1. detección de características discriminantes en las imágenes individuales (usando SIFT extracción de características),
  2. las mejores características encontradas en las otras imágenes (que coinciden característica),
  3. la alineación automática de las imágenes (estimación de la homografía),
  4. determinando su superposición y las posiciones relativas de las cámaras (estimación de la pose de la cámara),
  5. proyecta las imágenes en un cylindri sistema de coordenadas cal (deformación de imagen),
  6. y luego, finalmente, mezcle las fotos resultantes en un único panorama continuo (fusión de imágenes).

El desafío de este proyecto es hacer que el código sea lo suficientemente eficiente como para permitir una costura de imágenes rápida.

Puede encontrar muchos recursos en Internet para ayudarlo con el proyecto.

+1

No está realmente conectado a la detección o seguimiento de objetos como se requería. –

3

Si desea hacer algo realmente interesante e interesante, intente desarrollar un algoritmo de detección de actividad en video. Por ejemplo, "hombre que se va del coche", "personas que ingresan a la construcción", etc. No es una tarea trivial y un desafío suficiente para una tesis de UG. Puede usar un conjunto de herramientas como OpenCV para hacer el trabajo de base en el procesamiento de video y detección de objetos, etc., mientras se enfoca en el algoritmo.

+0

Como un FYI, este es un área de investigación activa en lugares como DARPA y los departamentos de Defensa. – Mikos

+7

A menos que uno ya haya tomado algunos cursos de visión artificial, diría que este es un proyecto demasiado avanzado. –

+0

No necesariamente, el OP podría restringirse a alguna actividad específica y hacer que sea una fruta que cuelga poco. – Mikos

0

A continuación se presentan algunas de las ideas del proyecto de visión por ordenador que le puede resultar interesante:

  1. aprendizaje de un colector de dígitos MNIST
  2. Palabras visuales para la recuperación de imágenes
  3. Segmentación de imágenes mediante clústeres no paramétricos
  4. clasificación de vídeo mediante CNNs
  5. búsqueda
  6. Imagen basada en CNNs y PCA incrustar
  7. Filtro de Kalman Seguimiento
  8. La compresión de vídeo basada en superpíxeles
  9. reconocimiento óptico de caracteres usando redes neuronales
  10. visual y semántica incrustación de objetos (generación subtítulos para imágenes)

Para comenzar con los proyectos de aprendizaje profundo, recomiendo la biblioteca de Keras que ejecuta o n Theano/TensorFlow como backend con numerosos examples. Además, encontrará que el OpenCV tutorials es realmente útil. Además, puede encontrar implementaciones de algunos de los proyectos anteriores en la siguiente página github.

Cuestiones relacionadas