tl; dr: Estoy buscando una manera de encontrar entradas en nuestra base de datos que faltan, obtener esa información de un sitio web y agregarla a la base de datos entrada.Emparejar contenido en un sitio web externo con entradas en una base de datos mySQL
Tenemos un programa de gestión de medios que utiliza una tabla de MySQL para almacenar la información. Cuando los empleados descargan medios (archivos de video, imágenes, archivos de audio) e importan en el administrador de medios, son supongamos para copiar también la descripción del medio (desde el sitio web de origen) y agregarlo a la descripción en el Administrador de medios. Sin embargo, esto no se ha hecho para miles de archivos. (. Ej file123 .mov)
El nombre del archivo es única y la página de detalles de ese archivo se puede acceder por ir a una dirección URL en la página web fuente:
website.com/content/ file123
la información que queremos para raspar de esa página tiene un ID de elemento que es siempre la misma.
En mi mente el proceso sería:
- Conectar a base de datos y Cargar tabla
- Filtro:
"format"
es"Still Image (JPEG)"
- Filtro:
"description"
es"NULL"
- Obtener primer resultado
- Obtener
"FILENAME"
sin extensión)- cargar la URL: website.com/content/
FILENAME
- Copiar el contenido del elemento
"description"
(en el sitio web)- pegar contenido en el
"description"
(entrada SQL)- Get segundo resultado
- Enjuague y repita hasta el último resultado se alcanza
Mi pregunta (s) son:
- ¿Existe software que podría realizar una tarea, o se trata de algo que tendría que ser guion?
- Si está escrito, ¿cuál sería el mejor tipo de secuencia de comandos (por ejemplo, podría lograr esto con AppleScript o tendría que hacerse en Java o PHP, etc.)
gracias por la respuesta! ¿Alguna idea de cómo podría tomar la información raspada y relacionarla con las entradas en una tabla mySQL? – OrangeBox