Todavía estoy atascado en mi problema de tratar de analizar artículos de wikipedia. En realidad, deseo analizar la sección infobox de los artículos de la wikipedia, es decir, mi aplicación tiene referencias a países y en cada página de país me gustaría poder mostrar la infobox que está en el artículo correspondiente de wikipedia de ese país. Estoy usando php aquí. Le agradecería enormemente si alguien tiene fragmentos de código o consejos sobre qué debería hacer aquí.¿Cómo puedo obtener solo el Infobox analizado de un artículo de wikipedia?
Gracias de nuevo.
EDITAR
Bueno, tengo una tabla db con los nombres de los países. Y tengo un script que toma un país y muestra sus detalles. Me gustaría tomar el cuadro de información: el cuadro azul con todas las imágenes de detalles del país, etc., tal como está en wikipedia y mostrarlo en mi página. Me gustaría conocer una manera realmente simple y fácil de hacerlo, o tener un script que simplemente descargue la información del cuadro de información a un sistema remoto local al que podría acceder más tarde. Quiero decir que estoy abierto a las ideas aquí - excepto que el resultado final quiero es ver la caja de información en mi página de - por supuesto con un poco de contenido de Wikipedia enlace en la parte inferior :)
EDITAR
Creo que encontré lo que estaba buscando en http://infochimps.org - obtuvieron montones de conjuntos de datos en el lenguaje YAML. Puedo utilizar esta información como está, pero necesitaría una forma de actualizar constantemente esta información de wikipedia de vez en cuando, aunque creo que las carpetas de información rara vez cambian, especialmente en algunos países, a menos que alguna nación decida cambiar su ciudad capital.
Esto es un desperdicio de recursos. –
Lo siento, puedo ver lo que quiere decir con un gran desperdicio de recursos. No quise raspar la página cada vez que alguien en su sitio necesitaba verla. Creo que lo rascarías fuera de línea (si así lo deseas) y lo almacenarías en un DB local al final de tu aplicación (mucho más eficiente para todas las partes involucradas).¡No fue para atraer llamas! : P –
@Andrew - Estoy abierto a todas las posibilidades, sin embargo, no estoy seguro de cómo comenzar. ¿Hay algún tipo de código de trabajo que pueda ver para comenzar con esto? – Ali