2010-07-25 7 views
9

¿Cuál es la mejor manera de rastrear suscriptores RSS de manera confiable sin usando Feedburner? Algunos de los enfoques obvios como el seguimiento por IP o el número de visitas tienen algunos defectos fata. Las direcciones IP pueden cambiar con cada solicitud o múltiples usuarios pueden usar la misma IP. Además, los lectores de feeds pueden solicitar un feed varias veces por día o incluso por hora. Ambos problemas hacen que sea realmente difícil obtener estadísticas fiables sobre suscriptores únicos.¿Forma estándar y confiable de rastrear suscriptores de RSS?

He leído artículos por Leo Notenboom y Tim Bray sobre el tema, pero ninguna de sus sugerencias parece realmente resolver cómo rastrear a los suscriptores de una manera precisa y confiable. Leo sugiere tener una ID única generada programáticamente para ser añadida a la URL de la fuente RSS cada vez que se carga la página de referencia. Tim recomienda que los lectores de RSS generen un hashtag único y también tiene sugerencias que van desde el seguimiento de las referencias hasta el uso de cookies. Una URL única sería confiable, pero tiene dos defectos: no es una URL fácil de usar y crea contenido duplicado para SEO. ¿Hay algún otro método confiable de seguimiento de suscriptores de RSS? ¿Cómo estima Feedburner a los suscriptores?

+0

generación de archivos xml únicos, por ejemplo: www.site.com/rss/12345/ para cada usuario suscrito de su sitio; así que, genera el xml con php usando el tipo de encabezado xml y rastreándolo por time()! esto podría ser una manera segura de contar el acceso único a su RSS. En mi humilde opinión, ¡bastante drástico pero operable! ;) –

Respuesta

0

Puede consultar los registros de su servidor web en busca de tráfico a su fuente RSS, tal vez filtrarlo por IP para obtener el número de únicos.

El problema es que eso dependerá de que la gente revise el feed diariamente. La frecuencia de visitas a su feed RSS por parte de un individuo puede variar día a día y el número podría ser menor.

+0

Gracias por la sugerencia. Sin embargo, hay problemas con este método. Las direcciones IP pueden cambiar con cada solicitud o múltiples usuarios pueden usar la misma IP. Además, los lectores de feeds pueden solicitar un feed varias veces por día o incluso por hora. Ambos problemas hacen que sea realmente difícil obtener estadísticas fiables sobre suscriptores únicos. – VirtuosiMedia

3

No hay realmente una manera estándar de hacer esto. El conteo de suscriptores siempre es poco confiable, pero puede obtener buenas estimaciones con él.

Así es como Google lo hace (source):

suscriptores recuentos se calculan comparando la dirección de IP y alimentación lector de combinaciones, a continuación, utilizando nuestro conocimiento detallado de la multitud de lectores, agregadores, y los robots en el mercado para hacer inferencias adicionales.

Por supuesto, parte de esto es fácil para Google, ya que primero pueden calcular cuántos usuarios de Google Reader están suscritos al feed en cuestión. Después de eso, también usan la coincidencia de direcciones IP, y eso es lo que debes usar también.

Puede calcular direcciones IP individuales (es decir, únicas) de los registros de los servidores web, pero eso contaría 10 personas como 1 si todas usan la misma dirección. Es por eso que debe inspeccionar los encabezados HTTP que envía el cliente, más específicamente los campos de encabezado HTTP_X_FORWARDED_FOR y HTTP_VIA. Puede usar la dirección HTTP_VIA como la dirección "principal" y luego calcular cuántas direcciones exclusivas HTTP_X_FORWARDED_FOR están suscritas al feed. Si el suscriptor no tiene estos campos agregados por el proxy, se cuenta como una dirección IP única. Estos deben manejarse en el código que genera el feed. También puede agregar una búsqueda GeoIP para las IP y almacenar todo en una base de datos. Esto le permitiría ver qué país tiene la mayor cantidad de suscriptores a su feed.

Esto tiene sus problemas también. Todos los proxies no usan estos campos y no soluciona el problema de calcular los suscriptores detrás de las puertas de enlace NAT. Sin embargo, es una buena estimación. Además, probablemente esté más interesado en el orden de magnitud que en el recuento exacto de suscriptores, ¿verdad? Si el contador dice que tienes 5989 suscriptores, probablemente tengas más suscriptores, ya que el contador te da el límite inferior.

0

Si configura su fuente RSS para que requiera algún tipo de autenticación, puede realizar métricas basadas en el usuario en lugar de métricas basadas en IP. Aunque esta sería una solución técnicamente correcta, lograr que las personas opten por un blog autenticado en cualquier otra cosa que no sea un escenario de Intranet es una exageración.

+0

Eso sería ideal, pero desafortunadamente la autenticación no es la forma en que la mayoría de los feeds han funcionado en la naturaleza. Ni siquiera estoy seguro de si la mayoría de los lectores de RSS admiten algo así. – VirtuosiMedia

3

Estándar y confiable no son exactamente la palabra en el diccionario RSS :-) Tengo que recordar que la cosa ni siquiera tiene XSD estándar después de cuántos años? Si al rastrear te refieres al "conteo", hay algunas cosas que puedes hacer y las tácticas dependen del propósito, es decir, ¿están demostrando un número grande o pequeño? Es una cuestión de marketing, por lo que debe definir sus objetivos :-)

Puede que tenga que clasificar los números de IP para empezar: para tener la colección básica de números de IP grandes/corporativos/paraguas. Para ellos, puede usar referrer como un criterio de filtrado razonable y contar todo lo demás como único a menos que se demuestre lo contrario. La gran mayoría de los números de IP permanecen estables durante aproximadamente 2 días, pero de nuevo siempre es bueno usar la lógica de referencia básica como un filtro para las personas que simplemente siguen "haciendo clic", por así decirlo.

Luego necesita una lista decente de agregadores y una clasificación de cómo procesan las URL y si oscurecen a los lectores finales por completo, necesita promedios publicados o inferidos; siempre es justo usar la distribución equitativa de un conteo promedio. El uso de cookies puede ayudar a recopilar direcciones IP agregadores y diferenciar entre agentes automatizados e individuos.

Una cosa muy importante es tener en cuenta que no puede usar un solo método y esperar que sea una solución mágica; debe usar estos 3 o 4 aspectos al mismo tiempo, además de un razonamiento estadístico básico.

Cuestiones relacionadas