2012-05-14 5 views
7

He aquí un ejemplo de URL:En Facebook compartir la URL no se tire en og: información de la etiqueta hasta que correr a través de depurador (aunque depurador da ningún error)

http://www.motherjones.com/mojo/2012/05/reince-priebus-lgbt-workplace-discrimination

Lo anterior se usa para tirar en ninguna imagen, título o descripción cuando se pegó en el cuadro de actualización de estado de Facebook; permaneció como una URL vacía. Luego lo pasé por el depurador, que no encontró problemas. Ahora ingresa el título, la imagen y la descripción cuando se pegan en el cuadro de actualización de estado.

Para comparar, aquí hay una publicación que aún no he depurado. No se transforma cuando se pega en el cuadro de actualización. Sin embargo, tan pronto como yo o cualquier otra persona lo ejecute a través del depurador, comenzará a aparecer el título (aunque este no tiene una imagen o descripción).

http://www.motherjones.com/kevin-drum/2012/05/health-insurers-required-credit-obama-when-sending-out-rebate-checks

Esto podría ser simplemente un problema de tiempo - FB es lento para preparar los metadatos en nuestras páginas -, pero nos hemos dado cuenta de que se tarda horas, tal vez días para la puesta en común para empezar a trabajar correctamente. Eso es mucho después de que la pieza alcanzó su punto máximo en el tráfico, por lo que no nos sirve de nada.

empezamos a ver esto alrededor de 9 de abril

Mi pregunta: ¿Hay algo en nuestras páginas de Facebook que está haciendo lenta para raspar ellos? ¿Qué me estoy perdiendo? Si hay un problema, ¿por qué el depurador no me lo dice? Parece que hay una versión ligeramente actualizada del doctype para probar, pero parece que no es el culpable. Además, ¿hay alguna razón por la que no deba escribir un enlace para ejecutar todo a través del depurador en el momento de la publicación?

+0

También debe tenerse en cuenta que al hacer clic en "Me gusta" en la página en sí produce un uso compartido normal con los metadatos (pero no corrige el uso compartido de pegado). –

Respuesta

2

Facebook almacena en caché los datos desechados de su lado para una respuesta más rápida cuando los usuarios comparten. En la documentación de la Like Button que dice:

Cuando no raspar Facebook mi página?

Facebook necesita raspar su página para saber cómo mostrarla alrededor de el sitio.

Facebook raspa su página cada 24 horas para asegurar que las propiedades sean actualizadas. La página también se raspa cuando un administrador de la página Open Graph hace clic en el botón Me gusta y cuando la URL se ingresa en el Facebook URL Linter. Facebook observa los encabezados de caché en sus URL: mirará "Caduca" y "Control de caché" en orden de preferencia. Sin embargo, incluso si especifica un tiempo más largo, Facebook raspará su página cada 24 horas.

El agente de usuario del rascador es: "facebookexternalhit/1.1 (+ http: //www.facebook.com/externalhit_uatext.php)"

Como se puede ver, cuando se utiliza el linter (también conocida como herramienta de depuración) borra la memoria caché de la url usada y la reemplaza con los datos nuevos, por lo que obtiene diferentes resultados de uso compartido después de depurar la página. Aunque no le sienta bien decir que a veces lleva días, pero tal vez su documentación no es completamente precisa sobre ese tema, después de todo, tienen mucho que desechar.

Si la página es nueva, es decir, no fue descartada antes, entonces no hay caché y debe obtener el resultado correcto al compartir, solo cuando los datos de og se cambiaron cuando debe borrar la caché. Por lo tanto, si actualiza los datos de una página descartada, asegúrese de depurarlos más tarde; solo puede emitir una solicitud http a la misma URL que utilizan en la herramienta de depuración desde el servidor, no necesita usar la interfaz web .

Si las cosas todavía no funcionan como se espera, se puede comprobar la cadena de agente de usuario de las peticiones entrantes y compararlo con facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php) y si coincide con ingrese la respuesta se envía de vuelta, luego se compara con los resultados que obtiene al compartir, si no es uniforme, intente presentar un informe de error. En cuanto a "enganchar" una solicitud de depurador por publicación, sugeriría que no fuera así, parece que el tráfico innecesario si funcionan como deberían. Creo que es mejor resolver el problema que usar un trabajo alternativo.

+0

Gracias por su respuesta. Buscaré en los registros el raspador y verifico mis encabezados de caché. Parece que los datos incorrectos/sin datos se deben almacenar en caché de alguna manera. Compartir con el botón "Me gusta" funciona normalmente incluso cuando el uso compartido de "pegar" no funciona, y el uso compartido sigue siendo malo, incluso después de muchos "me gusta" y recursos compartidos, hasta que el depurador elimine el caché. Este no es un caso en el que tenemos que asegurarnos de que las actualizaciones se lleven a cabo; el primer roce debe ser malo. Eventualmente obtiene los metadatos, pero un retraso de horas es suficiente para realmente perjudicarnos. Si descubro qué está causando esto, me aseguraré de actualizar este espacio. –

+0

Ahora tengo una nueva teoría. Presentamos una gran cantidad de contenido inédito. Los registros revelan que FB está intentando alcanzar este contenido y obtener un 403 (como debería). Entonces la pregunta es: ¿qué hace que FB sepa sobre la página no publicada? ¿Es el botón similar, el SDK, o ambos/cualquiera? ¿Qué debo evitar en las páginas no publicadas para evitar raspaduras? –

+1

Hay algunos factores desencadenantes para desechar una página, uno de ellos es la representación de un botón similar. Y si la url devuelve 403, se almacenará en caché. ¿Utiliza las mismas URL para puesta en escena y producción? –

Cuestiones relacionadas