2012-03-24 12 views
5

Por ejemplo, para obtener el favicon de un sitio, puedo usar http://www.google.com/s2/favicons?domain= y completar el dominio. Google devuelve el favicon. También me gustaría obtener el título.Google API | URL al título del sitio

Sé que podría analizar el título desde el html en el lado del servidor ... o Podría usar javascript document.title en el lado del cliente. Pero no quiero tener que descargar todo el sitio.

Utilicé el ejemplo de favicon b.c. fue un buen ejemplo de cómo tiene datos sobre un sitio disponible en la web sin tener que hacer ningún "trabajo pesado"

Debe haber un título similar. Básicamente, quiero hacer coincidir una URL con el título.

+0

Tenga en cuenta que se puede agarrar el favicon mismo accediendo directamente a www.whatevertheURLis.com/favicon.ico. Creo que la herramienta de favicon de Google fue más para la conversión. Emite un png que se puede usar en etiquetas img. – ShiggityShiggityShwa

+0

Sí, pero hay mucho más trabajo pesado en la conversión de una imagen que en el análisis de texto, ¿no? Por lo tanto, dudo que haya una necesidad apremiante de que tengan disponible un servicio similar para las etiquetas HTML. De todos modos, si lo desea, puede escribir código que simplemente tome un documento HTML sin intentar captar el contenido al que hace referencia. Eso es realmente bastante simple y no estarías agarrando "todo el sitio", solo el texto de la página. – ShiggityShiggityShwa

Respuesta

2

Puede hacer uso de la API de búsqueda personalizada de Google para obtener el título de una página web. Simplemente busque "info: siteurl" y obtenga el título de la primera solicitud. No sé exactamente lo que quiere hacer, pero permite 100 solicitudes por día.

Ver detalles de la API aquí: http://code.google.com/apis/customsearch/v1/reference.html

+0

Solo necesita la url y los parámetros.Asegúrate de obtener una clave API y estás listo. – Overv

+0

El enlace que @Overv ha publicado se ha convertido en https://developers.google.com/custom-search/json-api/v1/overview – Pieter

0
+0

Lo sentimos, tienes razón. Pero no creo que haya otra forma, porque el título no se envía con el encabezado. Pero tal vez eche un vistazo a http://www.google.com/search?client=safari&rls=en&q=info:stackoverflow.com – Tny

+0

Puede obtener el encabezado con http://www.php.net/manual/en /function.get-headers.php pero el título no es parte del encabezado. Algunas personas discutieron en get_meta_tags() cómo obtener el título y solo pudieron resolverlo descargando todo el sitio. – Tny

+0

Overv le dio un enlace a la API de Google, esta es en este momento la única solución sin descargar todo el sitio. Este sería su elemento correcto: items []. Title El título del resultado de la búsqueda, en texto sin formato. – Tny

1

Este post tiene un muy buen trozo de código que obtiene la URL, descripción y palabras clave ...

Getting title and meta tags from external website

Usted tiene que descargue la fuente de las páginas enteras, pero su única página y utilizando la clase PHP DOMDocument es muy eficiente.

No tiene que cargar toda la página para obtener un favicon porque es un archivo separado pero los títulos se almacenan dentro del origen de la página.

+0

Bueno, si hubiera un servicio, todavía tendrían que descargar toda la página, hay no hay forma de evitarlo realmente Y sería muy guardado en caché. Es fácil de hacer, así que hágalo usted mismo con un caché que pueda controlar. – 472084

1

Aquí hay una API que devuelve el título, pero también tendrá que almacenar en caché todo el sitio.

decenturl.com/api-title?u=stackoverflow.com

+0

stackoverflow no devuelve ningún título? – Nonlin

Cuestiones relacionadas