Usos de la búsqueda avanzada para investigar en SEO y medios de comunicación: presentación de 4 casos concretos

Edición Febrero 2019

A continuación, mostraremos cuatro casos concretos  de utilización de la búsqueda avanzada de Google para investigar en SEO y en cibermedios. Para ello usaremos ejemplos destinados al análisis de medios de comunicación, pero obviamente se pueden aplicar a cualquier clase de sitio web llevando a cabo las extrapolaciones correspondientes.

Lo mejor es que estos usos no solamente pueden ser útiles para hacer averiguaciones en el terreno del posicionamiento de medios de comunicación, sino también los pueden utilizar tanto curadores de contenidos como periodistas para conseguir información crítica con una gran precisión.

Como sea, aquí van los cuatro  problemas investigación en visibilidad de medios con las que queremos ilustrar esta capacidad de la búsqueda avanzada. Presentaremos cada uno de ellos por medio de este pattern:

Estructura del formulario de búsqueda avanzada de Google

Antes presentar los 4 problemas que hemos seleccionado, es útil recordar cómo está estructurado el formulario para asistir a los usuarios para generar ecuaciones de búsqueda.

Este formulario está dividido en dos zonas:

Google da por supuesto que se van a combinar, puesto que las dos zonas aparecen presentadas mediante una frase en dos partes:

Lo que significa es que, primero podemos combinar entre sí las palabras clave de nuestra necesidad de información, mediante operadores booleanos (camuflados) y después limitar la búsqueda por determinados parámetros, como la ubicación de las palabras clave o el dominio.

A pesar de que la presentación del formulario sugiere, muy acertadamente, que son dos áreas que pueden combinarse,  ya que es la forma de obtener la máxima precisión, lo cierto es que puede tener sentido usarlas separadamente. Es el caso del primero de los problemas que presentaremos. Para los otros tres, en cambio, necesitaremos combinar las dos áreas.

 

Problema 1
Conocer el número de páginas indizadas por Google de un medio de comunicación

Contexto El número de páginas totales que Google ha indexado de un sitio web afecta a su visibilidad y por tanto afecta de manera directa y definitiva a su SEO potencial. Cuantas más páginas indexadas, más palabras clave podrán formar parte del índice de Google y mayor visibilidad potencial. También sirve para saber si un sitio tiene problemas de indexación. Esto puede afectar en especial  a un nuevo medio o a una nueva sección de un medio. Si sabemos que, por ejemplo, el nuevo medio o la nueva sección ha publicado 1.000 páginas (1.000 noticias, p.e.) pero vemos que en Google solamente hay 10 páginas (o 10 noticias) indizadas (o cero), obviamente aquí hay un problema grave de indexación que los responsables del SEO del medio deberían preocuparse por solucionar. El origen puede ser algún problema de configuración del servidor, un uso erróneo del archivo robots.txt, menú de navegación principal con enlaces rotos, etc.

Formulario para el problema 1

En 1 vemos que hemos utilizado el parámetro sitio o dominio del formulario para especificar un dominio, sin utilizar ningún criterio más. Esto fuerza que Google entregue como resultado todas las páginas que tiene indexadas de ese dominio y que como parte del resultado indique también su número total aproximado. El dominio buscado puede ser incluso de primer nivel, por ejemplo, sitios .edu o sitios .es. O al contrario, subdominios, etc.

Página de resultados del problema 1

En 1 vemos cómo traslada Google la petición a su lenguaje de operadores (en este caso site:). En 2 tenemos el resultado numérico, y la lista correspondiente de las páginas del sitio (que aquí hemos dejado fuera de la captura).

Problema 2
Buscar páginas con la palabra clave en la URL de la página

Contexto Las palabras clave que forman parte de la URL de una página, como en: www.sitio.com/series-television/ han sido uno de los principales factores de visibilidad. Se discute mucho su importancia actual, porque parece que ha decrecido últimamente, pero nadie duda de que sigue siendo importante. Además, resulta ser una de las mejores pistas para conseguir información con mucha precisión. Con la búsqueda que mostraremos a continuación veremos la forma de saber qué páginas con una palabra clave determinada, como parte de su URL, quedan en las primeras posiciones (las 10, 20 o 30 primeras, etc.).

Podemos ver entonces que tipo de sitios usan estas palabras clave y saber, por ejemplo, cómo es nuestra competencia, concretamente, que otros sitios web se han centrado en el tema de la palabra clave, por ejemplo, serie de televisión. También puede servir, como ya hemos señalado, para encontrar información muy precisa o sitios de autoridad o de referencia para cubrir un tema. Los sitios que usan una palabra clave en la URL de su página (en teoría) están muy enfocados en este tema.

Formulario para el problema 2

Vemos en 1 que hemos puesto dos palabras clave en la zona del operador booleano AND: series, television. No usamos la expresión “serie de televisión” porque podríamos perder información, y por eso utilizamos solamente las palabras indicadas. En 2 vemos que hemos seleccionado la opción los términos que aparecen: En la URL de la página.

Página de resultados del problema 2

Vemos aquí un ejemplo de las primeras páginas que responden a este consulta. Naturalmente, nada nos impide examinar todas las de las dos o tres primeras páginas de resultados para saber qué paginas ocupan el top 20 o el top 30 de aquellas que tienen las palabras clave seleccionadas en la URL.

Problema 3
Encontrar páginas con una palabra clave como parte del título

Contexto Algunas búsquedas arrojan mucho ruido. Una forma radical de extremar la precisión de los resultados es limitarlos a aquellas páginas que usan una palabra clave en el título. Además, el uso de palabras clave en el título (etiqueta h1 del lenguaje HTML) está reconocido como uno de los factores principales de SEO. Si usamos un término de actualidad, podemos saber de este modo qué páginas (y de paso, qué medios), de los que han usado esa palabra clave en el título, han conseguido mayor visibilidad, por tanto, en teoría, encontramos las noticias más relevantes sobre el tema.

Formulario problema 3

Como vemos en 1 hemos usado las palabras clave de actualidad brexit, españa. En 2 hemos seleccionado la opción de que las palabras clave aparezcan en el título. Como hemos indicado, nos puede servir, o bien para obtener resultados de forma muy precisa para poder hacer, por ejemplo, un dossier de prensa, o bien para saber qué medios de comunicación posicionan mejor sus noticias para este tema mediante el uso de la etiqueta h1 del lenguaje HTML.

Página de resultados del problema 3

Vemos en 1 la forma en que Google traslada nuestra pregunta (de paso, tenemos otro ejemplo de cómo repetir ese tipo de preguntas sin necesidad de usar el formulario) así como podemos ver los resultados, que como hemos destacado con flechas corresponden a medios de comunicación.

Problema 4
Saber qué páginas utilizan determinadas palabras clave como parte del anchor text

Contexto El anchor text o texto de anclaje es otro factor SEO importante. El anchor text es la parte de texto en un hiperenlace que, al hacer clic sobre él, abre una nueva página (como en el anterior enlace con la palabra “hiperenlace” o en el texto “haz clic aquí” de este otro enlace: haz clic aquí).

Es un factor muy interesante del SEO por varias razones. En primer lugar, Google considera que el texto del anchor text puede ser muy revelador sobre el contenido de la página a la cual enlaza (salvo que sea un enlace tipo “haz clic aquí”, que en este caso no dice nada).

De hecho, según Google, este texto puede llegar a considerar aún más revelador que el texto que aparece en el contenido de la propia página enlazada. En un análisis SEO podemos estar interesados en saber desde qué páginas se utilizan determinada palabra clave para enlazar a otros sitios. De este modo podemos conocer mejor cómo es la “vecindad” de un sitio, o de un determinado tema, o sea qué páginas se enlazan entre sí para una determinada palabra clave, o cómo son las páginas que nos enlazan usando nuestra marca (nombre del medio, por ejemplo).  En concreto, podemos saber  qué páginas usan como anchor text, por ejemplo, el nombre de nuestro medio de comunicación, y a qué páginas concretas del mismo enlazan.

Formulario para el problema 4

En 1 vemos que queremos saber algo sobre páginas que usan o bien la palabra clave barcelona o bien la palabra clave turismo o bien hoteles (o todas a la vez). En 2 es donde hemos activado la opción correspondiente para que las busque en el anchor text.

Páginas de resultados del problema 4

En 1, el operador de Google que se ha activado para esta búsqueda. En el resto de la captura tenemos una vista de parte de las primeras páginas que en sus anchor text incluyen alguna de las palabras clave que hemos decidido estudiar. Naturalmente, podríamos haber elegido conocer qué páginas usan uno solo de los términos, etc. O podemos combinarlos con un AND en lugar de un OR, etc.

Combinaciones con uso de sintaxis directa

Podemos combinar algunos de estos operadores, especialmente si usamos la sintaxis de búsqueda de Google en forma directa en lugar de confiar exclusivamente en el formulario.  

Nada nos impide usar la caja de la búsqueda simple para entrar directamente los parámetros en la forma, por ejemplo:

web museos site:edu

La ecuación de búsqueda anterior, usando sintaxis directa, nos entregaría una lista de las página mejor posicionadas que tratan sobre webs de museos y que se han publicado en servidores de universidades. Probablemente encontraremos estudios de calidad y seguramente muy interesantes para nosotros si estamos vinculados a algún estudio o análisis del SEO de museos.

La cuestión es que gracias al uso de la sintaxis directa podemos investigar en SEO con mucha más facilidad. Ahora bien, para esto hemos de saber un par de cosas: la primera es que no hay una guía completa oficial (algo que nunca entenderé), ni en el propio formulario ni en las páginas de documentación oficiales de Google, que explique cuáles son los operadores y como se pueden combinar entre ellos.

No obstante, y a pesar de Google, lo que sabemos es lo siguiente:

A partir de aquí, vamos a mostrar dos posibles casos:

Caso 1: Cómo saber qué páginas han recibido optimización SEO para una o más palabras clave

inurl:realidad virtual intitle:realidad virtual

La búsqueda anterior nos informará de cuáles son las páginas sobre realidad virtual que han sido optimizadas para el SEO ya que la palabra clave figura tanto en la palabra en la URL como en el título (h1) de la página. Si estamos trabajando el SEO de un sitio sobre realidad virtual, nos puede interesar saber cuáles y cómo son esas páginas, porque van a formar parte de las páginas con la que tendremos que competir.

Caso 2: Cómo encontrar páginas optimizadas para una palabra clave en un dominio determinado

 intitle:realidad virtual site:elpais.com

En este caso, podemos estar interesados en saber qué páginas de un medio determinado han utilizado la palabra clave en el título de sus noticias. Lógicamente, nos podría interesar saber lo mismo de toda una clase de dominios (.edu, .com, .es, etc.) o de nuestro propio dominio.

Footprints y más posibilidades

Otras combinaciones de operadores que se usan mucho últimamente en el SEO, y con un propósito muy determinado, se denominan footprints. Un uso habitual es para encontrar foros de un determinado tema en los que poder dejar comentarios y con ellos un enlace (que es el verdadero propósito). La siguiente podría ser una búsqueda de este tipo:

allintitle: realidad virtual foro

Hay aún usos más curiosos (¿más maliciosos?). Algunos analistas apuntan que búsquedas usando frases como “plan de negocios” o “auditoria SEO”, etc., o incluso “confidencial”, combinado con el filetype:doc y un dominio determinado puede proporcionar, efectivamente, información confidencial de la competencia.

Debo confesar que ni siquiera he intentado hacer pruebas en este terreno, así que nada puedo afirmar, ignoro si funcionan o no (y no quiero saberlo). Pero me sirve para recordar a todos que hay que tener cuidado con la información disponible en el servidor que puede indizar Google (para eso está el archivo robots.txt como primera y simple medida, pero no garantiza gran cosa).

Un ejemplo real de investigación con el uso de la búsqueda avanzada

Recientemente, junto con dos colegas, Carlos Lopezosa y Carlos Gonzalo, ambos investigadores del Grupo DigiDoc, hemos publicado un artículo reciente que es el resultado de una investigación sobre construcción de enlaces en medios de comunicación y transmisión de autoridad. Para poder encontrar las noticias que nos permitieron la investigación, fue necesario desarrollar un footprint, esto, es una búsqueda avanzada con sintaxis directa. Gracias a este footprint, encontramos las 150 noticias cuyo análisis permitió reforzar nuestros resultados.

Se puede descargar el pdf con el artículo completo desde estos enlaces:

La referencia completa del artículo para los interesados:

Lopezosa, Carlos; Codina, Lluís; Gonzalo-Penela, Carlos (2018). “Off-page SEO and link building: General strategies and authority transfer in the digital news media”. El profesional de la información, v. 28, n. 1, e280107. https://doi.org//10.3145/epi.2019.ene.07

Existe software de análisis SEO altamente especializado que puede llevar a cabo los anteriores análisis y otros mucho más complejos. Pero a veces necesitamos respuestas rápidas, y saber manejar operadores como los anteriores nos puede ahorrar trabajo cuando necesitamos hacer comprobaciones rápidas y simples.

Además, no siempre trabajamos en un contexto en el que nos podamos permitir pagar esta clase de herramientas. La docencia del SEO en la clase en un Grado en Periodismo, o en un Máster de Buscadores puede ser dos ejemplos entre otros muchos, como las necesidades de jóvenes investigadores para su tesis doctoral, sería otro y así los podríamos multiplicar.

Además, a todo profesional, ya sea de la Comunicación, del SEO o del Periodismo le conviene conocer lo mejor posible estas posibilidades primero para entender mejor su entorno, y segundo para saber obtener soluciones rápidas cada vez que sea necesario. Y, por favor, si me apuran, incluso para demostrar que es un buen profesional.

Las posibilidades no se agotan aquí (ver por ejemplo, estos experimentos que también usan operadores de Google), y la imaginación y las necesidades del profesional pueden encontrar muchas otras, sin mencionar los ya comentados footprints, tan utilizados ahora en la investigación de SEO, aunque tienen un uso que de momento, miramos con cierta distancia por su potencial para prácticas dudosas. Pero si en nuevas revisiones nos convencen, hablaremos con mayor detenimiento de ellos en otro artículo.

Para saber más

Icono inicio: Icon made by Vectors Market from www.flaticon.com

This content was originally published here.

Edición Febrero 2019 A continuación, mostraremos cuatro casos concretos  de utilización de la búsqueda avanzada de Google para investigar en SEO y en cibermedios. Para ello usaremos ejemplos destinados al análisis de medios de comunicación, pero obviamente se pueden aplicar a cualquier clase de sitio web llevando a cabo las extrapolaciones correspondientes. Lo mejor es que…

Edición Febrero 2019 A continuación, mostraremos cuatro casos concretos  de utilización de la búsqueda avanzada de Google para investigar en SEO y en cibermedios. Para ello usaremos ejemplos destinados al análisis de medios de comunicación, pero obviamente se pueden aplicar a cualquier clase de sitio web llevando a cabo las extrapolaciones correspondientes. Lo mejor es que…

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *