Metodología del estudio de caso, scraping de SERPs y datos

La metodología parte de la selección de un grupo de búsquedas relevantes y consta de una primera fase de extracción, categorización y selección de keywords, y un segunda fase de scraping de SERPs de una o varias categorías y un posterior tratamiento estadístico de los datos para el cálculo de visibilidad y generación de gráficas. El tratamiento secundario de la captura de datos permite mapear todos los resultados visibles en SERPs vinculados a un campo semántico o nicho de búsqueda y realizar análisis sectoriales o temáticos.

El modelo aplicado en este estudio es el de Infoesfera, que divide los resultados de buscadores en función de su pertenencia a sus diferentes estratos (Estrato Superior incluye Cibermedios, Estrato Medio incluye sitios web sectoriales y otros sitios relevantes, Estrato Inferior incluye Redes Sociales y Blogosfera).


Extracción de palabras clave

La selección de consultas para ser utilizadas como palabra clave en buscadores parte de una extracción de keywords pertenecientes al campo semántico electoral  ‘Elecciones Ecuador’. Existen múltiples herramientas para la investigación de palabras clave pero nos centramos en las dos que ofrecen datos de frecuencia asociados a las keywords, por un lago Google Adwords y por el otro SEMrush.

Para la extracción de keywords relacionadas se ha aplicado el filtro de país ‘Ecuador’ y se han utilizado como simiente el término ‘elecciones ecuador’ así como los nombres de los candidatos a las elecciones presidenciales. El resultado ha sido 833 términos equivalentes a 292.960 búsquedas promedio mensuales y a 3.433.240 búsquedas durante los meses de 2016.

Las búsquedas han sido categorizadas en los siguiente siete grupos según su vinculación temática:

  1. Familia léxica ‘Elecciones‘. El grupo abarca todas las palabras clave informacionales que incluyen la base léxica o raíz –elec-:  elecciones ecuador 2017, elecciones, elecciones 2017, elecciones ecuador, electoral, elecciones presidenciales ecuador 2017, encuestas elecciones ecuador 2017, elecciones presidenciales, recinto electoral ecuador, elecciones presidenciales ecuador, elecciones en ecuador, proceso electoral, elecciones electorales, etc.
  2. Familia léxica ‘votación‘. El grupo abarca todas los términos informacionales de base léxica o raíz –vot-: voto, lugar de votacion, donde votar ecuador, donde votar, lugar de votacion ecuador, votaciones ecuador, consultar lugar de votacion ecuador, como saber donde votar, votaciones 2016, donde debo votar, donde tengo que votar, votos electorales, consulta donde votar ecuador, etc,
  3. Familia léxica ‘Elecciones-votación-histórico‘. Este grupo incluye todas las combinaciones de los grupos anteriores que incluyen un marcador temporal 199*, 200* o 201*: elecciones 2016, elecciones 2015, elecciones 2014, elecciones 2013, elecciones españa 2015, elecciones 2009, elecciones 2012, votaciones 2015, resultados elecciones 2015, elecciones 2008, elecciones 2011, etec.
  4. Consejo Nacional Electoral (CNE). El grupo abarca todas las palabras clave navegacionales que tienen como objetivo alcanzar el sitio web del CNE, el consejo nacional electoral ecuatoriano: cne, cne ecuador, www cne gob ec, tribunal supremo electoral ecuador, cne consulta, cne ecuador consulta lugar de votacion, cne domicilio electoral, cne lugar de votacion, cne quito, consejo nacional electoral donde votar, padron electoral, etc.
  5. Candidatos a la presidencia. Los nombres de los ocho candidatos y la evolución de su frecuencia de búsqueda es una de las secciones principales del informe centrado en la creación de identidad digital de políticos durante la campaña y los medios que alcanzan más visibilidad en sus respectivas SERPs: guillermo lasso, lenin moreno, abdala bucaram, cynthia viteri, paco moncayo, ivan espinel, abdalá bucaram, lenín moreno y patricio zuquilanda.
  6. Políticos y personalidades. La simiente de los nombres de los ocho candidatos han recuperado nombres de otras personalidades ecuatorianas, en especial políticos, periodistas y deportistas, siendo estos dos últimos grupos clasficados en un subgrupo y extraído de la muestra: rafael correa, jorge glas, jaime nebot, mauricio rodas, rafael correa delgado, isabel noboa, correa rafael, obras de rafael correa, vinicio alvarado, luis noboa naranjo, alberto acosta, etc.
  7. Audiencia. Cualquier otra palabra clave informacional relacionada con ‘elecciones’ o ‘votación’ pero que incluyen modificadores de búsqueda como nombres de país o marcadores de fecha correspondientes a elecciones de otros países (es de especial mención las búsquedas realizadas desde Ecuador sobre las elecciones generales españolas de 2016): noticias ecuador, ecuador tv, ecuavisa noticias, elecciones eeuu, emprendedores ecuatorianos, elecciones peru, ecuador news, encuestas presidenciales, elecciones en peru, elecciones españa, etc.

Los diversos informes giran en torno a los siete tipos de búsquedas que sirven de título de las diferentes secciones. A través de cada grupo de búsquedas, como se aprecia, se pueden establecer diferentes tipos de informes, en especial de visibilidad, de Identidad digital y de optimización de cualquier sitio aparecido en la muestra.


 

Scrapeado de SERPs y análisis

La extracción de resultados de búsqueda de buscadores, las conocidas por SERPs por sus sigla inglesas, se realiza con cualquier herramientas de poscionamiento SEO cargando un listado de palabras clave y seleccionando una versión nacional de Google. Para este ejercicio se han utilizado las herramientas Scrapebox y AWR Cloud. y se han seleccionado los motores Google.com.ec en sus versiones desktop y móvil.

Una vez seleccionadas las palabras clave más relevantes del nicho de búsqueda se extraen los primeros  diez resultados orgánicos (Top10) de cada búsqueda con una periodicidad semanal. Como resultado conoceremos la posición exacta y relativa de los sitios web aparecidos en cualquiera de estas SERPs del nicho de búsqueda elecciones Ecuador.

El posterior análisis de las SERPs de uno o varios grupo de palabras clave representativas permiten identificar todos los sitios web aparecidos en los resultados y categorizarlos en función de su posición en la Infoesfera. Cada tipología de palabras clave seleccionadas es tratada en su sección correspondiente.

  1. Selección de búsquedas informacionales. Las búsquedas informacionales nos permite medir la composición de cualquier SERP de un sector determinado.
  2. Selección de búsquedas  navegacionales. Nos permite medir la composición la identidad digital de las empresas sectoriales, en este caso de los resultados asociados a la búsqueda navegacional CNE.
  3. Selección de búsquedas de candidatos. Las búsquedas de identidad digital nos permite describir los medios usados por los candidatos durante la campaña para generar su perfil en la SERP resultado de utilizar su nombre. También podemos medir a través del CTR cuáles son los sitios que más tráfico han conseguido.
  4. Otros grupos. Se pueden aplicar cálculos estadísticos de visibilidad en buscadores a cualquier otro cluster de keywords con vinculación semántica o léxica.

La posición en los resultados, además de determinar la visibilidad en SERPs, también determinan el impacto de los contenidos en los usuarios a través del CTR ya que se puede calcular el porcentaje de clics recibidos por cada sitio en función de su posición en la SERP. A las tablas de resultados se han añadido la estimación de probabilidad de clic permitiendo cálculos sobre cualquier resultado web o conglomerado asociado al nicho de búsqueda elecciones Ecuador.

 

Fuentes:

Google Organic Click-Through Rates in 2014 <https://moz.com/blog/google-organic-click-through-rates-in-2014>

The Value of Google Result Positioning <https://chitika.com/google-positioning-value>