Contando palabras: PLAYA y CENTRO en el texto de los anuncios

Este análisis está desarrollado a partir de uno de los ejericios realizados durante el taller. Ver [estudio original]( ). Equipo formado por: Javier de La Torre Vera @Javidelatorre96, Miguel Benito Boillos, Carla Silva Otero, Rafael Monterde Díaz @rafa_monty.

Referencias a “playa” y “centro” en los anuncios de Airbnb de Valencia

  • ¿Qué anuncios Airbnb hacen referencia al “centro”?
  • ¿Cuáles lo hacen a la “playa”?

Describir el anuncio

El anfitrión dispone, como una de sus estrategias de marketing más efectivas, de la posibilidad de incluir en las descripciones de sus inmuebles anunciados determinados mensajes que incluyan los conceptos identificativos del barrio o la zona. De esta manera, esperaríamos encontrarnos una especialización y diferenciación de los anuncios de cada distrito. Así, tendríamos que los barrios marítimos incluyen conceptos como “playa” o “mar” o que los céntricos suelen precisamente enfatizar su condición de “corazón” de la ciudad o de lugar “céntrico” o asimilados.

Este ejercicio analiza las palabras que contiene cada anuncio. Para ello usamos un contador de palabras de DataBasic.io con las descripciones de los anuncios en cada uno de los distritos. Como una parte de los anuncios está en español y otros en inglés, nos daba problemas a la hora de eliminar las stopwords más comunes, como “de”, “el”, “en” o “por”. Por ello, decidimos traducir las descripciones.

Nota: el idioma en que aparece un anuncio depende seguramente del idioma en que esté configurado el navegador y de si el anuncio está traducido (también se apuntó en el taller la posibilidad de que sirva el lenguaje en función de la ubicación de la IP). Al estar trabajando con la base de datos de InsideAirbnb, pensamos que los anuncios traducidos al inglés aparecerán en inglés.

Unas vez traducidas usando Google Sheets vimos que las palabras más repetidas eran muy genéricas y que no eran representativas de las zonas donde se encontraban:

Palabras más repetidas que aparecen en los anuncios de la Ciutat Vella. Herramienta: DataBasic.io

Palabras más repetidas que aparecen en los anuncios de la Ciutat Vella. Herramienta: DataBasic.io

Lo que sí vimos es que la palabra centro se repetía en casi todos los anuncios. De hecho, las palabras centro y playa, son una de las más representativas de la ciudad de Valencia y que observamos que aparecían en muchos de los anuncios de cada uno de los distritos. Decidimos cambiar el planteamiento original del análisis a realizar, pasando de encontrar las palabras que contiene cada anuncio a una búsqueda del tipo: “buscar la palabra centro y la palabra playa en cada uno de los distritos”.

A partir de una tabla dinámica, que se puede hacer con cualquier programa de hojas de cálculo como Libreoffice obtuvimos el número de anuncios por distrito en los que aparecían las palabras “centro” y “playa”. Después calculamos el porcentaje de los pisos turísticos en los que aparecían las palabras estas palabras respecto al total de los anuncios de dicho distrito.

Si vemos estos datos sobre un mapa de distritos:

En general, hay más menciones a la palabra CENTRO que a PLAYA. Se observa que el porcentaje de aparición de la palabra “playa” era mayor en las zonas cercanas a la costa que en las zonas más alejadas de la playa, en cambio, con la palabra centro sucedía justo lo opuesto. La palabra “centro” aparecía más en las zonas alejadas del centro que en el propio centro, podría concluirse que se quiere remarcar la propia cercanía al centro cuando se está ligeramente alejado de este, en esos anuncios aparecían mucho expresiones como “a 5 minutos del centro”.

¿Y si miramos en el título?

Si se analiza título se ve más claramente la diferencia espacial. En el título caben muchas menos palabras que en la descripción, lo que permite ver una especialización por zonas más acentuada. {{ //* ya que entendemos que los anfitriones o gestores escogen con mucho más cuidado las palabras que incluyen en el título del anuncio, que tendrá mucha más visibilidad que la descripción: *// }}

Casos como el distrito del puerto, Poblas Maritims, que engloba la zona de puerto y de playa, quedan con el porcentaje más alto para la palabra “playa”.

Mejor por barrios

Si usamos el barrio, un área menor que el distrito, las diferencias son todavía más marcadas:

Futuros pasos

En una segunda fase de este estudio se podría, por ejemplo, hacer un análisis más pormenorizado sobre expresiones más que sobre una palabra. Por ejemplo distinguir “centro” de aquellas expresiones como “cerca del centro” o “a 5 min a pie del centro”. De esta manera, los mapas se ajustarían más a la realidad. También, para evitar que un distrito se rellene automáticamente entero, sería más preciso señalar con un punto los apartamentos que contienen la palabra centro y dibujar polígonos de influencia.

Datos

Anuncios en AirBnb de Valencia scrapeados por InsideAirbnb.

Referencias

Referencias: Detect and Translate Content in Google Sheets https://infoinspired.com/google-docs/spreadsheet/detect-and-translate-content-in-google-sheets/