Normalización y análisis exploratorio de datos inmobiliarios web
- Del Río, Juan Pablo (CONICET/LINTA-CIC/FaHCE-UNLP)
- Dioguardi, Felipe (LIFIA-UNLP)
- May, Marcos (LINTA-CIC/FaHCE-UNLP)
- Torres, Diego (LIFIA-UNLP)
Esta ponencia se enmarca en el Proyecto “Observatorio de valores del suelo e instrumentos de financiamiento del desarrollo urbano” (Programa Impactar - MinCyT). Con el propósito de generar líneas de base para el cálculo de plusvalías urbanas, el objetivo del proyecto es generar información sobre el comportamiento del mercado inmobiliario urbano en la Provincia de Buenos Aires. Para ello se analizan los anuncios de venta de inmuebles en los principales portales inmobiliarios, obtenidos a través de técnicas de web scraping.
El documento presenta una identificación de los problemas que poseen estas fuentes de información, así como el proceso de curaduría y normalización de la base de datos generada a partir del scrapeo de los portales inmobiliarios y del análisis exploratorio de las principales variables obtenidas. Para ello se utiliza como entorno de trabajo el lenguaje de programación R y la herramienta de Qgis. Por último, se exponen las estrategias metodológicas en análisis para la puesta en valor de dichas matrices de datos.