setwd("C:/DATOS/DOCUMENTACION/DOCTORADO/MODELOS/R/REGRESION") source('multipleRegressionFunctions.txt', local=TRUE) 'EJERCICIO 7.1 'EXPLICACION DE DATOS 'Fuente: Elaboración propia 'Descripción: '100 datos de precios de viviendas y sus características 'Primera columna : precios de viviendas en euros 'Segunda columna : superficie en metros cuadrados 'Tercera : numero de cuartos de baño 'Cuarta: número de dormitorios 'Quinta: número de plazas de garaje 'Sexta: edad de la vivienda 'Séptima: 1 buenas vistas ' =0 vistas corrientes 'A: CARGA DE DATOS DATOS <- read.table("C:/DATOS/DOCUMENTACION/DOCTORADO/MODELOS/R/REGRESION/DATOS_LIBRO/preciocasas.dat",header=F,sep="", quote="") Y = as.numeric(DATOS$V1) X2 = as.numeric(DATOS$V2) X3 = as.factor(DATOS$V3) X4 = as.factor(DATOS$V4) X5 = as.factor(DATOS$V5) X6 = as.numeric(DATOS$V6) X7 = as.factor(DATOS$V7) DATOS_ESTUDIO <- data.frame(Y,X2,X3,X4,X5,X6,X7); DATOS_ESTUDIO pairs(DATOS_ESTUDIO) TY <- "Precio de vivienda, PV" TX2 <- "Superficie, S" TX3 <- "Numero de cuartos de baño, NB" TX4 <- "Numero de dormitorios, ND" TX5 <- "Numero de plazas de garage, NPG" TX6 <- "Edad de la vivienda, EV" TX7 <- "Calidad de vistas, CV" TITULOS_ESTUDIO <- data.frame(TY,TX2,TX3,TX4,TX5,TX6,TX7) TITULOS_ESTUDIO 'B: UNIVARIATE EDA viewEDA(DATOS_ESTUDIO,TITULOS_ESTUDIO) viewEDA(DATOS,TITULOS_ESTUDIO) 'CONCLUSIONES: 'C: CREATE MODEL REGRESSION <- createSRM(Y,X) REGRESSION 'CONCLUSIONES 'Los resultados de la regresión son: ' NOTA: Si se detectan datos outliers, es necesario eliminarlos del modelo simpleOutlierDetection(Y,1) simpleOutlierDetection(X,1) 'NOTA: Una vez tengo detectado donde estan los datos OUTLIERS que afectan al modelo, se vuelve a generar el modelo. Y2 = getSubconjunto(Y,1,31) X2 = getSubconjunto(X,1,31) viewEDA(Y2,X2,TY,TX) 'CONCLUSIONES REGRESSION2 <- createSRM(Y2,X2) REGRESSION2 'CONCLUSIONES 'Los resultados de la regresión son: