Matemáticas Preguntas Resueltas PDF

ESCRIBE AQUÍ LO QUE DESEAS BUSCAR

ESTADISTICA BIDIMENSIONAL EJERCICIOS RESUELTOS DE SECUNDARIA–MATEMATICA 4 ESO PDF

ESTADÍSTICA BIDIMENSIONAL E J E R C I C I O S P R O P U E S T O S Copia y completa la siguiente tabla. ⇒ a) ¿Qué porcentaje de datos presentan la característica B en la variable unidimensional X? b) ¿Qué porcentaje de datos presentan la característica c en la variable unidimensional Y? c) ¿Qué porcentaje de datos presentan la característica (B, c) en la variable bidimensional (X, Y)? a) Porcentaje de datos que presenta la característica B en la variable unidimensional X 1 6 6 100 37,5% b) Porcentaje de datos que presenta la característica c en la variable unidimensional Y 1 7 6 100 43,75% c) Porcentaje de datos que presenta la característica (B, c) en la variable bidimensional (X, Y) 13 6 100 18,75% Observa la siguiente variable bidimensional. a) Representa la nube de puntos. b) Indica el tipo de correlación. a) La nube de puntos es la siguiente: b) Como al aumentar el número de cigarrillos consumidos aumenta el índice de mortalidad, la correlación es positiva. N.° de cigarrillos consumidos al día Indice de mortalidad %0 2 0,2 O 4 6 8 10 12 14 16 18 20 22 24 26 28 30 0,4 0,6 0,8 1 1,2 1,4 1,6 1,8 2 15.2 15.1 Una variable bidimensional viene dada por la siguiente tabla. a) Representa el diagrama de dispersión. b) Indica el tipo de correlación. a) La nube de puntos es la siguiente: b) Como al aumentar el número de horas de estudio disminuye el número de horas de televisión, la correlación es negativa. Una variable bidimensional viene dada por la siguiente tabla. a) Calcula las medias y las desviaciones típicas de las variables X e Y. b) Calcula la covarianza de la variable (X, Y). Consideramos la siguiente tabla: a) x 6 5 2 12,40 y 4 5 0,8 sX 11 5 34 12,42 8,5463 sY 4, 5 78 0,82 0,5621 b) sXY 73 5 ,5 12,4 0,8 4,78 15.4 N.° de horas de estudio N.° de horas de televisión 1 1 O 2 3 4 5 2 3 4 5 15.3 N.o de horas de estudio 1 2 3 4 5 N.o de horas de televisión 5 4 3 3 1 X 3 6 8 20 25 Y 0,2 0,4 0,5 1,2 1,7 N.º de cigarrillos Índice de mortalidad xi 2 yi 2 xiyx i i yi 3 0,2 9 0,04 0,6 6 0,4 36 0,16 2,4 8 0,5 64 0,25 4 20 1,2 400 1,44 24 25 1,7 625 2,89 42,5 62 4 1134 4,78 73,5 Dados los siguientes valores de una variable bidimensional: a) Halla las medias y las desviaciones típicas de las variables X e Y. b) Calcula la covarianza de la variable (X, Y). Consideramos la siguiente tabla: a) x 4 9 5 5 y 3 9 2 3,5v sX 28 9 5 52 2,582 sY 13 9 0 3,v52 1,3426 b) sXY 16 9 0 5 3,5v 0 Dada la siguiente variable bidimensional, calcula el coeficiente de correlación. Consideramos la siguiente tabla: x 4 7 8 6,8571 y 3 7 3 4,7143 sX 36 7 4 6,85712 2,2316 sY 20 7 1 4,71432 2,5475 sXY 23 7 1 x y 0,6736 r s s X X s Y Y 0,1185 15.6 15.5 X 1 2 3 4 5 6 7 8 9 Y 5 4 3 3 1 3 4 6 3 X 3 5 6 7 8 9 10 Y 2 4 10 5 2 6 4 xi yi xi 2 yi 2 xiyi 1 5 1 25 5 2 4 4 16 8 3 3 9 9 9 4 3 16 9 12 5 1 25 1 5 6 3 36 9 18 7 4 49 16 28 8 6 64 36 48 9 3 81 9 27 45 32 285 130 160 xi yi xi 2 yi 2 xiyi 3 2 9 4 6 5 4 25 16 20 6 10 36 100 60 7 5 49 25 35 8 2 64 4 16 9 6 81 36 54 10 4 100 16 40 48 33 364 201 231 Calcula el coeficiente de correlación e interprétalo. Consideramos la siguiente tabla: x 9 7 2 13,1429 y 3 7 5 5 sX 13 7 66 13,14 292 4,7336 sY 20 7 3 52 2 sXY 51 7 8 x y 8,2855 r s s X X s Y Y 0,8752 Como r 0,8752 ⇒ las variables tienen una correlación positiva media. Una variable bidimensional viene dada por la siguiente tabla. a) Calcula el coeficiente de correlación. b) Halla la recta de regresión. c) Si x 12, ¿cuánto valdrá y? d) ¿Es fiable esta predicción? Justifícalo. a) x 11 8 6 14,5 y 40 8 7 50,875 sX 17 8 56 14,52 3,0414 sY 20 8 819 50,8 75 2 3,7562 sXY 58 8 14 x y 10,9375 r s s X X s Y Y 0,9574 b) y y s s X 2 X Y (x x ) ⇒ y 50,875 9 1 , 0 2 , 5 9 0 3 1 75 (x 14,5) ⇒ y 50,875 1,1824(x 14,5) c) Para x 12 ⇒ y 50,875 1,1824(12 14,5) ⇒ y 53,831 d) La predicción es fiable pues el valor del coeficiente de correlación, 0,9574, está muy próximo a 1. 15.8 15.7 X 6 8 11 14 15 18 20 Y 3 4 2 5 6 7 8 xi yi xi 2 yi 2 xiyi 6 3 36 9 18 8 4 64 16 32 11 2 121 4 22 14 5 196 25 70 15 6 225 36 90 18 7 324 49 126 20 8 400 64 160 92 35 1366 203 518 xi yi xi 2 yi 2 xiyi 13 54 169 2916 702 14 52 196 2704 728 11 54 121 2916 594 13 53 169 2809 689 14 53 196 2809 742 14 50 196 2500 700 15 49 225 2401 735 22 42 484 1764 924 116 407 1756 20 819 5814 X 13 14 11 13 14 14 15 22 Y 54 52 54 53 53 50 49 42 R E S O L U C I Ó N D E P R O B L E M A S Halla, usando la recta de regresión, los valores de Y para 2, 4, 10, 12, 14, 16 y 18 años. Comprueba que se aproximan lo suficiente a los valores reales y calcula el error relativo cometido. La recta de regresión es: y 138,29 5,605(x 10,86). Para x 20 ⇒ y 88,62970 ⇒ Error relativo 90 9 8 0 8,6297 0,0152 Para x 40 ⇒ y 99,83970 ⇒ Error relativo 100 10 9 0 9,8397 1,603 10 3 Para x 10 ⇒ y 133,4697 ⇒ Error relativo 130 1 1 3 3 0 3,4697 0,0267 Para x 12 ⇒ y 144,67970 ⇒ Error relativo 145 1 1 4 4 5 4,6797 2,2090 10 3 Para x 14 ⇒ y 155,88970 ⇒ Error relativo 155 1 1 5 5 5 5,8897 5,74 10 3 Para x 16 ⇒ y 167,09970 ⇒ Error relativo 170 1 1 7 6 0 7,0997 0,0171 Para x 18 ⇒ y 178,30970 ⇒ Error relativo 178 1 1 7 7 8 8,3097 1,7399 10 3 ¿Qué ocurre al tomar pocos valores para construir la recta de regresión? Halla la recta usando sólo las tallas correspondientes a los 10 y 12 años. Comprueba si la aproximación es mejor o peor que en el caso anterior. Al tomar pocos valores obtendremos una aproximación peor. Calculemos la recta de regresión para las tallas correspondientes a los 10 y 12 años. Para ello, consideremos la siguiente tabla: x 2 1 2 1 11 y 27 2 5 137,5 sXY 30 2 40 x y 7,5 s2 X 24 2 4 112 1 Luego la ecuación de la recta de regresión será: y y s s X 2 X Y (x x ) ⇒ y 137,5 7 1 ,5 (x 11) ⇒ y 137,5 7,5(x 11) Si hallamos los valores de Y para 2, 4, 10, 12, 14, 16 y 18 usando la ecuación de esta recta de regresión, comprobaremos que, efectivamente, las aproximaciones son peores que en el caso anterior. 15.10 15.9 xi yi xi 2 yi 2 xiyi 10 130 100 16 900 1300 12 145 144 21 025 1740 22 275 244 37 925 3040 A C T I V I D A D E S E J E R C I C I O S P A R A E N T R E N A R S E Variables bidimensionales, dependencia y diagramas de dispersión Sea la siguiente tabla de doble entrada. Copia y completa las siguientes frases. a) La frecuencia absoluta de (5, 11) es… b) El número de puntos del tipo (3, y) es… c) El número de puntos del tipo (x, 13) es… d) El punto de mayor frecuencia absoluta es… e) El punto ……………………… tiene frecuencia 4. a) 3 b) 8 c) 7 d) (7, 11) e) (5, 4) Elabora una tabla de doble entrada a partir de la siguiente variable bidimensional. a) ¿Qué porcentaje de datos representa el valor (6, 18) dentro del conjunto de datos de la variable (X, Y)? b) Calcula x , sX. a) 1 4 2 100 33,3v% b) x 8 1 5 2 7,08 sX x 2 7,08 2 6 2,58 50,13 1 2,45 3,53 1 18 144 300 288 12 xi 2 fi N 1 6 24 30 24 12 xifi N 15.12 15.11 X 2 3 5 7 Total Y 4 3 1 4 1 9 7 1 3 1 1 6 11 1 1 3 5 10 13 1 3 1 2 7 Total 6 8 9 9 32 X 1 3 6 10 12 Total Y 5 1 1 10 2 2 18 4 4 22 3 3 25 2 2 Total 1 2 4 3 2 12 X 1 3 6 10 12 Y 5 10 18 22 25 fi 1 2 4 3 2 Determina la media y la desviación típica de las variables X e Y, y representa la nube de puntos de siguiente distribución. ¿Qué tipo de relación existe entre ambas variables? x 2,9 sX x 2 2,92 1 5,8 8,41 7 ,39 2,7 y 5,25 sY y 2 5,25 2 3 4,7 27,6 2,7 Como se observa en el diagrama de dispersión, las variables no están relacionadas. Estamos ante un caso de independencia. Indica qué tipo de relación tienen las variables bidimensionales (X, Y1); (X, Y2), y (X, Y3). (X, Y1) → Dependencia funcional ⇒ y 2x 3. (X, Y2) → Correlación negativa y fuerte. (X, Y3) → Correlación positiva y débil. 15.14 1 1 O Y X 8 63 325 539 729 48 yi 2 fi N 8 21 65 77 81 48 yifi N 0 20 240 180 320 48 xi 2 fi N 0 10 60 30 40 48 xifi N 15.13 X 0 2 4 6 8 Y 1 3 4 1 3 3 3 1 5 6 2 4 1 7 5 4 2 9 4 4 1 X 3 1 2 4 5 7 Y1 9 5 1 5 7 11 Y2 4 3 2 1 0 1 Y3 2 2 1 1 5 3 Covarianza y correlación Asocia cada índice de correlación con el diagrama de dispersión correspondiente. r 1 r 0,92 r 0,25 r 0,78 a) c) r 0,92 r 0,25 b) d) r 0,78 r 1 La siguiente tabla muestra los valores de una variable bidimensional. a) Calcula el coeficiente de correlación. b) Indica el tipo de correlación que existe entre ambas variables. a) r s s X X s Y Y x 2, 5 86 0,5720 y 3, 5 18 0,636 sXY 0,572 0,636 0,5778 0,3638 0,2140 sX 0,57 2 0 ,6772 0,32 72 0,5916 sY 0,636 2 0 ,6328 0,40 47 0,4778 r 0,591 0 6 ,2 14 0 0 ,4778 0,7572 b) Entre las dos variables existe una correlación positiva media. 0,1089 0,3969 2,4025 0,2116 0,0441 5 0,0625 1,7424 1,5376 0,0289 0,0144 5 0,08 0,83 1,92 0,078 0,025 5 15.16 O X Y O X Y O X Y O X Y 15.15 X 0,25 1,32 1,24 0,17 0,12 Y 0,33 0,63 1,55 0,46 0,21 Dado el siguiente diagrama de dispersión: a) Elabora una tabla de doble entrada. b) ¿Qué tipo de correlación tienen las dos variables? ¿Fuerte o débil? ¿Positiva o negativa? c) ¿Qué coeficiente de correlación de los indicados se ajustaría mejor a la nube de puntos r 0,91, r 0,35, r 0,92? Compruébalo calculando numéricamente dicho coeficiente. a) b) Correlación positiva y fuerte. c) Se ajusta más r 0,92. r s s X X s Y Y x 4,3 y 4,5 sXY 4,3 4,5 2 1 6 1 0 19,35 4,29 sX 4,3 2 2 2,27 18,49 3 ,8 1,9 sY 4,5 2 2 6,18 20,25 5 ,93 2,43 r 1,9 4 ,2 2 9 ,43 4 4 , , 6 2 1 9 7 0,929 (como ya se había intuido) 1 8 9 32 25 36 49 128 11 1 8 9 32 25 72 98 11 2 2 6 6 16 20 20 42 48 42 56 11 1 4 3 8 5 6 7 16 11 1 4 3 8 5 12 14 11 O X Y 1 1 15.17 X 1 2 3 4 5 6 7 Total Y 1 1 1 2 1 1 2 3 1 1 4 1 1 2 5 1 1 6 1 1 7 1 1 8 1 1 2 Total 1 2 1 2 1 2 2 11 La relación entre dos variables viene dada en la siguiente tabla. a) Dibuja la nube de puntos asociada a la tabla. b) Elabora una tabla de doble entrada. c) Halla x , y , sXY. d) Calcula el coeficiente de correlación lineal. ¿Cómo es la correlación? a) b) c) x 4 8 4 5,5 y 19 8 7 24,625 sXY 5,5 24,625 13 8 19 135,4375 29,4375 d) r s s X X s Y Y sX 5,5 2 3 5,5 30,25 5 ,25 2,2913 sY 24,625 2 1 67,734 4 12,9512 r 2,291 2 3 9, 43 1 7 2 5 ,9512 0,9920 La correlación es positiva y muy fuerte. 16 81 256 576 900 1156 1444 1764 8 4 9 16 25 36 49 64 81 8 8 27 64 120 180 238 304 378 8 1 4 O Y X 15.18 X 2 3 4 5 6 7 8 9 Y 4 9 16 24 30 34 38 42 X 2 3 4 5 6 7 8 9 Total Y 4 1 1 9 1 1 16 1 1 24 1 1 30 1 1 34 1 1 38 1 1 42 1 1 Total 1 1 1 1 1 1 1 1 8 Rectas de regresión y estimaciones Observa el siguiente diagrama de dispersión y calcula la recta de regresión. Consideramos la siguiente tabla: x 5 1 0 0 5 y 1 1 1 0 0 11 s2 X 2 1 8 0 2 52 3,2 sXY 5 1 1 0 8 x y 3,2 Recta de regresión: y 11 1(x 5) ⇒ y 11 (x 5) ¿A qué nube de puntos se ajustaría mejor la recta de regresión de ecuación y 3x 1? Justifica respuesta. Se ajusta mejor a la distribución B. Para comprobarlo, consideramos la siguiente tabla: Obsérvese que las Y de la distribución B son muy semejantes a las que proporciona la recta de regresión. O X Y 1 1 O X Y 1 2 a) b) 15.20 O X Y 2 4 15.19 xi yi xiyi xi 2 yi 2 2 17 34 4 289 4 5 20 16 25 4 13 52 16 169 6 11 66 36 121 7 7 49 49 49 3 15 45 9 225 4 9 36 16 81 6 9 54 36 81 6 15 90 36 225 8 9 72 64 81 50 110 518 282 1346 X 1 2 3 4 Y 5 6 10 11 y 3x 1 4 7 10 13 En la siguiente variable bidimensional: a) Halla su centro de masas y su covarianza. b) Calcula su coeficiente de correlación lineal. ¿Tiene sentido calcular su recta de regresión y realizar predicciones? c) Calcula su recta de regresión. d) Si el valor de la variable X es 15, ¿cuál es el valor estimado de la variable Y? e) Si el valor de la variable Y es 13, ¿cuál es el valor estimado de la variable X? a) Centro de masas (x , y ) x 3 1 8 0 3,8 y 2 1 2 0 5 22,5 sXY 3,8 22,5 7 1 2 0 0 85,5 13,5 b) sX 3,8 2 1,7205 sY 22,5 2 10,3078 r 1,720 5 1 3 1 , 0 5 ,3078 0,7612 Es una correlación media, por lo que sí tendría sentido calcular predicciones. c) Recta de regresión: y y s s X 2 X Y (x x ) ⇒ y 22,5 2 ,9 1 6 3 0 ,5 1 (x 3,8) ⇒ y 22,5 4,5608(x 3,8) d) x 15 ⇒ y 22,5 4,5608 (15 3,8) 28,5811 e) y 13 ⇒ 13 22,5 4,5608 (x 3,8) ⇒ 9,5 4,5608x 17,33104 ⇒ x 5,8830 2025 900 900 625 625 100 400 225 100 225 10 1 4 9 16 9 49 36 9 16 25 10 45 60 90 100 75 70 120 45 40 75 10 15.21 X 1 2 3 4 3 7 6 3 4 5 Y 45 30 30 25 25 10 20 15 10 15 C U E S T I O N E S P A R A A C L A R A R S E Contesta verdadero (V) o falso (F) a las siguientes afirmaciones. a) Si r 0,34, las estimaciones con la recta de regresión son poco fiables. b) Dos variables no correlacionadas X e Y tienen un coeficiente de correlación de 0,98. c) Dos variables X e Y relacionadas por la ecuación y 6x 7 tienen un coeficiente de correlación r 0,85. d) Una variable bidimensional de centro de masas (3; 5,5) tiene una recta de regresión que pasa por punto (3, 2). a) Verdadero b) Falso c) Falso d) Falso Si la covarianza de una distribución es negativa, ¿qué podemos afirmar tanto del coeficiente de correlación como de la pendiente de la recta de regresión? Signo de coeficiente de correlación: r s s X X s Y Y ( )( ) Signo de la pendiente: m s s X X 2 Y ¿Un coeficiente de correlación negativo significa una correlación débil de las variables? No necesariamente. Lo que significa es una nube de puntos decreciente. Si dos variables bidimensionales (X, Y), (Z, T) tienen coeficientes de correlación rXY 0,989 y rZT 0,989, ¿en cuál de ellas será más fiable hacer una estimación? En cualquiera de las dos, ya que el valor absoluto del coeficiente de correlación es el mismo. El coeficiente de correlación de una distribución bidimensional es 0,85. Si los valores de las variables se multiplican por 10, ¿cuál será el coeficiente de correlación de esa nueva distribución? rb 1 1 0 0 sX 0 1 s 0 XY sY ra En una distribución de 40 datos, la covarianza vale 2,605 y x 5,45, y 5,6. Calcula el valor de: fijxiyj sXY x y ⇒ xiyi (sXY x y ) n (2,605 5,45 5,6) 40 1325 xiyi n 15.27 15.26 15.25 15.24 15.23 15.22 Sabiendo que m es la pendiente de la recta de regresión, justifica si la siguiente igualdad es cierta. —m r — — s s Y X — La igualdad es cierta: m r s s Y X ⇒ m r s s Xs 2 X Y s s Y X La variable bidimensional (X, Y) tiene como recta de regresión y 3x 2 y r 0,75. La variable bidimensional (T, P) tiene como recta de regresión p 3t 2 y r 0,96. ¿En cuál de las dos rectas es más fiable estimar 12,5? ¿A qué valor corresponde la estimación realizada? Es más fiable en (T, P) al tener una correlación más fuerte. 12,5 3t 2 ⇒ 3t 10,5 ⇒ t 3,5 P R O B L E M A S P A R A A P L I C A R Escoge una variable de las dos primeras tablas y, a partir de la tercera, indica el tipo de relación que existe. Por ejemplo: 2. ‘Número de horas sentado al cabo del día’. A: ‘Peso del individuo’. Y: correlación positiva media. Podemos hacer las siguientes relaciones: 1CX, 2AZ, 3DW, 4BY W. Dependencia funcional. X. Correlación negativa fuerte. Y. Correlación positiva media. Z. Correlación positiva medio-fuerte. A. Peso del individuo. B. Número de horas diarias de móvil. C. Capacidad pulmonar. D. Espacio que recorro. 1. Número de cigarros fumados al día. 2. Número de horas sentado al cabo del día. 3. Velocidad a la que voy en el coche. 4. Nota en una asignatura. 15.30 15.29 s s X 2 X Y s s X X s Y Y 15.28 En una encuesta a 30 jóvenes sobre el número de libros que leen al cabo de un año han respondido lo siguiente. Y sobre el número de películas vistas en un año: a) ¿Está relacionado el número de libros que leen los jóvenes con las películas que visualizan? Considera para ello la variable bidimensional (X, Y) construida a través de los pares (xi, yi), y elabora una tabla de doble entrada. b) Dibuja el diagrama de dispersión. Indica qué tipo de correlación tienen. a) b) El siguiente diagrama expresa la relación entre la edad y el número de pulsaciones de 12 personas. Calcula la recta de regresión. Consideramos la siguiente tabla: x 4 1 4 2 3,6v y 15 1 0 2 0 125 s2 X 2 1 0 2 0 3,6v2 3,2v sXY 51 1 4 2 0 x y 30 Recta de regresión: y 125 9,3103(x 3,6v) ⇒ y 125 9,3103(x 3,6v) Edad (años) N.° Pulsaciones O 1 2 3 4 5 6 100 110 120 130 140 150 15.32 1 2 O Y 15.31 xi yi xiyi xi 2 yi 2 1 160 160 1 25 600 1 140 140 1 19 600 2 150 300 4 22 500 3 140 420 9 19 600 3 130 390 9 16 900 3 120 360 9 14 400 4 130 520 16 16 900 4 110 440 16 12 100 5 110 550 25 12 100 5 100 500 25 10 000 6 110 660 36 12 100 7 100 700 49 10 000 44 1500 5140 200 191 800 X 0 1 2 3 4 5 6 7 fi 5 6 8 3 3 2 2 1 Y 3 5 7 9 12 15 18 20 fi 5 6 8 3 3 2 2 1 X Y 0 1 2 3 4 5 6 7 Total 3 5 5 5 6 6 7 8 8 9 3 3 12 3 3 15 2 2 18 2 2 20 1 1 Total 5 6 8 3 3 2 2 1 30 Tienen una correlación positiva y fuerte. Una empresa realiza un estudio de los efectos de la publicidad sobre sus ventas. Los resultados de ese estudio en un determinado producto son los siguientes. Los datos están dados en miles de euros. a) Calcula su coeficiente de correlación. b) Obtén su recta de regresión. c) Si se invierten 15 000 euros en publicidad, ¿cuántas ventas del producto se estima que se producirán? d) Si en un determinado año se consiguen vender 60000 unidades del producto, ¿cuánto se estima que se ha invertido en publicidad ese año? a) r s s X X s Y Y x 3,5 mil € y 28,6v mil € sXY 3,5 28,6v 120,8 100,3v 20,5 sX 3,5 2 1 5,1v6 12,25 1,7078 sY 28,6v 2 12,5388 r 1,7078 2 0, 1 5 2,5388 0,9573 b) y y s s X 2 X Y (x x ) ⇒ y 28,6v 2 2 ,9 0 1 ,5 67 (x 3,5) ⇒ y 7,0284x 4,0673 c) x 15 000 15 mil € ⇒ y 7,0284 15 4,0673 109,4933 mil € 109 493,3 € d) y 60 000 60 mil € ⇒ 60 7,0284x 4,0673 ⇒ x 7,9581 mil € 7958,1 € La media de los pesos de los individuos de una población es de 72 kilogramos, y la de sus estaturas, 173 centímetros. Las desviaciones típicas son 4 kilogramos y 9 centímetros, y la covarianza es 35. a) ¿Cuál es el coeficiente de correlación? b) Calcula la recta de regresión del peso respecto a la estatura. c) ¿Cuál es el peso estimado para un individuo de 182 centímetros? a) Consideremos la variable bidimensional (X, Y) (Peso, Estatura) ⇒ r s s X X s Y Y 4 3 5 9 3 3 5 6 0,9722 b) y 173 3 1 5 6 (x 72) ⇒ y 173 2,1875 (x 72) ⇒ y 2,1875x 15,5 c) Si y 182 cm ⇒ x 182 2,1 87 1 5 5,5 76,1143 kg 15.34 81 324 1024 729 1600 2116 6 1 4 9 16 25 36 6 9 36 96 108 200 276 6 15.33 Gasto 1 2 3 4 5 6 N.o productos 9 18 32 27 40 46 En un curso de Bachillerato de 40 alumnos se ha querido estudiar la correlación de notas de las asignaturas de Lengua (X) e Historia (Y) como materias clave en itinerarios de letras. Los resultados han sido los siguientes. El coeficiente de correlación es r 0,919, y su recta de regresión, y x 0,15. a) Comprueba que la recta pasa por (x , y ). b) Se define la desviación de cada punto, d, como la diferencia entre el valor real (yr) y el valor estimado (ye); es decir, d yr ye. Calcula todas las desviaciones de los datos y halla su suma, comprobando que se van equilibrando unas con otras. a) (x , y ) (5,45; 5,6) ⇒ Sustituyendo en la recta de regresión se comprueba que 5,6 5,45 0,15. b) Consideramos la siguiente tabla: Como se observa en la tabla, (yr ye) 0,35, que es un valor muy pequeño. Esto nos muestra que las desviaciones de los datos se van equilibrando unas con otras. 15.35 xi yi ye d yr ye 3 2 3,15 1,15 4 5 4,15 0,85 5 5 5,15 0,15 6 6 6,15 0,15 6 7 6,15 0,85 7 6 7,15 1,15 7 7 7,15 0,15 8 9 8,15 0,85 10 10 10,15 0,15 (yr ye) 0,35 X Y 3 4 5 6 7 8 10 2 4 5 7 11 6 5 3 7 5 2 9 1 10 2 R E F U E R Z O Diagramas de dispersión. Correlación Dada la siguiente distribución bidimensional: a) Dibuja la nube de puntos. b) ¿Qué porcentaje de veces aparece (2, 2)? c) ¿Cuál es la frecuencia absoluta del valor (3, y)? d) ¿Cuál es la frecuencia absoluta del valor (x, 5)? a) b) 1 3 5 100 20% c) 5 d) 4 Los valores de una variable bidimensional (X, Y) son los que siguen. (2, 2); (4, 2); (4, 4); (4, 3); (7, 5); (7, 7); (7, 6); (5, 6); (5, 5); (5, 4); (8, 6); (9, 7) a) Dibuja el diagrama de dispersión. b) Halla el coeficiente de correlación. Interpreta el resultado. c) Indica el tipo de dependencia entre ambas variables. a) b) Consideramos la siguiente tabla: r 0,8605 ⇒ Las variables tienen una correlación positiva media. c) La dependencia entre ambas variables es aleatoria. Asocia cada coeficiente de correlación con su gráfica correspondiente: 0,26; 0,81; 0,95; 0,71 a) b) c) d) r 0,95 r 0,26 r 0,81 r 0,71 O X Y O X Y O X Y O X Y 15.38 1 1 O Y X 15.37 1 1 O Y X 15.36 X 1 2 3 4 Total Y 1 1 1 2 2 3 3 6 3 1 1 2 4 1 1 5 2 2 4 Total 2 5 5 3 15 xi yi xiyi xi 2 yi 2 2 2 4 4 4 4 2 8 16 4 4 4 16 16 16 4 3 12 16 9 7 5 35 49 25 7 7 49 49 49 7 6 42 49 36 5 6 30 25 36 5 5 25 25 25 5 4 20 25 16 8 6 48 64 36 9 7 63 81 49 67 57 352 419 305 Recta de regresión y estimaciones La relación entre dos variables (X, Y) viene dada por la siguiente tabla. a) Calcula el coeficiente de correlación lineal. b) Halla la recta de regresión. c) Si x 8, ¿cuánto valdría y? d) ¿Es buena esta predicción? Justifica la respuesta. a) x 4 1 0 0 4 y 4 1 5 0 4,5 sX 1 1 9 0 6 42 1,8974 sY 2 1 5 0 7 4,52 2,3345 sXY 2 1 2 0 1 x y 4,1 Luego r s s X X s Y Y 0,9256 b) y 4,5 4 3 , , 1 6 (x 4) ⇒ y 4,5 1,1389 (x 4) ⇒ y 4,5 1,1389(x 4) c) Si x 8 ⇒ y 4,5 1,1389(8 4) 9,0556 d) La predicción es buena, ya que el coeficiente de correlación está muy próximo a 1 y el valor pedido no está alejado del de valores de X. A M P L I A C I Ó N Se ha medido experimentalmente el área de distintos triángulos equiláteros de lados 1, 2, 3 decímetros, sucesivamente, y se han obtenido los siguientes resultados. a) Calcula el coeficiente de correlación lineal entre el cuadrado del lado y el área del triángulo. ¿Qué tipo de correlación existe? b) ¿Debería haber una relación funcional? ¿A qué se debe que la relación no llegue a ser funcional? a) La correlación es positiva y fuerte. Veámoslo: r s s X X s Y Y x 11 y 4,5 sXY 11 4,5 30,4 sX 112 8,7 sY 4,52 3,5 r 8,7 30 ,4 3,5 0,99 ⇒ La correlación es positiva y fuerte. b) Sí debería haber relación funcional, pero el coeficiente de correlación no es 1 debido al redondeo que se hace al medir 0,18 2,72 13,7 42,25 104,04 5 4 16 81 256 625 5 0,84 6,6 33,3 104 255 5 15.40 15.39 xi yi xiyi xi 2 yi 2 1 1 1 1 1 2 1 2 4 1 2 2 4 4 4 3 4 12 9 16 4 4 16 16 16 4 6 24 16 36 5 7 35 25 49 6 6 36 36 36 6 7 42 36 49 7 7 49 49 49 40 45 221 196 257 X 1 2 2 3 4 4 5 6 6 7 Y 1 1 2 4 4 6 7 6 7 7 (Lado)2 2 4 9 16 25 Área 0,42 1,65 3,7 6,5 10,2 Una variable bidimensional viene dada por la siguiente tabla. Sabiendo que sXY 1 y s2X 3 y que a es el valor máximo de la variable X, calcula a y b. Planteamos el siguiente sistema: 1 sXY ⇒ 1 10 4 a 29 4 b ⇒ 3 s2 X ⇒ 3 4 9 4 25 a2 10 4 a 2 ⇒ ⇒ Como nos dicen que a es el valor máximo de la variable X, la única solución válida es a 6,4603 y b 30,46. En una variable bidimensional (X, Y), su coeficiente de correlación lineal es 0,48 y la pendiente de recta de regresión es 1,34. Sabiendo que la suma de las desviaciones típicas de X e Y es 7,33, calcula cada una de ellas y la de la variable bidimensional. r 0,48 s s X X s Y Y m s s X 2 X Y 1,34 sX sY 7,33 ⇒ ⇒ ⇒ ⇒ sY 7,33 1,93 5,4 ⇒ sXY 1,34 s2 X 5 Encuentra la recta de regresión de la variable (X, Y) sabiendo que es paralela a la recta 2x 4y 17 y que su centro de masas es un punto que comparte con las rectas: x 3y 19 4x y 2 La recta de regresión es paralela a 2x 4y 17; por tanto, tienen la misma pendiente: m 1 2 . (x , y ) ⇒ ⇒ ⇒ 13x 25 ⇒ x 2 1 5 3 1,9 ⇒ y 5,6 (x , y ) (1,9; 5,6) La recta de regresión es: y 5,6 1 2 (x 1,9). x 3y 19 12x 3y 6 x 3y 19 4x y 2 15.43 0,48 sX (7,33 sX) 1,34 s2 X 3,52 sX 0,48 s2 X 1,34 s2 X 1,82 s2 X 3,52 sX 0 ⇒ sX 3 1 , , 5 8 2 2 1,93 sXY 0,48 sX sY sXY 1,34 s2 X sY 7,33 sX s s X X s Y Y 0,48 s s X 2 X Y 1,34 sX sY 7,33 15.42 a 6,4603 ⇒ b 30,46 a 0,2064 ⇒ b 0,1538 2(5b 9) a(b 17) 16 3a2 20a 4 00 2 75 5b 3a 4 15.41 X 2 3 5 a Y 1 25 b 3 Una variable bidimensional (X, Y) tiene de coeficiente de correlación r 0,78, y las medias de las distribuciones marginales son x 2 e y 9. Razona cuál de las siguientes rectas se ajusta más a dicha variable. y 3x 12 y 1,5x 6 y 2,5x 14 Descartamos la recta y 3x 12 porque el punto ( x , y ) no pertenece a ella. Descartamos también la recta y 2,5x 14, pues el coeficiente de correlación es r 0,78, que es número positivo. Por tanto, la recta que más se ajusta a dicha variable es y 1,5x 6. P A R A I N T E R P R E T A R Y R E S O L V E R La página del instituto Juan se ha molestado en observar los segundos que ha tardado en acceder a la página web de su instituto en diferentes momentos del día. El siguiente gráfico de dispersión muestra los tiempos empleados en nueve momentos comprendidos entre las tres y las siete de la tarde. Indica cuál de las siguientes opciones (en las que se incluyen la recta de regresión, el coeficiente de correlación y el tiempo esperado cuando se conecta a las 7.30) se corresponde con los datos. La opción que se corresponde con los datos es la B. Diferentes rectas La tabla siguiente muestra el crecimiento de los beneficios obtenidos por una empresa en cada uno los ocho trimestres de los últimos dos años. a) Representa los datos en un diagrama de dispersión. b) Calcula y dibuja la recta de regresión considerando los ocho pares de datos. ¿Qué crecimiento se para el primer trimestre del tercer año? c) Calcula y dibuja la recta de regresión considerando únicamente los datos correspondientes al año. ¿Qué crecimiento se estima para el primer trimestre del tercer año? d) Indica alguna ventaja y algún inconveniente al utilizar la segunda recta en vez de la primera para realizar la estimación solicitada. a) y b) Se numeran los trimestres de forma correlativa: 1, 2, 3… 8 Considerando x como el trimestre e y como el crecimiento del beneficio, obtiene la recta de regresión y 0,69x 8,1. Así pues, para el primer trimestre del tercer año se espera un crecimiento de 0,69 9 8,1 1,89%. c) Si se consideran solo los datos del segundo año, se obtiene la recta y 1,3x 12,2. Así, para el primer trimestre del tercer año se espera un crecimiento de 1,3 9 12,2 0,5%. d) Se utilizan datos más cercanos en el tiempo, pero en menor cantidad. 1 1 O Trimestre Crec. beneficios (%) 15.46 O 3 1 Hora N.° segundos 3.30 4 4.30 5 5.30 6 6.30 7 15.45 15.44 Primer año A B C y 3,45x 1,35 y 1,35x 3,45 y x 3 r 0,90 r 0,92 r 0,92 x 7,5 ⇒ y 7 x 7,5 ⇒ y 6,6 x 7,5 ⇒ y 6 Trimestre 1.o 2.o 3.o 4.o Beneficios (%) 7 6 7 5 Segundo año Trimestre 1.o 2.o 3.o 4.o Beneficios (%) 6 4 3 2 A U T O E V A L U A C I Ó N Sea la siguiente tabla simple de una variable bidimensional. a) Elabora una tabla de doble entrada. b) Dibuja su nube de puntos. c) Elige el coeficiente de correlación que crees que se puede ajustar más a la nube y justifica la respuesta. r 0,95 r 1,2 r 0,25 r 0,85 d) Calcula r y contrasta tu suposición. a) b) c) r 0,85, al tener una correlación fuerte y negativa (decreciente). d) r s s X X s Y Y x 2,5 y 4,5 sXY 2,5 4,5 2,5 11,25 8,75 sX 2,52 2 1,5 6,25 3,9 sY 2 6,5 20,25 2,5 r 3 ,9 8 ,7 2 5 ,5 9 8 ,7 ,7 5 5 0,89 Relaciona en tu cuaderno cada coeficiente de correlación con el tipo de correlación. r 1 Dependencia funcional r 0,95 Correlación positiva fuerte r 0,26 Independientes r 0,89 Correlación negativa fuerte r 0,62 Correlación negativa débil III. Correlación positiva fuerte III. Independientes III. Dependencia funcional IV. Correlación negativa débil IV. Correlación negativa fuerte a) r 1 b) r 0,95 c) r 0,26 d) r 0,89 e) r 0,62 15.A2 16 1 4 9 25 36 81 8 36 7 8 12 10 6 27 8 1 1 O Y X 15.A1 X 4 1 0 2 3 5 6 9 Y 9 7 6 4 4 2 1 3 X Y 4 1 0 2 3 5 6 9 1 1 2 1 3 1 4 1 1 6 1 7 1 9 1 En una encuesta realizada a 25 personas, se les ha preguntado su edad y el número de horas de ejercicio que realizan al día. Las respuestas han sido las siguientes. (15, 3); (17; 2,5); (25, 2); (35, 1); (40; 0,5); (45, 1); (50, 1); (60, 2); (65, 3); (16, 4); (20, 2); (25, 2); (32; 1,5); (52; 1,5); (47, 1); (52, 2); (68; 2,5); (16, 4); (24; 2,5); (40, 30); (25, 2); (31; 2,5); (45, 50); (62; 2,5); (15; 3,5). Calcula la recta de regresión. Realizamos una tabla de doble entrada. La recta de regresión es de la forma: y y s s X X 2 Y (x x ) x 36,88 años y 122 min sXY 103 25 200 36,88 122 371,36 sX 2 40 2 9 5 72 36,882 278,7456 y 122 2 7 3 8 7 ,7 1 4 ,3 5 6 6 (x 36,88) ⇒ y 122 1,33(x 36,88) ⇒ y 1,33x 171,05 Se ha preguntado a los alumnos de un centro el número de horas de estudio diario, X, y el número asignaturas aprobadas al final del curso, Y. A la nube de puntos resultado de la encuesta se ha ajustado la recta de regresión y 3,8x 0,2. a) Para aprobar 4 asignaturas, ¿cuánto tiempo de estudio deberían emplear? b) Y para superar las 11 asignaturas, es decir, todas, ¿cuál sería la recomendación de horas de estudio? a) Si y 4 ⇒ 4 3,8x 0,2 ⇒ x 4 3,8 0,2 1 hora b) Si y 11 ⇒ 11 3,8x 0,2 ⇒ x 11 3 ,8 0,2 2,84 horas (aproximadamente 2 h 50 min) 15.A4 60 50 240 180 720 750 360 210 480 25 30 32 17 20 24 75 31 32 35 80 90 47 50 104 60 62 65 68 25 15.A3 X 15 Y 16 17 20 24 25 31 32 35 40 45 47 50 52 60 62 65 68 Total 20 0 30 2 2 50 1 1 1 h 1 1 1 1 4 1,5 h 1 1 2 2 h 1 3 1 1 6 2,5 h 1 1 1 1 1 5 3 h 1 1 2 3,5 h 1 1 4 h 2 2 Total 2 2 1 1 1 3 1 1 1 2 2 1 1 2 1 1 1 1 25 M U R A L D E M A T E M Á T I C A S M A T E T I E M P O S ¿Metros y kilogramos? Un profesor ha realizado un estudio sobre la altura y el peso medios de los alumnos de una clase de 4.º ESO, obteniendo los siguientes valores: ¿Qué varía más, la altura o el peso? ¿Por qué? La única forma de comparar las magnitudes es mediante el coeficiente de variación definido como CV x s . De este modo se eliminan las unidades, y el resultado se expresa en porcentaje de variación que compara el grado de dispersión las distribuciones. En nuestro caso: Altura: CVA 0 1 , , 2 7 9 2 100 16,86% Peso: CVP 4 6 , 5 6 , 8 4 100 7,15% Luego hay más dispersión de valores en la altura que en el peso. Variable Media Desviación típica Altura (m) 1,72 0,29 Peso (kg) 65,4 4,68