Matemáticas Preguntas Resueltas PDF

ESCRIBE AQUÍ LO QUE DESEAS BUSCAR

ESTADISTICA UNIDIMENSIONAL EJERCICIOS RESUELTOS DE SECUNDARIA–MATEMATICA 4 ESO PDF

Clasifica los siguientes caracteres estadísticos: a) El récord del mundo de 100 metros lisos. b) El número de hermanos que tienes. c) Tu asignatura favorita. d) La producción de hierro de una mina. a) Cuantitativo continuo. b) Cuantitativo discreto. c) Cualitativo. d) Cuantitativo continuo. Propón dos ejemplos en cada caso. a) Carácter estadístico cualitativo. b) Variable estadística discreta. c) Variable estadística continua. a) El medio de transporte que utilizas para ir al instituto. b) El número de películas que ves al mes. c) Tu altura. Para realizar un sondeo sobre intención de voto en unas elecciones autonómicas, una empresa de demoscopia ha realizado entrevistas mediante llamadas telefónicas a 1000 personas, mediante llamadas telefónicas con el fin de conocer las expectativas de voto de un candidato. a) ¿Te parece que éste es un buen procedimiento? b) ¿Qué ocurre si una persona tiene tres líneas telefónicas a su nombre? c) ¿Qué sucede si alguien no tiene teléfono? a) No, ya que no todos tienen la misma probabilidad de ser elegidos para la muestra. b) Una persona con tres líneas telefónicas a su nombre tiene el triple de posibilidades de ser elegida para la muestra que una que solo tiene una línea. c) Si una persona no tiene teléfono, nunca podrá ser seleccionada para formar parte de la muestra. El departamento de control de calidad de una fábrica realiza con cierta periodicidad mediciones sobre los productos que salen de su cadena de fabricación para comprobar si cumplen las características que figuran en el etiquetado del envase. a) ¿Sería bueno probar con los 100 primeros productos que salen del proceso de fabricación a primera hora de la mañana? b) ¿Estaría mejor examinar con los 100 últimos productos fabricados al final del día? c) ¿Cómo podrías mejorar la elección de la muestra? a) No, pues al comienzo del día puede estar la máquina bien, estropearse a la segunda hora y seguir estropeada todo el día. b) No, porque la máquina puede funcionar bien a lo largo de toda la jornada y estropearse al final del día. c) Tomando uno o dos productos cada hora para formar parte de la muestra. Si sabemos que una muestra de 2500 personas es representativa de una población de 300 000, y que de esas 2500 personas, 500 son menores de edad, ¿cuántos menores de edad hay en la población? Si de un total de 2500 personas de la muestra representativa, 500 son menores de edad, de los 300 000 de la población deberá haber: 2 5 5 0 0 0 0 300 x 000 ⇒ x 60 000 menores de edad 13.5 13.4 13.3 13.2 13.1 Un 65% de los 15 000 socios colaboradores de una ONG son mujeres. La dirección de la ONG quiere conocer la opinión de sus socios y realiza telefónicamente una encuesta a 1000 de ellos, de los cuales 450 son mujeres. ¿Es suficientemente representativa la muestra elegida? En la muestra debe haber un 65% de mujeres. 65% de 1000 650 450, por lo que la muestra no es representativa. Para que fuera representativa debería haber 650 mujeres. En el estudio de una variable X se obtuvo la siguiente distribución de frecuencias. Construye la tabla completa de frecuencias. Las puntuaciones conseguidas en un test de cultura general realizado a 45 estudiantes fueron: 8 1 9 9 1 6 6 8 3 2 5 2 9 5 4 2 3 4 1 9 3 1 2 8 4 7 4 3 7 8 3 5 1 8 9 5 3 7 7 8 5 5 8 8 1 Construye la tabla completa de frecuencias. En el estudio de una variable X se obtuvo la siguiente distribución de frecuencias. Construye el diagrama de barras y su polígono de frecuencias. 13.9 13.8 13.7 13.6 Puntuación fi hi Fi Hi 1 6 0,133 6 0,133 2 4 0,089 10 0,222 3 6 0,133 16 0,356 4 4 0,089 20 0,444 5 6 0,133 26 0,578 6 2 0,044 28 0,622 7 4 0,089 32 0,711 8 8 0,178 40 0,889 9 5 0,111 45 1 45 1 xi fi hi Fi Hi 2 1 0,05 1 0,05 3 7 0,35 8 0,4 4 3 0,15 11 0,55 5 4 0,2 15 0,75 6 5 0,25 20 1 20 1 1 6 4 3 2 5 7 3 5 7 9 11 13 x f xi 3 5 7 9 11 13 fi 2 4 5 6 6 1 xi 2 3 4 5 6 fi 1 7 3 4 5 En el estudio de una variable X se obtuvo la siguiente distribución de frecuencias. Construye el histograma y su polígono de frecuencias. Este diagrama de sectores refleja, en porcentajes, la composición de la cesta de la compra en los hogares españoles. a) ¿Qué tipo de alimento es el más consumido? b) ¿Y el que menos? a) La carne y el pescado. b) El pan y los cereales. La tabla adjunta muestra el número de faltas de asistencia en una clase a lo largo de un mes. Calcula la media aritmética, la moda y los cuartiles de la distribución. x 1,63 faltas Mo 0 faltas Q1 0 faltas Q2 1 falta Q3 2 faltas 0 10 1 7 2 6 3 2 4 1 5 4 10 7 6 2 1 4 13.12 13.11 13.10 N.o de faltas 0 1 2 3 4 5 N.o de alumnos 10 7 6 2 1 4 Clases [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) fi 5 12 20 11 6 N.o de faltas fi Fi 0 10 10 7,5 1 7 17 15 2 6 23 22,5 3 2 25 4 1 26 5 4 30 30 10 20 30 40 50 60 25 20 15 10 5 h f carne y pescado frutas y hortalizas pan y cereales leche y derivados La tabla adjunta muestra los resultados de unos alumnos en la prueba de salto con pértiga. Calcula la media aritmética, la moda y los cuartiles de la distribución. x 2,98 m Mo 3,25 m Q1 [2,5; 3) Q2 Q3 = [3; 3,5) Calcula la media aritmética, la varianza y la desviación típica de la distribución dada por la siguiente tabla. x 6,019 s2 6,022 s 1 ,96 1,4 Dados los datos de la siguiente tabla: Calcula la media aritmética, la varianza y la desviación típica de la distribución asociada. x 35,185 s2 35,1852 124,05 s 1 24,05 11,137 152 5 252 12 352 20 452 11 552 6 5 12 20 11 6 15 5 25 12 35 20 45 11 55 6 5 12 20 11 6 13.15 2 32 5 42 11 52 15 62 10 72 6 82 2 92 2 5 11 15 10 6 2 3 2 4 5 5 11 6 15 7 10 8 6 9 2 2 5 11 15 10 6 2 13.14 2,25 6 2,75 12 3,25 15 3,75 4 37 13.13 Número de Marca de hi Falumnos clase i [2; 2,5) 2,25 6 6 [2,5; 3) 2,75 12 18 > 9,25 [3; 3,5) 3,25 15 33 > 27,75 [3,5; 4) 3,75 4 37 37 Medida del salto (m) [2; 2,5) [2,5; 3) [3; 3,5) [3,5; 4) N.o de alumnos 6 12 15 4 Clases [10, 20) [20, 30) [30 40) [40, 50) [50, 60) fi 5 12 20 11 6 xi 3 4 5 6 7 8 9 fi 2 5 11 15 10 6 2 Dado el siguiente conjunto de datos: 63, 62, 60, 20, 65, 80, 82, 110, 70, 75, 73, 72, 108, 84, 78, 67, 19, 60, 61, 63 a) Calcula la media aritmética. b) ¿Hay algún atípico? Si los hay, descartalos y vuelve a calcular la media aritmética. a) Hay 20 datos: x 13 2 7 0 2 68,6 b) 19 y 20 son datos atípicos. Los eliminamos y volvemos a calcular la media aritmética: x 13 2 3 0 3 74,06 Calcula la media aritmética truncada al 20% del siguiente conjunto de datos: 600, 396, 490, 1604, 8, 606, 604, 594, 1246, 42 Hay 10 datos. Para calcular la media truncada al 20% debemos descartar el 20% de los datos superiores y el 20% de los inferiores. Es decir, hay que eliminar el 20% de 10 2 datos superiores y 2 datos inferiores. Por tanto, el conjunto de datos queda de la siguiente forma: 600, 396, 490, 606, 604, 594 La media truncada es: x 548,33 Para los datos del ejercicio anterior, calcula los valores atípicos, aplicando el criterio dado en el epígrafe. Q3 606; Q1 396 Q3 1,5 · (Q3 - Q1) 921 Q1 1,5 · (Q3 - Q1) 81 Entonces: x es atípico por la derecha si x Q3 1,5 · (Q3 Q1) 921. Los valores atípicos por la derecha son 1246 y 1604. x es atípico por la izquierda si x Q1 1,5 · (Q3 Q1) 81. Los valores atípicos por la izquierda son 8 y 42. Una distribución viene dada por la siguiente tabla: Calcula la media y la desviación típica y halla el porcentaje de datos incluidos en los intervalos (x s, x s); (x 2s, x 2s); (x 3s, x 3s). Por el ejercicio 13.14 se sabe que x ≈ 6,019 y s 1,4. Intervalo (x s, x s) (4,619; 7,419) En este intervalo hay 11 15 10 36 datos. 36 de 51 datos totales representan el 70,6%. Intervalo (x 2s, x 2s) (3,219; 8,819) En este intervalo hay 5 11 15 10 6 47 datos. 47 de 51 datos totales representan el 92,6%. Intervalo (x 3s, x 3s) (1,819; 10,219) En este intervalo hay 2 5 11 15 10 6 2 51 datos. 51 de 51 datos totales representan el 100%. 13.19 13.18 600 396 490 606 604 594 6 13.17 2 63 62 2 60 65 80 82 110 70 75 73 72 108 84 78 67 61 20 2 63 62 2 60 20 65 80 82 110 70 75 73 72 108 84 78 67 19 61 20 13.16 xi 3 4 5 6 7 8 9 fi 2 5 11 15 10 6 2 En la tabla se recogen los datos correspondientes a una distribución estadística: Calcula la media y la desviación típica y halla el porcentaje de datos incluidos en los intervalos (x s, x s); (x 2s, x 2s)(x 3s, x 3s). x 4,44 s 4,442 1,77 Intervalo (x s, x s) (2,67; 6,21) En este intervalo hay 15 20 16 51 datos. 51 de 86 datos totales representan el 59%. Intervalo (x 2s, x 2s) (0,9; 7,98) En este intervalo hay 6 12 15 20 16 11 80 datos. 80 de 86 datos totales representan el 93%. Intervalo (x 3s, x 3s) ( 0,87; 9,75) En este intervalo hay 6 12 15 20 16 11 6 86 datos. 86 de 86 datos totales representan el 100%. Calcula el coeficiente de variación de la siguiente distribución. x 3,33 s 3,33 2 1,41 CV 1 3 , , 4 3 1 3 0,42 42% Compara las dispersiones de las siguientes distribuciones. x 5,25 sx 5,252 1,71 CVx 1 5 , , 7 2 1 5 0,33 33% y 60,5 sy 60,52 81,75 CVy 8 6 1 0 ,7 ,5 5 1,35 135% CVx CVY ⇒ La distribución X es menos dispersa que la distribución Y. 632 392 642 552 662 702 652 622 8 63 39 64 55 66 70 65 62 8 62 32 42 32 72 52 62 82 8 6 3 4 3 7 5 6 8 8 13.22 12 5 22 12 32 18 42 11 52 7 62 4 72 1 5 12 18 11 7 4 1 1 5 2 12 3 18 4 11 5 7 6 4 7 1 5 12 18 11 7 4 1 13.21 1,52 6 2,52 12 3,52 15 4,52 20 5,52 16 6,52 11 7,52 6 6 12 15 20 16 11 6 1,5 6 2,5 12 3,5 15 4,5 20 5,5 16 6,5 11 7,5 6 6 12 15 20 16 11 6 13.20 Clases [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8) fi 6 12 15 20 16 11 6 Clases [1, 2) [2, 3) [3, 4) [4, 5) [5, 6) [6, 7) [7, 8) Marca 1,5 2,5 3,5 4,5 5,5 6,5 7,5 fi 6 12 15 20 16 11 6 xi 1 2 3 4 5 6 7 fi 5 12 18 11 7 4 1 xi 6 3 4 3 7 5 6 8 yi 63 39 64 55 66 70 65 62 R E S O L U C I Ó N D E P R O B L E M A S En ese mismo examen, Alberto (de 4.º A) ha sacado un 7, y Borja (de 4.º B), otro 7. Compara sus resultados. Ordenando las notas de ambas clases, veremos que en la de Alberto hay cinco notas iguales o superiores a 7, y que en la de Borja hay 12. Para comparar sus notas podemos calcular la puntuación típica teniendo en cuenta los parámetros que se han calculado en el problema resuelto. Restamos en cada caso la media del grupo y dividimos entre la desviación típica, obteniendo los siguientes valores: Alberto: 7 1 ,23 5,5 1,22 Borja: 7 2 ,43 5,5 0,62 La puntuación de Alberto ha sido mejor, teniendo en cuenta los resultados del grupo. En el siguiente examen de 4.º A, la nota media ha sido 5,8, y la desviación típica, 1,5. Ana ha vuelto a sacar un 6. Compara esta nota con la del primer examen. Ahora, al no conocer las notas del resto de la clase, no podemos ordenarlas. Vamos a calcular su puntuación típica. Ana: 6 1,5 5,8 0,13 La nota fue mejor en el primer examen. A C T I V I D A D E S E J E R C I C I O S P A R A E N T R E T E N E R S E Caracteres, muestreo y recuento de datos Di si los siguientes caracteres son cualitativos o cuantitativos, y relaciónalos con sus posibles modalidades o valores. 13.25 13.24 13.23 Carácter Tipo Modalidades/Valores Estilo de veraneo 1200, 2300, 800, 1000... N.o de mensajes de móvil Montaña, playa, aventura... Sueldo mensual 3, 15, 8, 12, 1, 7, 23, 9... de los trabajadores N.o de libros que 2, 6, 5, 3, 4, 1, 2, 4, 5... utiliza un alumno Carácter Tipo Modalidades/Valores Estilo de veraneo Cualitativo Montaña, playa, aventura... N.o de mensajes Cuantitativo 3, 15, 8, 12, 1, 7, 23, 9... de móvil discreto Sueldo mensual Cuantitativo 1200, 2300, 800, 1000... de los trabajadores continuo N.o de libros que Cuantitativo 2, 6, 5, 3, 4, 1, 2, 4, 5... utiliza un alumno discreto El consejo escolar de un centro desea realizar una encuesta para conocer el grado de satisfacción de los padres de los alumnos con el funcionamiento general del centro. ¿Cuál crees que es el mejor y más rápido procedimiento, y por qué? A. Hacer el estudio con una clase elegida al azar. B. En la salida del centro, elegir a los 30 primeros alumnos que salgan. C. Seleccionar al azar 4 alumnos por grupo. La opción C es la más adecuada, porque la muestra será más representativa del centro, al elegir alumnos de todos los grupos y niveles. La siguiente tabla informa del uso de la sala de musculación de un polideportivo municipal. Se quiere realizar una encuesta a 40 personas sobre las instalaciones. ¿Cuántos usuarios de cada modalidad tendría que haber en la muestra? • Hombres: 75% de 40 30 hombres, de los cuales: • Mujeres: 25% de 40 10 mujeres, de las cuales: Renta baja: 30% de 30 9 Renta baja: 40% de 10 4 Renta media: 60% de 30 18 Renta media: 50% de 10 5 Renta alta: 10% de 30 3 Renta alta: 10% de 10 1 Completa los valores de la tabla. El número de llamadas perdidas al día que realizan 30 alumnos de 4.º ESO de un centro es: 30, 10, 17, 62, 57, 48, 74, 32, 47, 34, 12, 16, 15, 65, 22, 44, 38, 13, 36, 28, 38, 40, 61, 53, 52, 31, 27, 25, 20, 19 Agrupa los datos en clases y elabora una tabla de frecuencias. 13.29 13.28 13.27 13.26 Sexo Renta Baja: 30% H 75% Media: 60% Alta: 10% Baja: 40% M 25% Media: 50% Alta: 10% Clases fi hi Fi Hi [75, 95) 4 0,13 4 0,13 [95, 115) 2 0,07 6 0,20 [115, 135) 7 0,23 13 0,43 [135, 155) 9 0,30 22 0,73 [155, 175) 4 0,13 26 0,87 [175, 195) 0 0,00 26 0,87 [195, 215) 2 0,07 28 0,93 [215, 235) 2 0,07 30 1,00 Total 30 1,00 xi fi hi Fi Hi 1 2 1 1 0 2 1 2 0 2 4 1 5 6 1 6 0 3 3 2 3 0 9 2 9 0 4 7 2 7 0 16 1 2 6 0 5 3 2 3 0 19 1 2 9 0 6 1 2 1 0 20 2 2 0 0 Total 20 1 72 4 xi fi hi Fi Hi 1 2 2 4 3 3 4 7 5 3 6 1 Total Gráficos y parámetros La siguiente tabla muestra las actividades ofertadas por un centro cultural y el número de vecinos que las realizan. Representa el diagrama de sectores asociado. La siguiente tabla presenta el número de horas semanales que dedican al estudio los 30 alumnos de una clase de 4.º de ESO. a) Halla la media, la moda, la mediana y los otros dos cuartiles. b) Calcula el rango, la varianza y la desviación típica. c) Representa el histograma y el polígono de frecuencias. a) x 7,07 Mo 6; M 6; Q1 2; Q3 10 b) Rango 14 2 12 s2 7,072 15,88 ⇒ s 1 5,88 3,99 c) 22 8 62 10 102 8 142 4 30 2 8 6 10 102 8 14 4 30 13.31 Taller de Fotografía: 25 11% Pilates: 80 36% Curso de Informática: 30 13% Yoga: 40 18% Taller de Pintura: 50 22% 13.30 Actividades N.o de vecinos Yoga 40 Taller de pintura 50 Curso de informática 30 Pilates 80 Taller de fotografía 25 Marcas fi Fi 2 8 8 7,5 6 10 18 15 10 8 26 22,5 14 4 30 30 N.o de faltas N.o de alumnos [0, 4) 8 [4, 8) 10 [8, 12) 8 [12, 16) 4 0 4 8 12 16 12 10 8 6 4 2 N.o de alumnos N.o de horas Cuartil 1.o 2 6 10 Mediana Cuartil 3.o Límite inferior Límite superior 14 La evolución de la temperatura a lo largo de un día de otoño en una ciudad del centro del país viene reflejada por el siguiente diagrama lineal. Realiza otros dos diagramas lineales de lo que podría ser la evolución de la temperatura en un día de invierno y otro de verano en el mismo lugar. Invierno Verano Valores atípicos Los resultados obtenidos en un test de inteligencia en una población concreta han sido: 135, 125, 180, 140, 210, 156, 192, 141, 130, 128, 110, 230, 162, 160, 137, 118, 136, 205, 100, 143, 136, 128, 190, 143, 156, 157, 140, 125, 215, 130 a) Ordénalos en clases de amplitud 20. b) Calcula sus cuartiles. c) Halla los valores atípicos. d) Calcula la media aritmética truncada al 20% y compárala con la media aritmética normal. a) b) Q1 Q2 = 130; Q3 150 c) Q3 1,5 · (Q3 - Q1) = 180 Q1 1,5 · (Q3 Q1) 100 x es atípico por la derecha si x Q3 1,5 · (Q3 Q1) 180. Valores atípicos por la derecha: 205, 210, 230 y 215. x es atípico por la izquierda si x Q1 1,5 · (Q3 Q1) 100. Valores atípicos por la izquierda: 60, 80, 90 y 92. d) El 20% de 30 6. Eliminamos seis datos superiores (157, 162, 205, 210, 215 y 230) y seis datos inferiores (60, 80, 90, 92 y 100). La media es: x 140 La media truncada al 20% es: x truncada 142,78. La media truncada es más representativa de la población. 110 2 130 10 150 7 18 70 1 90 3 110 3 130 10 150 8 170 1 210 3 230 1 30 13.33 5 20 25 30 2 4 6 8 10 12 14 16 18 20 22 24 10 35 Horas del día Temperatura en oC 15 2 6 8 10 12 4 14 Horas del día Temperatura en oC 2 4 6 8 10 12 14 16 18 20 22 24 0 24 5 10 15 20 Temperaturas en °C Horas del día 25 30 2 4 6 8 10 12 14 16 18 20 22 13.32 Clases Marca de clase fi Fi [60, 80) 70 1 1 [80, 100) 90 3 4 [100, 120) 110 3 7 [120, 140) 130 10 17 7,5; 15 [140, 160) 150 8 25 22,5 [160, 180) 170 1 26 [180, 200) 190 0 26 [200, 220) 210 3 29 [220, 240) 230 1 30 Utilización conjunta de parámetros Se ha realizado un estudio con el fin de averiguar la cantidad de toneladas de papel que recicla cada uno de los distintos distritos y se han obtenido los siguientes resultados: 64, 65, 68, 67, 68, 67, 72, 74, 80, 74, 68, 74, 68, 72, 68, 65, 72, 67, 68, 85 a) Halla la media y la desviación típica. b) Calcula el porcentaje de distritos cuyas cantidades recicladas se encuentran dentro del intervalo (x 2s, x 2s). a) x 70,3 s 70,32 5,1 b) (x 2s, x 2s) (60,1; 80,5). En este intervalo hay 19 distritos, lo que supone un porcentaje del 95%. La tabla recoge las temperaturas máximas alcanzadas en dos ciudades durante 10 días consecutivos del mes de agosto. a) ¿Qué ciudad ha tenido una temperatura media más alta a lo largo de esos 10 días? b) ¿Qué ciudad ha sufrido una variabilidad mayor de temperatura? c) ¿Qué parámetro has empleado para contestar el anterior apartado? ¿Por qué? a) Como x A 2 1 7 0 5 27,5 y x B 2 1 6 0 0 26 , la ciudad A ha tenido una temperatura media más alta. b) s 2 A 78 1 6 0 1 27,52 29,85 ⇒ sA 5,46 ⇒ CVA 5 2 , 7 4 , 6 5 0,198 s 2 B 68 1 2 0 0 262 6 ⇒ sB 2,45 ⇒ CVB 2 2 ,4 6 5 0,09 Por tanto, la ciudad A ha tenido una variabilidad de temperatura mayor. c) El parámetro empleado es el CV, y se utiliza porque las medias y las desviaciones típicas de las dos distribuciones son distintas, y es la única manera de comparar sus dispersiones. 13.35 642 652 2 672 3 682 6 722 3 742 3 802 852 20 64 65 2 67 3 68 6 72 3 74 3 80 85 20 13.34 xi fi 64 1 65 2 67 3 68 6 72 3 74 3 80 1 85 1 20 A 32 33 24 22 35 30 29 31 20 19 B 27 28 25 31 24 25 24 26 22 28 Las notas obtenidas en la asignatura de Matemáticas por los alumnos de dos clases de 4.º de ESO son las siguientes. a) ¿Cuál es la calificación media de cada una de las dos clases? b) ¿Cuál de ellas tiene las notas menos dispersas? c) ¿Es necesario calcular el coeficiente de variación para poder determinarlo? ¿Por qué? a) La nota media de 4.º A es: x A 5 La nota media de 4.º B es: x A 5 b) Para observar la dispersión calculamos las desviaciones típicas de ambas clases: sA 52 4,45 sB 52 1,7 Por tanto, 4.º B tiene las notas menos dispersas. c) No ha sido necesario calcular CV, ya que cuando las medias son iguales tiene menor dispersión la distribución que tenga menor desviación típica. La media y la desviación típica de dos distribuciones A y B son las siguientes. x A 100, x B 200, sA 1,2, sB 2,1 Indica cuál de ellas es más dispersa. Calculamos el coeficiente de variación de ambas: CVA 1 1 0 ,2 0 0,012 CVB 2 2 0 ,1 0 0,0105 Como CVA CVB, la distribución A es más dispersa. La profesora de Educación Física realiza un estudio referente a la altura y el peso de los alumnos de una clase, obteniendo los siguientes resultados: la altura, en metros, del 95% de los alumnos se encuentra dentro del intervalo (1,52; 1,92), y el peso, en kilogramos, del mismo porcentaje de alumnos se incluye en el intervalo (56,9; 66,1). ¿Cuál de las distribuciones tiene una dispersión relativa mayor? El intervalo que contiene el 95% de los datos de una distribución es (x 2s, x 2s). Sustituyendo los datos del enunciado obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas para la altura: ⇒ x 1,72; s 0,1. Por tanto: CVa 1 0 , , 7 1 2 0,06 De igual manera, para el peso obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas: ⇒ x 61,5; s 2,3. Por tanto: CVp 6 2 1 ,3 ,5 0,04 En definitiva, la distribución de las alturas tiene una dispersión relativa mayor, ya que su CV es mayor. x 2s 56,9 x 2s 66,1 x 2s 1,52 x 2s 1,92 13.38 13.37 22 2 32 2 42 3 52 6 62 3 72 2 82 2 20 12 4 22 1 82 1 92 4 102 5 20 2 2 3 2 4 3 5 6 6 3 7 2 8 2 20 0 5 1 4 2 1 3 0 4 0 5 0 6 0 7 0 8 1 9 4 10 5 5 4 1 1 4 5 13.36 Notas 0 1 2 3 4 5 6 7 8 9 10 4.oA 5 4 1 0 0 0 0 0 1 4 5 4.oB 0 0 2 2 3 6 3 2 2 0 0 C U E S T I O N E S P A R A A C L A R A R S E ¿Puede ser que la media no coincida con ningún valor de la variable? ¿Y la moda? Razona tus respuestas. La media puede no coincidir con ningún valor de la variable; sin embargo, la moda siempre estará asociada a un valor concreto de la distribución. Averigua el dato que falta en la siguiente distribución para que la media sea 18. 7 12 15 22 23 28 32 18 ⇒ x 5 ¿Qué habría de ocurrir para que la media aritmética de una variable estadística fuese cero? Pon un ejemplo de una distribución que verifique la propiedad anterior. Como x , para que x 0 se ha de verificar que x1 · f1 … xn · fn 0. Las frecuencias son siempre mayores o iguales que cero, por lo que debe ocurrir que la variable tome valores positivos y negativos. Ejemplo: Las temperaturas mínimas recogidas en una ciudad a lo largo de una semana del mes de enero han sido: 0 , 3 , 2 , 0 , 1 , 1 , 1 . Por tanto, x 0, es decir, la temperatura media a lo largo de esa semana fue de 0 . Al preguntar a 30 alumnos cuántas asignaturas han suspendido, 13 de ellos contestan que 5 materias. ¿Qué sector circular le corresponde al valor 5 de la variable número de suspensos? Le corresponde el sector circular de 156 , ya que si 360 corresponde al total de los alumnos, entonces a 13 alumnos les corresponden 156 . Si se suma a todos los valores de la variable una constante, ¿cómo quedan afectadas la media y la varianza? ¿Y si se multiplican por una constante? Si se suma a todos los valores de la variable una constante, la media queda aumentada en esa constante, mientras que la varianza no varía. Si se multiplican todos los valores de la variable por una constante, la media queda multiplicada por esa constante, mientras que la varianza queda multiplicada por el cuadrado de dicha constante. Pon un ejemplo de una distribución donde la media, la moda y la mediana coincidan. Por ejemplo, la siguiente distribución: 1, 2, 2, 3, 3, 3, 4, 4, 5. En este caso, media moda mediana 3. Puede considerarse también cualquier otro ejemplo que conserve una simetría. Calcula el rango de estas dos distribuciones e indica en cuál de ellas el rango es más significativo de la realidad de los datos y por qué. El rango de las dos distribuciones es 40 5 35, es decir, indica una dispersión grande de los datos que es mucho más real en yi que en xi, ya que, en general, en esta última están muy poco dispersos. 13.45 13.44 13.43 13.42 x1 f1 x2 f2 + ... + xn fn N 13.41 7 12 15 22 23 28 32 x 8 13.40 13.39 xi 5 15 40 fi 2 25 3 yi 5 15 40 fi 12 2 16 Fíjate en la tabla que recoge la distribución de cierta variable estadística y responde: a) ¿Cuántos valores atípicos hay? b) ¿Cuáles son los valores? Justifica tu respuesta. c) Calcula la media truncada sin esos valores atípicos. a) Calculamos los tres cuartiles. Q1 7; Q2 9; Q3 11 Q3 1,5 (Q3 Q1) 17 Q1 1,5 (Q3 Q1) 1 Entonces: x es atípico por la derecha si x 17. Valores atípicos por la derecha: 18. Hay 40 valores. x es atípico por la izquierda si x 1. Valores atípicos por la izquierda: 0. Hay 1 valor. b) Del apartado a, los valores son 18 y 0. c) La media truncada es: x truncada 4 9 6 4 2 4,91 P R O B L E M A S P A R A A P L I C A R En una ciudad, el 35% de sus habitantes son hombres, y el 65%, mujeres. Entre las mujeres, el 20% son niñas; el 25%, adultas, y el 55%, mayores. Entre los hombres, el 15% son niños; el 25%, adultos, y el 60%, mayores. Para elaborar un estudio sobre los hábitos de la población de esa ciudad, se elige una muestra de 1200 habitantes. ¿Cuál de las tres muestras siguientes es la más representativa de la población? Para que la muestra sea representativa de la población total se deben distribuir de la siguiente manera: • Hombres: 35% de 1200 420, de los cuales: • Mujeres: 65% de 1200 780, de las cuales: Niños: 15% de 420 63 Niñas: 20% de 780 156 Adultos: 25% de 420 105 Adultos: 25% de 780 195 Mayores: 60% de 420 252 Mayores: 55% de 780 429 Por lo que la muestra más representativa es la 1. 13.47 5 9 7 18 9 28 11 39 9 18 28 39 13.46 xi Fi 0 1 5 9 7 18 9 28 11 39 18 40 xi Fi 0 1 5 9 7 18 10 9 28 20 11 39 30 18 40 Muestra 1 H M Niños 63 156 Adultos 105 195 Mayores 252 429 Muestra 2 H M 58 160 100 182 262 438 Muestra 3 H M 70 145 95 170 255 465 En ocasiones, la media se ajusta más que la moda a la distribución, y a veces lo contrario. En cada una de las siguientes tablas, ¿qué parámetro (x o Mo) es más significativo y por qué? Variable A x 9 3 4 4 1 27,68 s 27,68 2 76,67 Mo 2 En esta variable, la varianza es muy grande, lo cual demuestra que la media no es muy representativa. Si nos fijamos en la tabla, se observa que de 34 datos hay 30 que son 2. Con lo cual la moda es mucho más representativa de la distribución. Variable B y 9,81 s 9,812 6,44 Mo 3 Observando la varianza y la tabla, en esta variable, la media es bastante representativa, más que la moda. En el Parque Nacional de los Picos de Europa se ha realizado un estudio sobre la altura de sus robles, y para ello se ha tomado una muestra en una superficie de 15 kilómetros cuadrados, obteniéndose los siguientes resultados gráficos. a) Halla la media, la moda y la mediana. b) Calcula el intervalo que contenga el 95% de los robles. a) De la gráfica obtenemos la siguiente tabla: xi Altura de los robles fi Número de robles x 22,5; ; Mo 22; Me 22 b) En el intervalo (x 2s, x 2s) se encuentra al menos el 95% de los datos. s 22,5 2 2,02 ⇒ (x 2s, x 2s) (18,46; 26,54) 202 15 222 25 242 10 262 10 60 20 15 22 25 24 10 26 10 60 20 22 24 26 5 10 15 20 N.° de robles Altura en metros 25 30 13.49 32 8 72 6 122 7 212 5 8 6 7 5 3 8 7 6 12 7 21 5 8 6 7 5 2 1382 2542 1 3512 1 22 30 2 1 1 30 138 2 254 1 351 1 2 30 2 1 1 30 13.48 Variable A xi fi 138 2 254 1 351 1 2 30 Variable B yi fi 3 8 7 6 12 7 21 5 xi fi Fi xifi xi 2fi 20 15 15 300 6000 22 25 40 30 550 12 100 24 10 50 240 5760 26 10 60 260 6760 60 1350 30 620 Este diagrama recoge el tiempo que dedican diariamente al ordenador 60 alumnos de Secundaria. ¿Cuántos alumnos respondieron a las distintas categorías del estudio? Realizando sendas reglas de tres obtenemos los siguientes resultados: A: 13 alumnos; B: 25; C: 14; D: 5, y E: 3 Según un estudio realizado a nivel nacional, la edad media en que la población realiza su primer viaje al extranjero es de 13,6 años. En un estudio realizado en un centro de Secundaria a 54 jóvenes se han obtenido los siguientes resultados. a) Elabora una tabla con los datos del gráfico y calcula su media y su mediana. b) Compara los resultados con la media nacional. a) x 13,43 Mediana: M 13,5 b) La media nacional es de 13,6, así que el estudio ratifica la bajada de edad en el consumo de alcohol e incluso con una media menor. 3 10,5 5 11,5 11 12,5 17 13,5 10 14,5 8 15,5 54 10 11 12 13 14 15 16 3 6 9 N.° de jóvenes Edad en años 18 12 15 13.51 18° 30° 78° 84° 150° Menos de 15 min Entre 15 y 30 min Entre 30 y 60 min Entre 1 y 2 horas Más de 2 horas 13.50 Edad (años) N.o de alumnos Marcas xi Fi [10, 11) 3 10,5 3 [11, 12) 5 11,5 8 [12, 13) 11 12,5 19 [13, 14) 17 13,5 36 [14, 15) 10 14,5 46 [15, 16) 8 15,5 54 54 En cierto centro escolar cuyo número total de alumnos es de 600, el 40% son chicos, de los cuales solo el 25% se encuentra en Bachillerato, mientras que el 50% de las chicas cursan ESO. a) Detalla cómo ha de ser la estructura de una muestra significativa que conste de la quinta parte del alumnado. b) En cierta muestra aleatoria simple de 50 alumnos de 2.º de ESO, se ha estudiado el número de sobresalientes por alumno en la primera evaluación, obteniéndose los siguientes resultados. Calcula la media truncada al 10% de esta distribución. a) El tamaño de la muestra ha de ser la quinta parte del total: n 120. Para que la muestra sea representativa tiene que haber: • Chicos: 40% de 120 48, de los cuales: • Chicas: 60% de 120 72, de las cuales: Bachillerato: 25% de 48 12 Bachillerato: 50% de 72 36 ESO: 75% de 48 36 Adultos: 50% de 72 36 Resumiendo, la muestra debe tener la siguiente distribución: b) Hay 50 datos en total. Como el 10% de 50 5, para calcular la media truncada al 10% hay que eliminar 5 datos superiores (5, 5, 6, 7 y 8) y 5 datos inferiores (0, 0, 0, 0 y 1). x 2,78 En una población nórdica con 2500 habitantes adultos se ha realizado un estudio sobre su altura. La distribución de alturas es normal (unimodal y simétrica). Sabiendo que en el intervalo (172, 196) se encuentran 2375 habitantes y que la altura media es de 184 centímetros, calcula: a) La desviación típica de la distribución. b) El número de habitantes que miden entre 178 y 190 centímetros. a) En el intervalo (172, 196) se encuentran 2375 habitantes, lo que supone el 95% de la población total. Como el intervalo que contiene el 95% de los datos de una distribución es (x 2s, x 2s), se tiene que x 2s 172. Sustituyendo los datos del enunciado obtenemos la siguiente ecuación: 184 2s 172 ⇒ 2s 184 172 ⇒ s 184 2 172 6 b) El número de habitantes que miden entre 178 y 190 cm será igual al número de habitantes que se encuentren en el intervalo (178, 190) (x s, x s). Este último intervalo contiene el 68% de los datos, lo que supone que hay 1700 habitantes que miden entre 178 y 190 cm. 13.53 1 6 2 10 3 15 4 5 5 4 40 13.52 ESO Bachillerato Total Chicos 36 12 48 Chicas 36 36 72 Total 72 48 120 Número de Número de sobresalientes alumnos 0 4 1 7 2 10 3 15 4 5 5 6 6 1 7 1 8 1 R E F U E R Z O Caracteres y parámetros estadísticos. Gráficos La siguiente tabla muestra las edades de los jóvenes que acuden a un bibliobús solicitando préstamos de libros en un día cualquiera. a) Halla la media, la moda y el tercer cuartil. b) Calcula la desviación típica. c) Representa el histograma y el polígono de frecuencias. a) x 11,2 Mo 11 años. Q3 13 años b) s 11,22 2,5 c) 72 5 92 12 112 14 132 13 152 4 172 2 50 7 5 9 12 11 14 13 13 15 4 17 2 50 13.54 Marcas f F 7 5 5 9 12 17 11 14 31 13 13 44 15 4 48 17 2 50 50 Edad N.o de personas [6, 8) 5 [8, 10) 12 [10, 12) 14 [12, 14) 13 [14, 16) 4 [16, 18) 2 6 8 10 12 14 16 18 14 12 10 8 6 4 2 N.o de personas Edad (años) El siguiente polígono de frecuencias muestra las estaturas de las 12 jugadoras de un equipo de voleibol femenino. Calcula la media aritmética y la desviación típica. Nos creamos la tabla asociada al polígono de frecuencias anterior para poder responder a las cuestiones: x 181,67 cm s 181, 672 4,81 cm La profesora de Educación Plástica y Visual evalúa a sus alumnos cada trimestre con la media de 10 calificaciones sobre distintas pruebas y trabajos. Susana ha obtenido, de momento, las siguientes notas: 2, 4, 4, 5, 8, 3, 6, 3, 5 ¿Qué calificación debe obtener en el último examen que le queda para aprobar la asignatura con un 5? Para aprobar necesita que su media sea 5, es decir: x 5 ⇒ 40 1 0 a 5 ⇒ a 10 Por tanto, para aprobar la asignatura con un 5 debe obtener un 10. Utilización conjunta de x y s La siguiente tabla recoge el número de goles marcados por dos equipos de balonmano en 8 partidos del Campeonato Nacional de Liga. a) Calcula el número medio de goles de cada uno de los equipos. b) ¿Cuál de ellos es más regular en su tanteo? a) Equipo 1: x 1 25,25 goles Equipo 2: x 2 25,75 goles 20 21 22 27 28 2 30 2 8 24 3 25 2 26 27 2 8 13.57 2 4 4 5 8 3 6 3 5 a 10 13.56 172,52 177,52 3 182,52 6 187,52 192,52 12 172,5 177,5 3 182,5 6 187,5 192,5 12 170 175 180 185 190 195 2 4 6 N.° de jugadoras Estatura en centímetros 13.55 Marcas Número de (cm) jugadoras 172,5 1 177,5 3 182,5 6 187,5 1 192,5 1 12 EQ. 1 25 24 27 24 26 25 27 24 EQ. 2 28 30 21 22 27 20 28 30 Número de goles 24 25 26 27 Número de partidos 3 2 1 2 Número de goles 20 21 22 27 28 30 Número de partidos 1 1 1 1 2 2 b) Ya que las medias son distintas, para comprobar la regularidad de cada uno debemos calcular el CV: s1 25,252 1,2 ⇒ CV1 2 1 5 , , 2 25 0,05 s2 25,752 3,83 ⇒ CV2 2 3 5 ,8 ,7 3 5 0,15 Por tanto, es más regular en su tanteo el equipo 1, ya que su CV es menor. Se ha realizado una encuesta entre los alumnos de un colegio de Enseñanza Primaria con el objeto de conocer el número de horas semanales que ven la televisión. El estudio arroja la siguiente información: el número de horas del 95% de los alumnos se encuentra en el intervalo (3,18; 17,1). Calcula la media aritmética y la desviación típica. El intervalo que contiene el 95% de los datos de una distribución es (x 2s, x 2s). Sustituyendo los datos del enunciado obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas: ⇒ x 10,14; s 3,48 A M P L I A C I Ó N Completa la siguiente distribución con dos datos más de forma que: 4, 6, 7, 7, 9, 9 a) Se conserve la media, pero la desviación típica aumente. b) Se conserve la media, pero la desviación típica disminuya. a) Para que se conserve la media y aumente la desviación típica, podemos añadir los datos 3 y 9. b) Para que se conserve la media y disminuya la desviación típica, podemos añadir los datos 6 y 6. Dadas las distribuciones: ¿En cuál de ellas se puede decir que en el intervalo (x s, x s) se encuentra el 68% de los datos? ¿Por qué? La tercera variable es la única donde se puede asegurar dicha afirmación, ya que es simétrica y unimodal. En la primera variable no se puede garantizar por ser asimétrica, y en la segunda tampoco por ser trimodal. 13.60 13.59 x 2s 3,18 x 2s 17,1 13.58 202 212 222 272 282 2 302 2 8 242 3 252 2 262 272 2 8 xi fi 1 3 3 7 5 11 7 18 9 21 Variable A Variable B Variable C xi fi 1 15 3 7 5 15 7 8 9 15 xi fi 1 5 3 12 5 25 7 14 9 4 Los siguientes diagramas lineales muestran la evolución del número de socios de tres ONG en los últimos cinco años. a) Calcula el coeficiente de variación de cada una de ellas. b) ¿Cuál tiene mayor variabilidad en el número de socios? ¿Por qué? a) De la gráfica se deduce la tabla de frecuencias para cada ONG. ONG 1 x 1000 s 1000 2 400 CV 1 4 0 0 0 0 0 0,4 40% ONG 2 x 1160 s 1160 2 265,32 CV 2 1 6 1 5 6 ,3 0 2 0,23 23% ONG 3 x 1000 5 4 1200 1160 s 10002 5 4 12002 1160 2 80 CV 1 8 1 0 60 0,07 7% b) La ONG 1 tiene mayor variabilidad, pues su coeficiente de variación es superior al de las otras dos ONG. 8002 1002 2 12002 16002 5 800 1000 2 1200 1600 5 4002 8002 10002 12002 16002 5 400 800 1000 1200 1600 5 2002 2003 2004 2006 200 400 600 1 800 N.ϒ de socios Año 2005 800 1 000 1 200 1 400 1 600 O.N.G. 1 O.N.G. 2 O.N.G. 3 13.61 xi fi 400 1 800 1 1000 1 1200 1 1600 1 5 xi fi 800 1 1000 1 1200 2 1600 1 5 xi fi 1000 1 1200 4 5 P A R A I N T E R P R E T A R Y R E S O L V E R Población de ranas Los siguientes gráficos estadísticos representan la misma distribución: la evolución de la población de ranas en un estanque durante los cuatro veranos que van desde el año 2005 hasta el 2008. Completa la tabla con ayuda de los gráficos. Media aritmética y media geométrica Como sabes, la media aritmética de dos números a y b se calcula mediante la expresión: x — a 2 b— Pero este valor no es el único parámetro estadístico de centralización. La media geométrica es también otro valor que sirve para representar los datos. Se calcula mediante la expresión: xg a b a) Completa la siguiente tabla: b) Indica alguna desventaja que aprecies para la utilización de la media geométrica. c) Recordando que el cuadrado de cualquier número es positivo o nulo, y el desarrollo de la expresión a b 2 , demuestra que la media geométrica de dos números es inferior o igual que la media aritmética de los mismos. a) b) La media geométrica no está definida si uno de los dos valores es negativo. Además, si uno de los datos es nulo, su valor siempre será cero. c) a b 2 0 ⇒ a2 b2 2 ab 0 ⇒ a b 2 ab ⇒ a 2 b a b 13.63 13.62 F. absoluta F. acumulada 2005 120 120 2006 240 360 2007 240 600 2008 360 960 Total 960 Datos Media Media a b aritmética geométrica 1 9 6 24 5 5 4 0 2 18 Datos Media Media a b aritmética geométrica 1 9 5 3 6 24 15 12 5 5 5 5 4 0 2 0 2 18 8 No definida 2005 2006 2007 2008 200 600 800 1000 Año Frecuencias absolutas acumuladas 360 960 400 N.° de ranas 2005 2006 2007 2008 100 200 300 400 N.° de ranas Año Frecuencias absolutas 120 A U T O E V A L U A C I Ó N Esta tabla recoge los resultados de un atleta en las diez últimas pruebas de salto de longitud en que ha participado. a) Halla la media, la moda, la mediana y el primer cuartil. b) Calcula el rango y la desviación típica. c) Representa los datos en un histograma. a) x 8,07 m Mo 8,05 m M 8,05 m Q1 7,95 m b) Rango 8,25 7,85 0,4 mm s 8,07 2 0,125 c) El histograma que se obtiene es el siguiente: Si la media de una distribución es x 1,97 y la desviación típica es s 0,08, halla el intervalo en el cual se encuentran el 99% de los datos de la distribución. El intervalo que contiene el 99% de los datos de una distribución es ( x 3s, x 3s). Por tanto, al sustituir los datos del enunciado en el intervalo obtenemos (1,73; 2,21), que es el intervalo pedido. 13.A2 7,852 7,952 2 8,052 3 8,152 2 8,252 2 10 7,85 7,95 2 8,05 3 8,15 2 8,25 2 1 2 3 2 2 13.A1 Longitud de salto (m) N.o de saltos [7,8; 7,9) 1 [7,9; 8,0) 2 [8,0; 8,1) 3 [8,1; 8,2) 2 [8,2; 8,3) 2 Longitud de salto (m) Marca de clase fi Fi [7,8; 7,9) 7,85 1 1 [7,9; 8,0) 7,95 2 3 > 2,5 [8,0; 8,1) 8,05 3 6 > 5 [8,1; 8,2) 8,15 2 8 [8,2; 8,3) 8,25 2 10 7,8 7,9 8 8,1 8,2 8,3 3 2 1 N.o de saltos Longitud (m) En las aulas de Bachillerato de un centro escolar hay 100 alumnos en la modalidad de Humanidades y CC. SS., 54 en la de CC. NN. y de la Salud, y 78 en la de Artes. Representa estos datos en un diagrama de sectores. El siguiente diagrama de barras nos muestra el número de libros leídos en un año por las treinta personas que trabajan en una oficina. a) Calcula la media aritmética y la desviación típica. b) ¿Cuál es el coeficiente de variación? a) b) CV 1 2 ,0 ,3 4 0,45 45% M A T E T I E M P O S El equipaje de vuelo Una compañía aérea tiene esta norma sobre la dimensión del equipaje que se puede transportar en sus aviones: “El equipaje de los pasajeros debe cumplir que la suma de sus tres dimensiones (largo, ancho y alto) no exceda de 1,80 metros”. ¿Qué tamaño pueden tener las maletas para ser admitidas por esta compañía aérea? El problema plantea la búsqueda de las dimensiones óptimas de un prisma sabiendo que la suma de las tres es de 1,80 m. Por comodidad, trabajaremos con decímetros, luego a b c 18 ⇒ c 18 a b. De todos los prismas posibles, buscamos el de mayor volumen. Este será: V abc ab(18 a b) 18ab a2b ab2. Si construimos una gráfica (con la ayuda de una calculadora gráfica) para cada valor de b entre 1 y 9, tenemos todas las posibilidades: El máximo se produce cuando a 6, b 6 y c 18 6 6 6. Luego las dimensiones óptimas serán: N.º de faltas 0 1 2 3 4 5 N.º de alumnos 10 7 6 2 1 4 Salto (m) [2; 2,5) [2,5; 3) [3; 3,5) [3,5; 4) N.º de alumnos 6 12 15 4 14 ESTADÍSTICA UNIDIMENSIONAL E J E R C I C I O S P R O P U E S T O S Clasifica los siguientes caracteres estadísticos. a) Número de canastas encestadas en un partido de baloncesto. b) Canal de televisión preferido por los vecinos de una casa. c) Medida, en metros, del salto de longitud en unos juegos olímpicos. a) Cuantitativo discreto b) Cualitativo c) Cuantitativo continuo En una ciudad hay tres millones de personas con derecho a voto, de las que el 53 % son mujeres. Se quiere elegir una muestra constituida por 3000 personas. ¿Cuántos hombres y mujeres deberán formar parte de la muestra para que sea representativa de la población? Para que la muestra guarde la misma proporción de hombres y mujeres que en la población, se deberá elegir: 53 1 0 3 0 000 1590 mujeres 47 1 0 3 0 000 1410 hombres La tabla adjunta muestra el número de faltas de asistencia en una clase a lo largo de un mes. Calcula la media aritmética y la moda. Media aritmética: x 4 3 9 0 1,6 faltas Moda Mo 0 faltas La siguiente tabla muestra los resultados de unos alumnos en la prueba de salto de longitud. Halla la media aritmética y la moda. Media aritmética: x 11 3 0 7 ,25 2,98 m Moda: La clase modal es [3; 3,5), y tomaremos como valor aproximado de la moda la marca de la clase modal. Así, Mo 3,25 m. 2,25 6 2,75 12 3,25 15 3,75 4 6 12 15 4 14.4 0 10 1 7 2 6 3 2 4 1 5 4 10 7 6 2 1 4 14.3 14.2 14.1 Calcula la mediana y los cuartiles de la distribución estadística dada por esta tabla. Primer cuartil. El número de datos es 90. La cuarta parte es 22,5. El primer cuartil es 3, ya que es el valor de la variable cuya frecuencia absoluta acumulada excede por primera vez la cuarta parte del número de datos. Por tanto, Q1 3. Mediana. El número de datos es 90. La mitad es 45. La mediana es 4, ya que es el valor de la variable cuya frecuencia absoluta acumulada excede por primera vez la mitad del número de datos. Por tanto, M 4. Tercer cuartil. Las tres cuartas partes del número de datos son 67,5. El tercer cuartil es 5, ya que es el valor de la variable cuya frecuencia absoluta acumulada excede por primera vez las tres cuartas partes del número de datos. Por tanto, Q3 5. Calcula la mediana, Q1 y Q3 de la siguiente distribución. Primer cuartil. El número de datos es 56. La cuarta parte del número de datos es 14. La clase que contiene al primer cuartil es [0, 10), ya que su frecuencia absoluta acumulada excede por primera vez la cuarta parte del número de datos. Tomaremos como aproximación al primer cuartil la marca de la clase [0, 10). Por tanto, Q1 5. Mediana. El número de datos es 56. La mitad del número de datos es 28. En este caso, la mediana será la media entre las marcas de la clase [10, 20) y [20, 30). Por tanto, M 20. Tercer cuartil. Las tres cuartas partes del número de datos son 42. La clase que contiene al tercer cuartil es [20, 30), ya que su frecuencia absoluta acumulada excede por primera vez las tres cuartas partes del número de datos. Tomaremos como aproximación al tercer cuartil la marca de la clase [20, 30). Por tanto, Q3 25. 14.6 14.5 xi 2 3 4 5 6 fi 11 17 23 24 15 xi [0, 10) [10, 20) [20, 30) [30, 40) fi 12 16 17 11 xi fi Fi 2 11 11 22,5 3 17 28 22,5 4 23 51 5 24 75 6 15 90 xi fi Fi 2 11 11 3 17 28 45 4 23 51 45 5 24 75 6 15 90 xi fi Fi 2 11 11 3 17 28 4 23 51 67,5 5 24 75 67,5 6 15 90 xi fi Fi [0, 10) 12 12 14 [10, 20) 16 28 14 [20, 30) 17 45 [30, 40) 11 56 xi fi Fi [0, 10) 12 12 [10, 20) 16 28 [20, 30) 17 45 [30, 40) 11 56 xi fi Fi [0, 10) 12 12 [10, 20) 16 28 42 [20, 30) 17 45 42 [30, 40) 11 56 La tabla adjunta muestra el número de faltas en una clase a lo largo de un mes. Representa los datos gráficamente. Representamos los datos mediante el siguiente diagrama de barras. La siguiente tabla muestra los resultados de unos alumnos en la prueba de salto de longitud. Dibuja el diagrama de cajas y bigotes. Li: 2,25 Q1: La clase que contiene el primer cuartil es [2; 2,5), ya que su frecuencia absoluta acumulada excede por primera vez la cuarta parte de los datos, 3 4 7 9,25. El primer cuartil será la marca de clase, es decir, Q1 2,25. M: La clase que contiene la mediana es [2,5; 3), ya que su frecuencia absoluta acumulada excede por primera vez la mitad de los datos, 3 2 7 18,5. La mediana será la marca de clase, es decir, M 2,75. Q3: La clase que contiene el tercer cuartil es [3; 3,5), ya que su frecuencia absoluta acumulada excede por primera vez las tres cuartas partes de los datos, 11 4 1 27,75. El tercer cuartil será la marca de clase, es decir, Q3 3,25. Ls: 3,75 Con estos datos, el diagrama de cajas y bigotes es el siguiente: Cuartil 1.o 2,25 2,75 3,25 Mediana Cuartil 3.o Límite inferior Límite superior 3,75 14.8 0 1 2 3 4 5 10 9 8 7 6 5 4 3 2 1 N.o de alumnos N.o de faltas 14.7 N.º de faltas 0 1 2 3 4 5 N.º de alumnos 10 7 6 2 1 4 Salto (m) [2; 2,5) [2,5; 3) [3; 3,5) [3,5; 4) N.º de alumnos 10 9 11 7 La siguiente tabla muestra el número de faltas en una clase a lo largo de un mes. a) Calcula el rango. b) Halla la varianza y la desviación típica. Formamos la siguiente tabla. a) Rango 5 0 5 b) Varianza: s2 1 3 6 0 5 4 3 9 9 2 2,83 faltas2 Desviación típica: s 2 ,83 1,68 faltas La tabla adjunta representa los resultados de unos alumnos en la prueba de salto de longitud. a) Halla el rango. b) Calcula la varianza y la desviación típica. Formamos la siguiente tabla. a) Rango 3,75 2,25 1,5 b) Varianza: s2 335 3 ,8 7 125 2,97972 0,197 m2 Desviación típica: s 0 ,197 0,444 m 14.10 14.9 N.º de faltas 0 1 2 3 4 5 N.º de alumnos 10 7 6 2 1 4 Salto (m) [2; 2,5) [2,5; 3) [3; 3,5) [3,5; 4) N.º de alumnos 6 12 15 4 xi fi xi 2 fi xi 2 0 10 0 0 1 7 1 7 2 6 4 24 3 2 9 18 4 1 16 16 5 4 25 100 30 165 xi fi xi 2 fi xi 2 2,25 6 5,0625 30,375 2,75 12 7,5625 90,75 3,25 15 10,5625 158,4375 3,75 4 14,0625 56,25 335,8125 Una distribución viene dada por la siguiente tabla. Halla el porcentaje de datos incluidos en los intervalos (x s, x s), (x 2s, x 2s) y (x 3s, x 3s). x 19 5 0 4 0 35,185 s 73 5 5 4 50 35,1852 11,137 (x s, x s) (24,048; 46,322). Si suponemos que los datos se distribuyen de forma uniforme, tenemos, por una simple proporcionalidad, que si de 20 a 30 se distribuyen 12 datos, de 24 a 30 se distribuirán: 6 1 0 12 7 datos. Del mismo modo, si de 40 a 50 se distribuyen 11 datos, de 40 a 46 se distribuirán: 6 1 0 11 7 datos. Luego en el intervalo (x s, x s) se distribuyen: 7 20 7 34 datos. 34 de 54 datos totales representan el 63 %. Razonando de forma análoga se tiene (x 2s, x 2s) (12,911; 57,459). En este intervalo se distribuyen 4 12 20 11 4 51 datos. 51 de 54 datos totales representan el 94,4%. (x 3s, x 3s) (1,774; 68,596) En este intervalo se distribuye el 100 %. Los porcentajes de uso del cinturón de seguridad en dos ciudades durante 4 días son: Calcula el coeficiente de variación en cada ciudad e interpreta el resultado. Ciudad A: x 78,5 s 24 4 866 (78, 5)2 7,36 Luego CVA x s 7 7 , 8 3 , 6 5 0,094 Ciudad B: x 73,5 s 23 4 298 (73, 5)2 20,55 Luego CVB x s 2 7 0 3 ,5 ,5 5 0,28 Como se observa, el coeficiente de variación de la ciudad A es menor que el de la ciudad B. Esto quiere decir que el comportamiento de los ciudadanos de A con respecto al uso del cinturón de seguridad es más homogéneo que el de los ciudadanos de B. 60 95 92 47 4 87 78 67 82 4 14.12 14.11 xi [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) fi 5 12 20 11 6 A 87 78 67 82 B 60 95 92 47 R E S O L U C I Ó N D E P R O B L E M A S La media y la mediana de un conjunto de cinco números naturales distintos es 7, y el rango es 6. Halla dichos números. Sean a, b, c, d y e, ordenados de menor a mayor, los cinco números naturales distintos: Como la media es 7 ⇒ a b c d e 35. Como la mediana es 7 ⇒ c 7. Como el rango es 6 ⇒ e a 6. Mediante la estrategia de ensayo error se tiene que las posibles soluciones son: Solución 1: 4, 5, 7, 9 y 10 Solución 2: 4, 6, 7, 8 y 10 Siete números naturales, no necesariamente distintos, tienen de media 8 y de mediana 11. ¿Cuál puede ser el mayor valor del rango? ¿Y el menor? Sean los números n1 n2 n3 n4 n5 n6 n7. Como la mediana es 11, se deduce que n4 11. Como la media es 8, la suma de los 7 números es 8 7 56. Para corregir el mayor rango hacemos: n1 n2 n3 1 y n5 n6 11; entonces, n7 56 3 33 20. En este caso, el rango es 20 1 19. Para corregir el menor rango hacemos: n4 n5 n6 n7 11; entonces, n1 n2 n3 56 4 · 11 12, y como queremos el rango menor, n1 n2 n3 4. En este caso, el rango es 11 4 7. A C T I V I D A D E S E J E R C I C I O S P A R A E N T R E N A R S E Caracteres y parámetros estadísticos. Gráficos Indica si los siguientes caracteres son cualitativos o cuantitativos, y, en su caso, expresa si la variable estadística es discreta o continua. a) Número de faltas de asistencia de los alumnos de una clase de 4.º de ESO en un mes. b) Número de horas de productividad entre los trabajadores de una oficina. c) Número de móviles que poseen los miembros de las familias de un edificio. a) Cuantitativa; variable discreta b) Cuantitativa; variable continua c) Cuantitativa; variable discreta Completa los valores de la tabla. ⇒ 14.16 14.15 14.14 14.13 xi fi Fi xifi 1 5 3 21 4 14 8 56 8 23 4 11 33 Total 171 xi fi Fi xifi 1 5 5 5 3 7 12 21 4 2 14 8 7 8 22 56 8 1 23 8 10 4 27 40 11 3 30 33 Total 33 171 La siguiente tabla muestra las actividades ofertadas por un centro centro cultural y el número de vecinos del barrio que cursan dichas actividades. Representa el diagrama de sectores asociado a la tabla anterior. Se realiza una encuesta a un grupo de 20 personas acerca del número de veces que acuden al cine a lo largo de un año, obteniéndose los siguientes resultados. 4, 2, 6, 8, 3, 4, 3, 5, 7, 1, 3, 4, 5, 7, 2, 2, 1, 3, 4, 5 a) Agrupa los datos en una tabla. b) Halla la media, la moda, la mediana y el primer cuartil. c) Calcula el rango, la varianza y la desviación típica. d) Representa el diagrama de barras y el polígono de frecuencias de los datos. a) b) x 7 2 9 0 3,95 Es una distribución bimodal: Mo 3; Mo 4 M 4 y Q1 3 c) Rango 8 1 7; s2 3 2 8 0 7 3,952 3,7475; s 3 ,7475 1,93 d) 1 2 3 4 5 6 7 8 5 4 3 2 1 N.o de personas N.o de películas 14.18 Taller de Fotografía: 25 11% Pilates: 80 36% Curso de Informática: 30 13% Yoga: 40 18% Taller de Pintura: 50 22% 14.17 20 79 387 Actividades Número de vecinos Yoga 40 Taller de pintura 50 Curso de informática 30 Pilates 80 Taller de fotografía 25 N.º películas N.º personas xi fi xi 2 fx i i fi 1 2 2 2 2 3 6 12 3 4 12 36 4 4 16 64 5 3 15 75 6 1 6 36 7 2 14 98 8 1 8 64 La siguiente tabla presenta el número de horas semanales que dedican al estudio los 30 alumnos de una clase de 4.º de ESO. a) Halla la media, la moda, la mediana y los otros dos cuartiles. b) Calcula el rango, la varianza y la desviación típica. c) Representa el histograma y el polígono de frecuencias. d) Dibuja el diagrama de cajas y bigotes. a) x 2 3 1 0 2 7,07; Mo 6; M 6 ; Q1 2; Q3 10 b) Rango 14 2 12; s2 19 3 7 0 6 7,072 15,88; s 1 5,88 3,98 c) d) Cuartil 1.o 2 6 10 Mediana Cuartil 3.o Límite inferior Límite superior 14 0 4 8 12 16 12 10 8 6 4 2 N.o de alumnos N.o de horas 14.19 N.º de horas N.º de alumnos [0, 4) 8 [4, 8) 10 [8, 12) 8 [12, 16) 4 Marcas (xi) fi Fi xi fi xi 2 fi 2 8 8 16 32 6 10 18 60 360 10 8 26 80 800 14 4 30 56 784 30 212 1976 El siguiente histograma representa el dinero gastado en telefonía móvil en un mes por un grupo de 50 estudiantes de Bachillerato. Calcula el gasto medio en móvil del grupo de estudiantes y la desviación típica. La tabla asociada al histograma es la siguiente. El gasto medio es: x 6 5 9 0 5 13,9€ Desviación típica: s 12 0 5 1 0 2 ,5 13 ,92 6,86 De una distribución estadística compuesta por cinco datos, se sabe que su moda es 4, su media es 6 y su mediana es 5. Halla una distribución de cinco elementos con estas características. Una distribución con esas características es: 4, 4, 5, 8, 9. 14.21 8 6 4 2 10 15 20 25 30 10 12 14 N.° de alumnos 5 14.20 Dinero (€) N.o alumnos Marcas xi fi xi 2 ff i i xi [0, 5) 4 2,5 10 25 [5, 10) 12 7,5 90 675 [10, 15) 14 12,5 175 2187,5 [15, 20) 10 17,5 175 3062,5 [20, 25) 6 22,5 135 3037,5 [25, 30) 4 27,5 110 3025 50 695 12 012,5 Utilización conjunta de x y s Se ha realizado un estudio con el fin de averiguar la cantidad de papel reciclado en toneladas de los distintos distritos y se han obtenido los siguientes resultados. 64, 65, 68, 67, 68, 67, 72, 74, 80, 74, 68, 74, 68, 72, 68, 65, 72, 67, 68, 85. a) Halla la media y la desviación típica. b) Calcula el porcentaje de distritos cuyas cantidades recicladas se encuentran dentro del intervalo (x 2s, x 2s) a) x 14 2 0 0 6 70,3; s 99 2 3 0 62 70,3 2 5,1 b) (x 2s, x 2s) (60,1; 80,5). Luego los distritos que se encuentran en ese intervalo son 19, lo que supone un porcentaje del 95 %. Se han medido las temperaturas máximas alcanzadas en dos ciudades durante 10 días consecutivos del mes de agosto, obteniéndose los siguientes resultados. a) ¿Los habitantes de qué ciudad han tenido una temperatura media más alta a lo largo de esos 10 días? b) ¿Qué ciudad ha sufrido una variabilidad de temperatura mayor? c) ¿Qué parámetro has empleado para contestar el anterior apartado? ¿Por qué? a) Ya que x A 2 1 7 0 5 = 27,5 y x B 2 1 6 0 0 = 26 , la ciudad A ha tenido una temperatura media más alta. b) Para ver cuál ha sufrido una variabilidad mayor, debemos calcular el coeficiente de variación de ambas ciudades: sA 2 78 1 6 0 1 27,52 29,85 ⇒ sA 5,46 ⇒ CVA 5 2 , 7 4 , 6 5 0,198 sB 2 68 1 2 0 0 262 6 ⇒ sB 2,45 ⇒ CVB 2 2 ,4 6 5 0,09 Por tanto, la ciudad A ha tenido una variabilidad de temperatura mayor. c) El parámetro empleado es el CV, y se utiliza porque las medias y las desviaciones típicas de las dos distribuciones son distintas, y es la única manera de comparar sus dispersiones. 14.23 14.22 20 1406 99 362 xi fi xi fi xi 2 fi 64 1 64 4096 65 2 130 8450 67 3 201 13 467 68 6 408 27 744 72 3 216 15 552 74 3 222 16 428 80 1 80 6400 85 1 85 7225 A 32 33 24 22 35 30 29 31 20 19 B 27 28 25 31 24 25 24 26 22 28 Las notas obtenidas en la asignatura de Matemáticas por los alumnos de dos clases de 4.º de ESO son las siguientes. a) ¿Cuál es la calificación media de cada una de las dos clases? b) ¿Cuál de ellas tiene las notas menos dispersas? c) ¿Es necesario calcular el coeficiente de variación para poder determinarlo? ¿Por qué? a) La nota media de 4.º A es: x A 1 2 0 0 0 5. La nota media de 4.º B es: x B 1 2 0 0 0 5. b) Para observar la dispersión calculamos las desviaciones típicas de ambas clases: sA 8 2 9 0 6 52 4,45; sB 5 2 5 0 8 52 1,7 Por tanto, 4.º B tiene las notas menos dispersas. c) No ha sido necesario calcular CV, ya que cuando las medias son iguales tiene menor dispersión la distribución que tenga menor desviación típica. La profesora de Educación Física realiza un estudio referente a la altura y el peso de los alumnos de una clase, obteniendo los siguientes resultados: la altura, en metros, del 95 % de los alumnos se encuentra dentro del intervalo (1,52; 1,92), y el peso, en kilogramos, del mismo porcentaje de alumnos se incluye en el intervalo (56,9; 66,1). ¿Cuál de las distribuciones tiene una dispersión relativa mayor? El intervalo que contiene el 95 % de los datos de una distribución es (x 2s, x 2s). Sustituyendo los datos del enunciado obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas para la altura: ⇒ x 1,72; s 0,1. Por tanto: CVa 1 0 , , 7 1 2 0,06 De igual manera, para el peso obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas: ⇒ x 61,5; s 2,3. Por tanto: CVp 6 2 1 ,3 ,5 0,04 En definitiva, la distribución de las alturas tiene una dispersión relativa mayor, ya que su CV es mayor. x 2s 56,9 x 2s 66,1 x 2s 1,52 x 2s 1,92 14.25 14.24 Notas 0 1 2 3 4 5 6 7 8 9 10 4.º A 5 4 1 0 0 0 0 0 1 4 5 4.º B 0 0 2 2 3 6 3 2 2 0 0 xi fi A xi fi B xi 2 fi A xi 2 fi B 0 0 0 0 4 0 4 0 2 4 4 8 0 6 0 18 0 12 0 48 0 30 0 150 0 18 0 108 0 14 0 98 8 16 64 128 36 0 324 0 50 0 500 0 100 100 896 558 Los dos siguientes histogramas muestran los puntos anotados por dos jugadores de baloncesto a lo largo de toda la liga. a) ¿Cuál de ellos alcanza mejor media anotadora? b) ¿Quién es más regular en su anotación? a) Nos creamos la tabla asociada a los histogramas anteriores para poder responder a las cuestiones. La media anotadora del jugador A es: x A 7 4 0 0 0 17,5. La media anotadora del jugador B es: x B 5 4 7 0 0 14,25. Por tanto, alcanza mejor media anotadora el jugador A. b) Para determinar quién es más regular debemos calcular los CV de ambos: sA 13 4 9 0 50 17,5 2 6,52 ⇒ CVA 6 1 , 7 5 , 2 5 0,37 sB 91 4 5 0 0 14,2 52 5,068 ⇒ CVB 5 1 , 4 0 , 6 2 8 5 0,35 Por tanto, es más regular en su anotación el jugador B. C U E S T I O N E S P A R A A C L A R A R S E ¿Puede ser que la media no coincida con ningún valor de la variable? ¿Y la moda? La media puede no coincidir con ningún valor de la variable; sin embargo, la moda siempre estará asociada a un valor concreto de la distribución. 14.27 8 6 4 2 10 15 20 25 30 10 12 N.° de partidos 5 Puntos anotados Jugador A 8 6 4 2 10 15 20 25 30 10 12 N.° de partidos 5 Puntos anotados Jugador B 14.26 Marcas fi A fi B xi fi A xi fi B xi 2 fi A xi 2 fi B xi 2,5 2 0 5 0 12,5 0 7,5 4 10 30 75 225 562,5 12,5 6 12 75 150 937,5 1875 17,5 12 12 210 210 3675 3675 22,5 12 6 270 135 6075 3037,5 27,5 4 0 110 0 3025 0 40 40 700 570 13 950 9150 Averigua el dato que falta en la siguiente distribución para que la media sea 18. 7, 12, 15, 22, 23, 28, 32 18 ⇒ x 5 ¿Por qué en la siguiente tabla la mediana resulta poco significativa? Claramente, la mediana de la distribución es 12, al ser el valor central de la misma; sin embargo, no informa en absoluto de la realidad de la distribución, que está repleta de los valores 3 y 2000. Al preguntar a 30 alumnos cuántas asignaturas han suspendido, 13 de ellos contestan que 5 materias. ¿Qué sector circular le corresponde al valor 5 de la variable Número de suspensos? Le corresponde el sector circular de 156 , ya que si 360 corresponde al total de los alumnos, entonces a 13 alumnos les corresponden 156 . Si se suma a todos los valores de la variable una constante, ¿cómo quedan afectadas la media y la varianza? ¿Y si se multiplican por una constante? Si se suma a todos los valores de la variable una constante, la media queda aumentada en esa constante, mientras que la varianza no varía. Si se multiplican todos los valores de la variable por una constante, la media queda multiplicada por esa constante, mientras que la varianza queda multiplicada por el cuadrado de dicha constante. Pon un ejemplo de una distribución donde la media, la moda y la mediana coincidan. Por ejemplo, la siguiente distribución: 1, 2, 2, 3, 3, 3, 4, 4, 5 En este caso, Media Moda Mediana 3 Puede considerarse también cualquier otro ejemplo que conserve una simetría. El rango es un valor que mide la dispersión de valores de la variable. Calcula el rango de estas dos distribuciones e indica en cuál de ellas el rango es más significativo de la realidad de los datos y por qué. El rango de las dos distribuciones es 40 5 35, es decir, indica una dispersión grande de los datos que es mucho más real en yi que en xi, ya que, en general, en esta última están muy poco dispersos. 14.33 14.32 14.31 14.30 14.29 7 12 15 22 23 28 32 x 8 14.28 xi 3 12 2000 fi 50 1 50 xi 5 15 40 fi 2 25 3 yi 5 15 40 fi 12 2 16 Relaciona cada variable con su desviación típica. Razónalo. s 1,32 s 2,7 s 2,29 s 2,29 s 1,32 s 2,7 Ya que la mayor dispersión se produce en zi , después en xi , y, sin embargo, en yi están muy concentrados los datos. P R O B L E M A S P A R A A P L I C A R En una ciudad de Castilla y León, el 35 % de sus habitantes son hombres y el 65 %, mujeres. Entre las mujeres, el 20 % son niñas; el 25 %, adultas, y el 55 %, mayores. Entre los hombres, el 15 % son niños; el 25 %, adultos, y el 60 %, mayores. Para elaborar un estudio exhaustivo sobre los hábitos cotidianos de la población de esa ciudad, se elige una muestra de 1200 habitantes. ¿Cuál es la muestra más representativa de la población? La muestra más representativa es la 1: 14.35 14.34 xi fi 2 4 4 4 6 3 8 4 yi fi 2 1 4 1 6 13 8 1 zi fi 2 6 4 2 6 1 8 6 xi fi 2 4 4 4 6 3 8 4 yi fi 2 1 4 1 6 13 8 1 zi fi 2 6 4 2 6 1 8 6 Muestra 1 H M Niñ. 63 156 Adul. 105 195 May. 252 429 Muestra 2 H M 58 160 100 182 262 438 Muestra 2 H M 70 145 95 170 255 465 Muestra 1 H M Niñ. 63 156 Adul. 105 195 May. 252 429 La moda y la media aritmética tratan de resumir en un número los valores que la variable ha ido tomando. En ocasiones, la media se ajusta más que la moda a la distribución, y a veces lo contrario. En cada una de las siguientes tablas, ¿qué parámetro (x o Mo ) es más significativo y por qué? En la variable A: x 27,7; M0 2. La moda es mucho más representativa, ya que de 34 datos, 30 toman el valor 2, que es la moda. En la variable B: x 9,8; M0 3, y ya que los datos están mucho más repartidos, es más representativa la media. Los resultados obtenidos al tirar un dado han sido los siguientes. 3, 2, 4, 3, 1, 2, 6, 3, 5, 5, 1, 3, 2 Ordena los datos y averigua los tres cuartiles y la mediana. Ordenación: 1, 1, 2, 2, 2, 3, 3, 3, 3, 4, 5, 5, 6 Los cuartiles son: Q1 2 Q2 3 M Q3 4 A 60 alumnos de Secundaria se les pregunta sobre el tiempo que dedican al ordenador diariamente. Las respuestas obtenidas las refleja este diagrama de sectores. ¿Cuántos alumnos respondieron a las distintas categorías del estudio? Realizando sendas reglas de tres obtenemos los siguientes resultados: A: 13 alumnos; B: 25; C: 14; D: 5, y E: 3. B entre 15 min y 30 min C entre 30 min y 60 min A < 15 min D entre 60 min y 120 min E > 2 horas 150° 18° 30° 78° 84° 14.38 14.37 14.36 xi fi 138 2 254 1 351 1 2 30 yi fi 3 8 7 6 12 7 21 5 Según datos del Plan Nacional de Drogas, la edad media de inicio en el consumo de alcohol es de 13,6 años. En un estudio que se ha realizado en un centro de Secundaria a 54 jóvenes sobre la edad en la que comenzaron a ingerir alcohol, se han obtenido los siguientes resultados. a) Elabora una tabla con los datos del gráfico y calcula su media y su mediana. b) Compara los resultados con la media nacional. a) Media: x 7 5 2 4 5 13,4 Mediana: M 13,5 b) La media nacional es de 13,6, así que el estudio ratifica la bajada de edad en el consumo de alcohol e incluso con una media menor. 20 15 10 5 12 13 14 15 16 N.° de jóvenes 0 11 Edad (años) 14.39 Edad N.o de alumnos Marcas Fi xi f(años) f i i xi [10, 11) 3 10,5 3 31,5 [11, 12) 5 11,5 8 57,5 [12, 13) 11 12,5 19 137,5 [13, 14) 17 13,5 36 229,5 [14, 15) 10 14,5 46 145 [15, 16) 8 15,5 54 124 54 725 El número de asignaturas suspensas en 4.º de ESO en un centro de Secundaria en septiembre viene reflejado en la siguiente tabla. a) Calcula la mediana y los cuartiles. b) Haz un diagrama de cajas y bigotes, y analiza la simetría de la distribución. c) ¿Cuál es la media de suspensos? d) En este centro han definido los siguientes parámetros: el índice de éxito escolar, que mide el porcentaje de alumnos con posibilidad de titular (dos o menos suspensos); el índice de repetición, que establece los alumnos entre tres y seis suspensos, y el índice de fracaso escolar, que determina los alumnos con siete o más suspensos. Calcula los tres índices relativos a la tabla expresados en tantos por ciento. a) Q1 1 Q2 M 4 Q3 6 b) Analizando el diagrama de cajas y bigotes, se observa que hay más concentración de datos en la primera cuarta parte al tener el bigote más corto. Se produce mayor dispersión entre el 25 % y el 50 % que entre el 50 % y el 75 %. Por último, la vertical que corta la caja no está en el centro, lo que indica asimetría. c) x 3 1 9 0 6 5 3,77 d) Índice de éxito escolar 38,09% Índice de repetición 42,86% Índice de fracaso escolar 19,05% En una población nórdica con 2500 habitantes adultos se ha realizado un estudio sobre su altura. La distribución de alturas es normal (unimodal y simétrica). Sabiendo que en el intervalo (172, 196) se encuentran 2375 habitantes y que la altura media es de 184 centímetros, calcula: a) La desviación típica de la distribución. b) El número de habitantes que miden entre 178 y 190 centímetros. a) En el intervalo (172, 196) se encuentran 2375 habitantes, lo que supone el 95 % de la población total. Como el intervalo que contiene el 95 % de los datos de una distribución es (x 2s, x 2s), se tiene que x 2s 172. Sustituyendo los datos del enunciado obtenemos la siguiente ecuación: 184 2s 172 ⇒ 2s 184 172 ⇒ s 184 2 172 6 b) El número de habitantes que miden entre 178 y 190 cm será igual al número de habitantes que se encuentren en el intervalo (178, 190) (x s, x s). Este último intervalo contiene el 68 % de los datos, lo que supone que hay 1700 habitantes que miden entre 178 y 190 cm. 14.41 0 1 4 6 10 14.40 xi 0 1 2 3 4 5 6 7 8 9 10 fi 20 12 8 7 17 13 8 7 5 3 5 xi 0 1 2 3 4 5 6 7 8 9 10 fi 20 12 8 7 17 13 8 7 5 3 5 Fi 20 32 40 47 64 77 85 92 97 100 105 R E F U E R Z O Caracteres y parámetros estadísticos. Gráficos La siguiente tabla muestra las edades de las personas que acuden a un bibliobús de barrio solicitando préstamos de libros en un día cualquiera. a) Halla la media, la moda y el tercer cuartil. b) Calcula la desviación típica. c) Representa el histograma y el polígono de frecuencias. a) La media es: x 5 5 6 0 0 11,2 años. La moda es: Mo 11 años. El tercer cuartil es: Q3 13 años. b) s 65 5 8 0 6 11,22 2,5 c) 6 8 10 12 14 16 18 14 12 10 8 6 4 2 N.o de personas Edad (años) 14.42 Edad N.º de personas [6, 8) 5 [8, 10) 12 [10, 12) 14 [12, 14) 13 [14, 16) 4 [16, 18) 2 Marcas N.o personas Fi xi fi xi 2 f(x i i) (fi) 7 5 5 35 245 9 12 17 108 972 11 14 31 154 1694 13 13 44 169 2197 15 4 48 60 900 17 2 50 34 578 50 560 6586 Observa el siguiente polígono de frecuencias, que muestra las estaturas de las 12 jugadoras de un equipo de voleibol femenino. Calcula la media aritmética y la desviación típica. Nos creamos la tabla asociada al polígono de frecuencias anterior para poder responder a las cuestiones: La media aritmética es: x 21 1 8 2 0 181,67 cm. La desviación típica es: s 396 12 32 5 18 1,672 4,93. Susana, profesora de Educación Plástica y Visual, evalúa a sus alumnos cada trimestre con la media de 10 calificaciones sobre distintas pruebas y trabajos. Bilal ha obtenido, de momento, las siguientes notas: 2, 4, 4, 5, 8, 3, 6, 3, 5 Le queda tan solo la nota del último examen que debe realizar. ¿Qué calificación debe obtener para aprobar la asignatura con un 5? Lo que necesita Bilal es que su media sea 5, es decir: x 5 ⇒ 40 1 + 0 a 5 ⇒ a 10 Por tanto, para aprobar la asignatura con un 5, Bilal debe obtener un 10. 2 4 4 5 8 3 6 3 5 a 10 14.44 65 4 3 175 180 185 190 195 N.° de jugadoras 0 170 Estatura (cm) 2 1 14.43 12 2180 396 325 Marcas (cm) N.o jugadoras xi fi xi 2 f(x i i) (fi) 172,5 1 172,5 29 756,25 177,5 3 532,5 94 518,75 182,5 6 1095 199 837,5 187,5 1 187,5 35 156,25 192,5 1 192,5 37 056,25 Utilización conjunta de x y s Se ha registrado en la siguiente tabla el número de goles marcados por dos equipos de balonmano en 8 partidos del campeonato nacional de liga. a) Calcula el número medio de goles de cada uno de los equipos. b) ¿Cuál de ellos es más regular en su tanteo? a) La media del equipo 1 es: x 1 20 8 2 25,25 goles. La media del equipo 2 es: x 2 20 8 6 25,75 goles. b) Ya que las medias son distintas, para comprobar la regularidad de cada uno debemos calcular el CV: s1 51 8 12 25,2 52 1,2 ⇒ CV1 2 1 5 , , 2 25 0,047 s2 54 8 22 25,7 52 3,83 ⇒ CV2 2 3 5 ,8 ,7 3 5 0,15 Por tanto, es más regular en su tanteo el equipo 1, ya que su CV es menor. Se ha realizado una encuesta entre los alumnos de un colegio de Enseñanza Primaria con el objeto de conocer el número de horas semanales que ven la televisión. El estudio arroja la siguiente información: el número de horas del 95 % de los alumnos se encuentra en el intervalo (3,18; 17,1). Calcula la media aritmética y la desviación típica. El intervalo que contiene el 95 % de los datos de una distribución es (x 2s, x 2s). Sustituyendo los datos del enunciado obtenemos el siguiente sistema de dos ecuaciones con dos incógnitas: x 2s = 3,18 ⇒ x 10,14; s 3,48 x 2s = 17,1 14.46 14.45 EQ. 1 25 24 27 24 26 25 27 24 EQ. 2 28 30 21 22 27 20 28 30 8 8 202 206 5112 5422 Goles fi1 fi2 xi fi1 xi fi2 xi 2 fi1 xi 2 f(x i2 i) 20 0 1 0 20 0 400 21 0 1 0 21 0 441 22 0 1 0 22 0 484 23 0 0 0 0 0 0 24 3 0 72 0 1728 0 25 2 0 50 0 1250 0 26 1 0 26 0 676 0 27 2 1 54 27 1458 729 28 0 2 0 56 0 1568 29 0 0 0 0 0 0 30 0 2 0 60 0 1800 A M P L I A C I Ó N Completa la siguiente distribución con dos datos más de forma que: 2, 5, 6, 7, 7, 9 a) Se conserve la media, pero la desviación típica aumente. b) Se conserve la media, pero la desviación típica disminuya. a) Para que se conserve la media y aumente la desviación típica, podemos añadir los datos 3 y 9. b) Para que se conserve la media y disminuya la desviación típica, podemos añadir los datos 6 y 6. Dadas las distribuciones: ¿En cuál de ellas se puede decir que en el intervalo (x s, x s) se encuentra el 68 % de los datos? ¿Por qué? La tercera variable es la única donde se puede asegurar dicha afirmación, ya que es simétrica y unimodal. En la primera variable no se puede garantizar por ser asimétrica, y en la segunda tampoco por ser trimodal. Estos son los diagramas de cajas y bigotes de tres variables. Determina qué se puede decir de cada uno de ellos en cuanto a los siguientes aspectos. a) Concentración de los datos. b) Dispersión de los datos. c) Simetría. Variable A: Más concentración de datos en la primera cuarta parte al tener el bigote más corto. Más dispersión entre el 25% y el 50 % que entre el 50 % y el 75 %. La vertical que corta la caja no está en el centro, lo que indica asimetría. Variable B: Más concentración de datos en la cuarta parte más alta al tener el bigote más corto. Más concentración entre el 25 % y el 50 % que entre el 50 % y el 75 %. La vertical que corta la caja no está en el centro, lo que indica asimetría. Variable C: Concentración simétrica a lo largo de los cuatro cuartos. Variable A Variable B Variable C 14.49 14.48 14.47 xi fi 1 3 3 7 5 11 7 18 9 21 xi fi 1 15 3 7 5 15 7 8 9 15 xi fi 1 5 3 12 5 25 7 14 9 4 P A R A I N T E R P R E T A R Y R E S O L V E R Echar a andar Se ha realizado un estudio sobre los meses de edad que tenían un grupo de bebés en el momento en que comenzaron a caminar. Los resultados vienen expresados mediante el siguiente histograma, donde las áreas de los rectángulos son proporcionales a las frecuencias. Se sabe que hay 21 bebés que echaron a andar entre los 9 y 10 meses. a) ¿Cuántos bebés se observaron para realizar el estudio? ¿Cuántos comenzaron entre los 10 y 12 meses? ¿Y entre los 12 y 18 meses? b) Se consideran como casos “dentro de lo habitual” todos aquellos cuya edad de echar a andar no se aleje de la media más de tres desviaciones típicas. En estas condiciones, ¿cuántos casos no se pueden considerar como “dentro de lo habitual”? ¿Qué porcentaje representan? a) Construimos la siguiente tabla: Analizando dicha tabla se deduce que se observaron 147 bebés para realizar el estudio. 84 de ellos echaron a andar entre los 10 y 12 meses, y 42, entre los 12 y 18 meses. b) x Σ Σ fi f x i i 17 1 5 4 3 7 ,5 11,93 s Σ f Σ i fi xi 2 x2 21 5 1 0 4 9 7,25 1 1,932 2 (x 3s, x 3s) (5,93; 17,93) Solo se consideran como “fuera de lo habitual” aquellos casos cuya edad de echar a andar haya sido superior a 17,93 meses. Por tanto: 18 4 2 12 18 x 17,93 ⇒ x 0,49 , que representan el 0 1 , 4 4 7 9 100 0,33 %. 2 1 0 9 10 18 Edad (meses) 3 4 5 6 12 14.50 Intervalos Marcas fi fi xi fi xi 2 [9, 10) 9,5 21 199,5 1895,25 [10, 12) 11 84 924 10 164 [12, 18) 15 42 630 9450 Totales 147 1753,5 21 509,25 La encuesta Se quiere realizar una encuesta entre los alumnos de un centro escolar sobre sus preferencias en materia de actividades extraescolares. El siguiente gráfico muestra la distribución de los alumnos según el sexo y el nivel que estudian. Para el estudio se ha elegido una muestra de 50 alumnos distribuidos de la siguiente forma. ¿Crees que la composición de la muestra es la adecuada o, por el contrario, habría que variar la misma? Justifica tu respuesta. La distribución de los alumnos, en porcentajes, es: Repartiendo los 50 alumnos de la muestra de acuerdo con los porcentajes quedaría: Considerando que los números deben ser naturales y sumar 50, la distribución más ajustada de la muestra es precisamente la aportada en el enunciado. 1.° y 2.° ESO N.° de alumnos 200 0 3.° y 4.° ESO Bachillerato 180 160 140 120 100 80 60 40 20 Chicos Chicas 14.51 1.º - 2.º ESO 3.º - 4.º ESO Bachillerato Chicos 12 10 3 Chicas 13 9 3 1.º - 2.º ESO 3.º - 4.º ESO Bachillerato Chicos 24,14% 19,31% 5,52% Chicas 26,21% 17,93% 6,90% 1.º - 2.º ESO 3.º - 4.º ESO Bachillerato Chicos 12,07 9,655 2,76 Chicas 13,105 8,965 3,45 A U T O E V A L U A C I Ó N El entrenador de un saltador de longitud decide estudiar las últimas diez pruebas en las que participó su pupilo, obteniendo la siguiente tabla. a) Halla la media, la moda, la mediana y el primer cuartil. b) Calcula el rango y la desviación típica. c) Representa un histograma. a) La media es: x 8 1 0 0 ,7 8,07 m. La moda es: Mo 8,05 m. La mediana es: M 8,05 m. El primer cuartil es: Q1 7,95 m. b) Rango 8,25 7,85 0,4 m. La desviación típica es: s 651 1 , 0 40 5 8, 072 0 ,0156 0,125. c) El histograma que se obtiene es el siguiente: 7,8 7,9 8 8,1 8,2 8,3 3 2 1 N.o de saltos Longitud (m) 14.A1 Longitud del salto (m) N.º de saltos [7,8; 7,9) 1 [7,9; 8,0) 2 [8,0; 8,1) 3 [8,1; 8,2) 2 [8,2; 8,3) 2 10 80,7 651,405 Marcas N.o saltos xi fi xi 2 f(x i i) (fi) 7,85 1 7,85 61,6225 7,95 2 15,9 126,405 8,05 3 24,15 194,4075 8,15 2 16,3 132,845 8,25 2 16,5 136,125 Si la media de una distribución es x 1,97 y la desviación típica es s 0,08, halla el intervalo en el cual se encuentran el 99 % de los datos de la distribución. El intervalo que contiene el 99 % de los datos de una distribución es (x 3s, x 3s). Por tanto, al sustituir los datos del enunciado en el intervalo obtenemos (1,73; 2,21), que es el intervalo pedido. En las aulas de Bachillerato de un centro escolar hay 100 alumnos en la modalidad de Humanidades y CC. SS., 54 en la de CC. NN. y de la Salud, y 78 en la de Artes. Representa estos datos en un diagrama de sectores. El siguiente diagrama de barras nos muestra el número de libros leídos en un año por las treinta personas que trabajan en una oficina. a) Calcula la media aritmética y la desviación típica. b) ¿Cuál es el coeficiente de variación? a) Nos creamos la tabla asociada al diagrama de barras anterior para poder responder a las cuestiones: La media es: x 6 3 9 0 2,3 La desviación típica es: s 1 3 9 0 1 2,32 1,04 b) CV x s 1 2 ,0 ,3 4 0,45 N.° de personas 0 4 12 10 8 6 4 2 1 2 3 N.° de libros leídos 14.A4 Bach. Hum. y CC.SS: 100 43% Bach. CC.NN y Salud: 54 23% Bach. Artes: 78 34% 14.A3 14.A2 30 69 191 Libros leídos N.o personas xi fi xi 2 f(x i i) (fi) 1 8 8 8 2 10 20 40 3 7 21 63 4 5 20 80 M U R A L D E M A T E M Á T I C A S M A T E T I E M P O S El precio de la gasolina La capacidad media de un barril de petróleo es de 158,98 litros. El coste medio del barril en el mercado de Londres durante un determinado mes es de 70 dólares. Si el precio de la gasolina, en ese mismo mes, fue de 1 euro por litro y un dólar se cotizó a 0,7 euros, ¿cuál fue la diferencia entre el precio de coste y el de venta? Precio de un litro de petróleo en dólares: 15 7 8 0 ,98 0,4403 Precio de un litro de petróleo en euros: 0,4403 0,7 0,3082 Diferencia, en euros, entre el precio de venta y el de coste: 1 0,3082 0,6918 €