ESPACIOS CON PRODUCTO INTERIOR Y ESPACIOS NORMADOS EJERCICIOS RESUELTOS PDF

Ortogonalidad y norma inducida por el producto interior , Desigualdad de Schwarz y angulo entre vectores , Proyecciones, proceso de ortogonalizacion, factorizacion QR , Aproximacion optima de un vector por elementos de un subespacio , Espacios vectoriales normados , Definiciones y ejemplos, Distancia en espaciosvectoriales normados , Normas que provienen de productos interiores, Normas equivalentes ,Construccion de normas en espacios de dimension finita a partir de normas en Rn, Aproximaciones optimas en espacios normados , ¿Que norma utilizar? , Ejercicios resueltos y ejercicios propuestos

CLICK AQUI PARA OTRA OPCION DE DESCARGA - VISUALIZACION www.Matematica1.com 4 I Espacios con producto interior v espacios normados El propósito de este capítulo es dotar de una "geometría" análoga a la de]R2 y]R3 a otro tipo de espacios vectoriales, de manera que, conceptos tales como producto punto, ángulo entre vectores, perpendicularidad, norma de un vector y distancia entre vectores adquieran significado en otros espacios; por ejemplo, en el de polinomios, en el espacio de funciones, en el espacio de matrices o en el de sucesiones; aun si en éstos no existe una forma física de "observar" dicha geometría. Lo anterior, como veremos después, no es un simple capricho con fines de generalización, sino que es de gran importancia teórica y aplicada. Para poder hacerlo, es necesario generalizar el producto punto de ]Rn a estos espacios, ya que a partir de él, como vimos antes, fue posible precisar dichos conceptos geométricos en el espacio ]Rn. A esto nos abocaremos en la primera sección de este capítulo; para que en las siguientes secciones y subsecciones podamos introducir los conceptos geométricos de los que hemos hablado. Como siempre, los últimos dos segmentos están dedicados a la resolución de ejercicios y problemas, y a proponer ejercicios para que el lector practique. 4.1 Espacios con producto interior Para lograr extender el concepto de producto punto de los espacios ]Rn a otros espacios vectoriales necesitamos abstraer las propiedades esenciales del producto punto que son, precisamente, las que enunciamos en la página 123. Recordemos estas características esenciales. ' En]Rn el producto interior (producto punto) se define como: y tiene las propiedades: 1. u·v= v·u, 2. (Au) ·v= A(u,v), n (X¡,X2,'" ,xn) . (Y¡,Y2, ... ,Yn) = LXiYi i=l 3. u·(v+w) = u·v+u·w, 4. u· u ? ü , 5. u·u=ü<=;,u=Chn; 1 Les llamamos propiedades esenciales porque cualquier otra propiedad del producto punto se deduce de éstas. www.Matematica1.com 235 4.1.1 Definiciones, ejemplos y propiedades Definición 4.1 (Definición de producto interior) Sea E un espacio vectorial. Un producto interior (producto escalar) en E es una función que a cada par de vectores U, v E E, le asigna un número real denotado como (u, v), llamado el producto interior de u con v (también se acostumbra denotarlo por (ul v)), que satisface las siguientes condiciones: l. (u, v) = (V, u) (Simetria) 2. (>.u, V) = >.(u, v) (Homogeneidad) 3. (u, v + w) = (u, v) + (u, w) (Aditividad) 4. (u, u) 2" O (Positividad)2 5. (u, u) = O <=? u = DE \/V, u, w E E Y 7>. E JR. Demostrar que (x,y) es un producto interior en JR2 .... DEMOSTRACiÓN. Si u = (a,b), v = (c,d), w = (e,f) E JR2 Y >. E JR: 1. 2. 3. y (u, V) = ac - 2ad - 2bc + 5bd (V,u) = ((c,d),(a,b)) = ca-2cb-2da+5db = ac-2ad-2bc+5bd. Es decir, (u, v) = (V, u). (>.u, v) = (( >.a, >'b), (c,d)) = >.ac - 2>.ad - 2>'bc + 5>'bd = >.[ac-2ad-2bc+5bd] = >.(u, V) (u,v+w) = ((a,b),(c+e,d+ f)) = a(c+e) -2a(d+ f) -2b(c+e)+5b(d+ f). (u, v) = ac - 2ad - 2bc + 5bd, (u,w) = ae-2af-2be+5bf; (u, v) + (u, w) = a(c+e) - 2a(d + f) -2b(c+e) +5b(d + f); 2Con frecuencia, a las propiedades 2 y 3, se les cita diciendo que el producto interior es bilineal; y a las propiedades 4 y 5, mencionando que el producto interior es definido positivo. www.Matematica1.com esto es, 4. de donde, (u, u) 2" O. (u~ ,~v +w~) = (u~,~V) + (u~,~W) . (u,u) = a2 - 2ab - 2ba+ 5b2 = a2 -4ab+5b2 = a2 - 4ab + 4b2 + b2 = (a-2bj2+b2 2"0; 5. Si u = (0,0), claramente (u,u) = O. Si u = (a,b) y (u,u) = O, entonces (a - 2bj2 + b2 = O, de ahíquea=b=Oyqueu=(a,b) =(0,0) . • ~ Ejemplo 4.2 En ]Rn, el producto punto de vectores es un producto interior ..... ~ Ejemplo 4.3 (Producto interior en el espacio defunciones continuas). En el espacio de las funciones continuas, C[a,b] se define, para f,g E C[a,b], (f,g) = t f(t)g(t)dt. Comprobemos que (f,g) es un producto interior: 1. Si f,g E C[a, b] 2. Si.\ E]R Y f,g E C[a,b], 3. Sif,g,hEC[a,b] (f,g) = t f(t)g(t)dt = t g(t)f(t)dt = (g,f). (Af,g) = t (Af)(t)g(t)dt = t Af(t)g(t)dt = .\ t f(t )g(t )dt = .\(f,g). (f,g+h) t f(t)(g+h)(t)dt t f(t)[g(t)+h(t)]dt t [f(t)g(t) + f(t)h(t)]dt www.Matematica1.com 4. Si f E C[a,b] t f(t )g(t )dt + t f(t )h(t )dt (f,g) + (f,h). (f,f) = t f(t)f(t)dt = t[f(t)fdt ';>0. 5. Si f = e,e(x) = O\;lx E [a,b], entonces (f,f) = (e,e) = ¡b e2(t)dt = ¡b O.dt = O. Si f E C[a,b] y (f,f) = O, es decir r: f2(t)dt = O, sea Entonces, F(x) = [f2(t)dt. F(a) = [f2(t)dt = O, F(b) = t f2(t)dt = O. Ya que f es continua, P también lo es. Así, por el teorema fundamental del cálculo,3 F'(x)=P(x)?O \;Ix E [a,b]. Luego, F es creciente en [a,b] (pues su derivada es positiva ahí). Entonces, F(a) <; F(x) <; F(b), \;Ix E [a,b]; y puesto que F(a) = O = F(b), se tiene que F(x) = O \;Ix E [a,b]. Por tanto, f2(x) = F'(x) = O \;Ix y, por ende, f(x) = O \;Ix E [a,b]. Es decir, f es la función e, el neutro aditivo de C[a,b] ..... 3Recuerde que el teorema fundamental del cálculo establece que si g E C[a,b] y se define G(x) ~ J: g(t)dt, x E [a,b], entonces G'(x) ~g(x) \Ix E [a,b]. www.Matematica1.com ~ Ejemplo 4.4 Calcular (f,g) ene[O,l], sif(x) =xy g(x) = eX .... Solución Haciendo u = x, dv = eXdx e integrando por partes, se tiene (f,g) = l xexdx = xeXI6 -11 eXdx = e- e XIoI = e-(e-1) = 1. V El producto interior definido en e [a, b] se puede motivar intuitivamente de la manera siguiente: sean N un entero no negativo, h = b ~ a y x j = a + jh, j = 0,1, ... ,N, la partición correspondiente al dividir el intervalo [a,b] en N subintervalos cada uno de longitud h. Sea x¡ E [Xk-I,Xk] un punto cualquiera de este k-ésimo subintervalo, para cada k = 1,2, ... ,N. Entonces, si definimos ak = f(xk)vh y bk = g(xk)vh para cada k = 1,2, ... ,N, tenemos, por definición de la integral definida, que para N grande b N 1 f(x)g(x)dx ~ ¿J(xk)g(xk)h a k=1 De hecho, la aproximación es exacta en el límite; es decir, b N 1 f(x)g(x)dx = J~~f(xk)g(xk)h = lím (al,a2, ... ,aN) ·(b l ,b2, ... ,bN), N-+= lo cual significa que el producto interior en e [a,b] es, en este sentido, un caso límite del producto punto de estos vectores en ]RN cuando N tiende a infinito. ~ Ejemplo 4.5 Sea 'JJl2x2 el espacio vectorial de las matrices cuadradas de orden 2. Se define para A = [aij], B = [bij] E 'JJl2x2 , Por ejemplo, ([ -~ ~], [_~ ~]) = (-1)(3)+(1)(0)+(2)(-2)+(1)(2) = -5. Demostrar que (A,B) es un producto interior en 'JJl2x2 . ... www.Matematica1.com DEMOSTRACiÓN • 1. (A,B) all bll + a12b12 + a21 b21 + a22b22 bllall +b12a12 +b21 a21 +b22a22 (B,A) . 2. Si.\ E]R Y A = [aij] E 'JJl2x2 , entonces (M,B) = (.\all)b ll + (.\a12)b 12 + (.\a2¡)b 21 + (.\a22)b 22 = .\(allbll +a12b12 +a21b21 +a22b22) = .\ (A,B). 3. SiA = [aij] ,B = [bij],e = [Cij] E 'JJl2x2 , entonces, (A,B+e) = all (bll +Cll) +a12 (b 12 +C12) 4. Si A = [aij] E 'JJl2x2, entonces, +a21 (b21 + C2¡) + a22 (b22 + C22) = (allb ll + a12b12 + a21b21 + a22b22) + (allCll + a12c12 + a21c21 + a22C22) = (A,B) + (A, e) . 5. SiA = [~ ~], entonces claramente (A,A) = O. Inversamente supongamos que y que (A,A) = O, entonces, lo cual implica all = a12 = a21 = a22 = O y, por tanto, A = [~ ~]. De 1, 2, 3, 4 Y 5 (A,B) es un producto interior en 'JJl2x2 . • ~ Ejemplo 4.6 (Producto interior en matrices). En general, en el espacio vectorial 'JJlmxn, si A = [aij],B = [bij] Y se define entonces, (A,B) es un producto interior. En realidad, si se reflexiona un poco, es inmediato ver que si f; y Oí son, respectivamente, las filas i de A y B, consideradas como vectores de ]Rn, entonces, (4.1) www.Matematica1.com En efecto, para cada i = 1,2, ... , m: n L aijbij j~¡ De donde se tiene (4.1). SeanahoraA,B,C E 9Jlmxn con sendas filasE;, G¡ y H¡, i= 1,2, ... ,m; y.\ E]R. Entonces (note que utilizaremos las propiedades del producto punto en ]Rn): 1. (A,B) (B,A) . 2. (M,B) f (.\F;) ·O¡ 1=1 f.\(F;·o¡) 1=1 .\ (A,B) . 3. (A,B+C) fF;· (O;+H¡) 1=1 m --+ --+ m --+ --+ LE;· G¡+ LF;-H¡ i=l i=l (A,B) + (A,C). m 4. (A,A) LE; .E; i=l m L 11F;11 2 2" O. i=l 5. Claramente, siA = {J, entonces, (A,A) = O. Supongamos que (A,A) = O, entonces, m ~ ~ 2 0= (A,A) = ~ IIE;II ' i=l de donde 11F;11 2 = Olfi= 1,2, ... ,m; luego, af¡ +af2 +···afn = Olfi = 1,2, ... ,n; por tanto, aij = O Ifi, j. Es decir, A = {J. De 1,2,3,4 Y 5 (A,B) es un producto interior en 9Jlmxn . .... www.Matematica1.com Definición 4.2 (Traza de matrices cuadradas) Sea M E 9Jlnxn una matriz cuadrada, se denota y define la traza de A como n traCA) = Laií' i=l Es decir, la traza de A es la suma de los elementos de la diagonal de A. ~ Ejemplo4.7 SiA= [-~ ! ],entoncestra(A) =-1+4=3."" ~ Ejemplo 4.8 (Producto interior en matrices mediante la traza). Sean A = [aij],B = [bij] E 9Jlmxn. Mostrar que el producto interior del ejemplo 4.6 definido por (4.1) se puede calcular por la fórmula (A,B) = tra(BtA) ..... DEMOSTRACiÓN. Sea e = BtA, con e = [Pkl], y representemos por F; y Oi las filas i de A y B, respectivamente, consideradas como vectores de ]Rn. Entonces, dado que la componente Pkl de e es el producto de la fila k de Bt con la columna 1 de A y la fila k de Bt es la columna k de B, se tiene Pkl = [ba b2k ... bmk 1 Entonces, los elementos de la diagonal de e son Por tanto, traCe) esto es, n L (blkalk + b2ka2k + ... + bmkamk) k~1 n n n = L blkalk + L b2ka2k + ... + L bmkamk k~1 k~1 k~1 = 01 . PI + O2 . P2 + ... + Om . Pm = PI .01 + P2 • O2 + ... + Pm . Om m (A,B) = LF;· Oi = tra(BtA) • i=l www.Matematica1.com (4.2) o Nota 4.1 Observe que el producto interior en las matrices dado en (4.2) es una generalización del producto punto de vectores; ya que el producto punto de vectores, a· V, se puede calcular mediante el producto matricial (a)' v al escribir los vectores a y v como matrices columna. ~ Ejemplo 4.9 (Producto interior en un espacio de sucesiones). Sea /!2 el conjunto de las sucesiones de números reales (an ) de cuadrado sumable; esto es! /!2 = {( an ) I ¿, a~ es una serie convergente}. n=l 1. Probar que si (an ), (bn ) E /!2, entonces la serie converge (absolutamente). 2. Mostrar que /!2 es un subespacio vectorial del espacio de sucesiones reales5 ]R=. 3. Sea, para cualquier par (an ), (bn ) E /!2, ((an),(bn)) = ¿,anbn n=l (lo cual está bien definido por el inciso anterior). Demostrar que éste es un producto interior en /!2 .... DEMOSTRACiÓN • 1. Sean (an ), (bn ) un par de sucesiones en /!2; entonces, L::~l a~ y L::~l b~ son series convergentes. De (3.5) del lema 3.1 (cfr. pág. 123) tenemos Por lo que la serie de términos no negativos lanllbnl es convergente6 y, por tanto, la serie L:i:l anbn es (absolutamente) convergente7 2. (i) Claramente la sucesión constante cero (an = OVn) pertenece a /!2' (ii) De la propiedad de la desigualdad triangular del valor absoluto, se sigue que lan + bnl2 < (Ianl + Ibnl)2 < lanl 2 + 21anllbnl + Ibnl 2 4Naturalmente se puede considerar, donde convenga, e, el espacio de sucesiones (a") tales que ¿;;_oa; converge y ((a"), (h")) = I;;_oan bno 5Ctr. ejemplo 3.12, página 133. 6Recuerde que si O :s; D:n :s; f3n \In, entonces, la convergencia de la serie 2:;_1 f3n implica la convergencia de la serie 2:;_1 an0 7Recuerde que la convergencia de la serie I;;_ l lanl implica la convergencia de la serie 2:;_1 an0 www.Matematica1.com y, por ende, la serie converge. Ya que toda serie que converge absolutamente es convergente, se deduce que converge; es decir, (an + bn ) E /!2' (iii) Si a E lR Y (an ) E /!2, entonces L;;'~l a~ es convergente. Luego, = = L (Aan)2 = L A2a~ n=l n=l y, por tanto, A (an ) E h De (i), (ii) Y (iii) se concluye que /!2 es un subespacio del espacio vectorial de las sucesiones y por tanto un espacio vectorial. 3. Sean (an), (bn), (en) E /!2 Y A E lR; entonces: (a) (b) (e) (d) ((an),(bn)) = L anbn n=l ((Aan),(bn)) = L(Aan)bn n=l n=l = A((an),(bn)). ((an),(bn)+(en)) = ((an),(bn+en)) = = L an(bn+en) n=l n=l = = = L anbn + L anen n=l n=l = ((an ), (an )) = L a~ 2' O. n=l www.Matematica1.com (e) Claramente, si (an ) es la sucesión constante cero, ((an ), (an )) = O. Supongamos inversamente que (( an ) , (an )) = O, para alguna sucesión (an ) E /!2, entonces, a2 < ~ a2 m- ~ n =0', n=l de donde am = O \1m y, por tanto, (an ) es la sucesión constante cero. • ~ Ejemplo 4.10 Sean las sucesiones A = (l/n) y B = (1/ (n + 1)); i.e., las sucesiones {1, 1/2, 1/3, ... } Y {1/2, 1/3, 1/4, ... }. 1. MostrarqueA,BE/!2. 2. Calcular ((1/n),(1/(n+1))) ..... Solución 1. Sea J(x) = 1 /x2, x E [1, =). Entonces,j es decreciente en [1, =), pues!, (x) = -1/x2 < O en [1,=); además, ¡= ¡=dx J(x)dx = 2 1 1 X ¡r dx = lím r-+co 1 X2 , [ l]X~r = 11m - r-+co X x=l Por el criterio de la integral, s la serie (4.3) converge. Dado que la serie (4.4) se obtiene de la serie (4.3) suprimiendo el primer término y la serie (4.3) es convergente, se deduce que la serie (4.4) es también convergente. Por tanto, las sucesiones A y B pertenecen al espacio /!2. 2. Sea 1 a b k(k+ 1) = k + k+ 1 ' SSi ¡ es una función no negativa y decreciente en el intervalo [1, =) y la integral impropia Jl~ ¡(x )dx converge, entonces la serie 'i,;_¡J(n) converge. www.Matematica1.com entonces De donde por tanto, b = -1. Así que Entonces, 1 = a(k+ 1) +bk = (a+b)k+a. a = 1, a+b = O; 1 k(k+ 1) 1 1 k k+ 1 . n 1 Sn = ~ k(k+ 1) n (1 1) ~ k - k+1 1111 111 1- + - + - ... - + 2 2 3 3 n n n+1 1 1- 11+1 Luego, (A,B) 1 ,~ n(n+1) = lSr:: (1- n!l) = 1. V o Nota 4.2 También en el espacio /!2 el producto interior, como en el caso del espacio e [a, b], tiene un origen intuitivo en el producto punto de]RN En efecto, si (an ) y (bn ) son un par de sucesiones en /!2, sean UN = (a¡,a2,'" ,aN) Y VN = (b¡,b2, ... ,bN), entonces N lím L akbk N~=k~O lím UN" VN. N~= El lector puede verificar, sin mucha dificultad, las siguientes propiedades del producto interior, que son consecuencias inmediatas de la definición 4.1 y que hacemos patentes en el siguiente teorema. www.Matematica1.com Teorema 4.1 (Propiedades del producto interior) Si E es un espacio vectorial y (.,.) es un producto interior en E, entonces \lu, V, w E E Y \lo:,fJ E]R se cumple: 1. (u, AV) = ),(u, v). 2. (u + v, w) = (u, w) + (¡J, w). 3. (u, o:v + fJw) = o: (u, v) + fJ (u, w). 4. (o:u + fJv, w) = o: (u, w) + fJ (u, w). 5. (u - v, w) = (u, w) - (¡J, w). 6. (u, DE) = O, \lu E E. 7. (u, v) = O \IV E E =} u = DE. 4.1.2 Ortogonalidad y norma inducida por el producto interior En este apartado extenderemos los conceptos de ortogonalidad (perpendicularidad) y norma a un espacio con producto escalar a partir del propio producto interior, como se hizo en el espacio ]Rn. El concepto de ortogonalidad, definido en términos del producto interior nulo de los vectores involucrados, quedará justificado a posteriori al definir el ángulo entre vectores una vez que hayamos probado la desigualdad de Schwarz en estos espacios. A partir de aquí y hasta que terminemos esta sección, supondremos que E es un espacio con producto interior e -). Definición 4.3 (Ortogonalidad en espacios con producto interior) Se dice que u, v E E son ortogonales (perpendiculares) si (u, v) = O. Si u y v son ortogonales, escribiremos u ~ v. ~ Ejemplo 4.11 En C[O, 1T], si ¡(x) = sen(x) y g(x) = cos(x), (senx,cosx) 17': senxcosxdx = o. Por tanto, ¡ ~ g. Es decir, las funciones seno y coseno son ortogonales (perpendiculares) en C[O, 1T] ..... ~ Ejemplo 4.12 En 'JJl2x2 , con el producto interior definido en (4.2), si (A,B) = (1)(1) + (1)( -1) + (2)( -3) + (3)(2) = O www.Matematica1.com o, equivalentemente, (A,B) = tra(BtA) = tra ([ 1 -3 ][ 1 1 ]) -1 2 2 3 = tra ([ -5 -8 ]) 3 5 =0. Por lo que A ~ B en este espacio ..... Las siguientes propiedades de ortogonalidad, enunciadas en el teorema 4.2, son sencillas de demostrar si se utilizan las propiedades del producto interior. Se deja al lector su demostración como ejercicio. Teorema 4.2 (Propiedades de ortogonalidad) Si U, V, W E E, Y a, fJ E ]R, entonces, l. u ~ v, u ~ w =} u ~ au + fJv. 2. Si S = gn (v¡, V2," ., vm) es un subespacio de E y u ~ Vi para cada i = 1,2, ... ,m, entonces u ~ V WES. 3. u ~ v \;Iv E E q u = DE (el único vector en un espacio que es ortogonal a todos los demás es el vector cero, el neutro aditivo). Definición 4.4 (Norma inducida por un producto interior) Se define la norma de un vector u en E como Ilull = V(u,u). A dicho número se le llama la norma inducida por el producto interior (.,.) de E. ~ Ejemplo 4.13 Sea A E 'JJlmxn, A = [aij], con filas F; = (ai[, ai2, ... , ain), entonces, m IIAI12 (A,A)=LF;·F; i=l Es decir, donde la suma se efectúa sobre todas las componentes de la matriz A ..... www.Matematica1.com 11 sen(x) W ::1 _ _ Figura 4-1 • Gráfica de la función y = sen2 (x) y del área bajo esta curva en el intervalo [O, 7r]. La raíz cuadrada del valor de esta área es la norma de la función y = sen (x) en el espacio C[a,b]. ~ Ejemplo 4.14 En C[0,7r] Ilsenxll = v(senx,senx) = VLIT sen2 xdx [lo" 1 - ~os 2x dx r2 [ 1 17r 1 17r] 1/2 I 2x O - 4 sen2x O = V ; ..... La figura 4.1 contiene la gráfica de la función y = sen2 (x) y el área bajo esta curva en el intervalo [0,7r]. La raíz cuadrada de esta área es la norma de la función y = sen(x) en el espacio C[0,7r]. Ésta es la interpretación geométrica que tiene la norma inducida por el producto interior (J, g) = J: J(x)g(x)dx en el espacio de funciones continuas en [a,b]. La norma de una función J es la raíz cuadrada del área bajo la curva y = P(x) en el intervalo [a,b], como hacemos patente en la figura 4.2. Más adelante, cuando veamos el concepto de distancia entre vectores, daremos una interpretación más profunda de la norma inducida por el producto interior9 (cfr. ejemplo 4.21 y la discusión ulterior en la pág. 258) que, grosso modo, establece que la norma de una función J en C[a,b] estima el promedio de los valores cuadráticos que toma una función en el intervalo [a,b]. ~ Ejemplo 4.15 En el espacio de sucesiones, sea A = (;n ) . 1. Mostrar que A E f.2 , el espacio de sucesiones de cuadrado sumable (cfr. ejemplo 4.9). 2. Calcular IIAII, la norma inducida por el producto interior en h .... 1/2 9Con frecuencia a la norma inducida por el producto interior en Cia, b], (J:U(X))2 dx) . , se le llama norma cuadrado medio o norma de promedio cuadrático. www.Matematica1.com f - a b (a) IIfl1 2 a b (b) :: _ _ Figura 4-2 • (a) Gráfica de una función f. (b) Gráfica de la función f2 y del área bajo esta curva en el intervalo la, b], cuyo valor es el cuadrado de la norma de f en el espacio C¡a,b]. Solución 1. Sea, para cada n = O, 1,2, .. . , Entonces, por tanto, 1 1 a n - 22an = 1- 2 2nl2 En consecuencia, a - 4( 1 - 1) . n - 3 22n 12 ' www.Matematica1.com luego, Por lo que, Esto es, A E /!2. 2. De (4.5), se tiene Por ende, lím 4 (1- 1 ) n~= 3 22n 12 4 3 = ( 1 )2 L 2n n=O 4 3 = ( 1 )2 (A,A) = 1 2n 4 3 V4 2 2 IIAII = y/(AA) = = = V3. V , 3 V3 3 (4.5) Nuevamente tenemos, como consecuencia del concepto geométrico de ortogonalidad, el célebre teorema de Pitágoras en una versión mucho más general. Teorema 4.3 (Teorema de Pitágoras en espacios con producto interior) Si E es un espacio con producto interior (.,.) y x .1 y en E, entonces, DEMOSTRACiÓN • Como x.l y, (x,y) = O. Entonces, (x+y,x+Y) (x+y,x) + (x+y,y) (x,x) + (y,x) + (x,y) + (y,y) IIxl12 + 2 (x, y) + IIW IIxl12 + IIYI12. • Es fácil ver, aplicando el teorema anterior, que si Xl,x2, ... ,Xk E E son ortogonales entre sí, entonces, la cual es una versión más general del teorema anterior. www.Matematica1.com 4.1.3 Desigualdad de Schwarz y ángulo entre vectores Vector proyección Si 11 Y v son dos vectores en JR2, el vector proyección de 11 sobre v se obtiene trazando una línea perpendicular a v que pase por 11, como se ilustra en la figura 4.3. Generalizamos este concepto a espacios con producto interior en la siguiente definición. \ \ \ \ \ \ \ \ \ \ \ \ -"==::J_ Figura 4·3 • El vector proyección ji de un vector i1 sobre un vector ji en JR2. Definición 4.5 En un espacio con producto interior se define el vector proyección, p, de 11 sobre v (v # DE), como aquel que satisface: l. p Egn(v). 2. 11-p 1.. V. Por la primera condición, se tiene que p = AV; y, por la segunda, Lo que implica y, entonces, o (u - p, v) (11, v) - (p, v) (11, v) - A (V, v) (11, v) - Allvl1 2 . (11, v) A = Ilv11 2 ' ~ (11, v) ~ p = IIvl12 V. Con lo que hemos probado el siguiente teorema. www.Matematica1.com Teorema 4.4 Si V, u E E (con v f= DE), entonces el vector proyección p de u sobre v está dado por ~ Ejemplo 4.16 Sean u = (1,1) Y v = (2,0), entonces, u·v V IIvl1 2 (1,1)· (2,0) (2,0) 11(2,0)11 2 ~ (2,0) (1, O) ..... (4.6) ~ Ejemplo 4.17 Si ¡(x) = eX y g(x) = e-2x en e [O, 1]' con el producto interior definido en el ejemplo 4.3,10 entonces, la proyección de ¡ sobre g está dada por Por una parte, tenemos y, por otro lado, Luego, (x) = (f(x),g(x)) (x). p IIg(x) 11 2 g (f(x),g(x)) (g(x),g(x) ) 11 (e-2x ) 2 dx 11 e-4Xdx ~ (1-e-4 ). 4(1-e-1 ) -2x p(x) = -4 e ..... l-e lODe aquí en adelante, en todos los ejemplos con los que se trabaje, se supondrá que los productos escalares en cada espacio son los que hemos definido en los ejemplos previos en este capítulo, a menos que se indique otra cosa. www.Matematica1.com ~ Ejemplo 4.18 Si A = [ - ~ ~] y B = [~ - ~ ] en 'JJl2x2, entonces (A,B) = 1 y así que la proyección de A sobre B es P (A,B) B IIBI12 1 [O -1] 5 2 O O 1 2 O5 ] .~ 5 ~ Ejemplo 4.19 Sean A = (31n ) y B = (;n ) , puesto que y para todo n y las series = 1 ~ l = (1)2 geométricas L y L son convergentes, se sigue que L y n=O 2n n=O 3'1 n=O 2n = (1)2 L n son convergentes; por tanto A,B E R2 . Hallar la proyección deA sobre B. ~ n~O 3 Solución Tenemos que" (A,B) 1 1 1- 6 6 5 11 Aquí hemos utilizado el conocido hecho de que la serie geométrica L r n converge si y sólo si I rl < 1; Y que en tal caso "-o L r n = 1 . Pudimos haber utilizado en los ejemplos precedentes esta propiedad de las series geométricas, pero hemos emplean_ O l-r do otros criterios más básicos de series con el objetivo de que el lector pueda repasarlos. www.Matematica1.com y, por el ejemplo 4.15, sabemos que Entonces, esto es, p (A,B) B IIBI12 6/5 B' 4/3 ' p_ (9 1) 10 2n es la sucesión proyección de A sobre B. V Como vimos en el capítulo anterior, la desigualdad que permite definir ángulos entre vectores de ]Rn es la de Schwarz. Corresponde establecer ahora su versión en espacios vectoriales con producto escalar. Antes de probar la desigualdad de Schwarz, observemos que, para cualquier u E E Y para todo A E R es decir, IIAul12 (Au,Au) A (u, AU) A2 (U, u) A211uI12 ; IIAUII = IAlllull· Resultado que emplearemos en la demostración de esta desigualdad. Desigualdad de Schwarz Teorema 4.5 Si E es un espacio con producto interior (-,.), entonces, 1(u , VI 1< ; Ilullll)lll \fU,)I E E. (4.7) DEMOSTRACiÓN • Si u = DE 0)1 = DE, claramente (4.7) es cierta. Supongamos que ninguno de los dos vectores es nulo. Sea www.Matematica1.com el vector proyección de 11 sobre V. Entonces 11 - ¡J .1 ¡J. Por el teorema de Pitágoras: 1111112 = 11 (11 - ¡J) + ¡J112 = 11 11 - ¡J112 + 11¡J112. Lo cual implica es decir, 11 ¡~1~1vW 1(1 1, v) 1211~112 IIvl14 V 1(1 1, v) 12 IIvl12 . De donde, y, por tanto, 1I111111vll ~ 1(11101· - o Nota 4.3 Se puede probar que hay igualdad en (4.7) si Y sólo si 11 y v son linealmente dependientes (L.D.). Propiedades de la norma inducida por el producto interior En la subsección 3.1.4, vimos que la norma inducida por el producto punto en lRn , esto es 111111 = VI1· 11, tiene las propiedades enunciadas en el teorema 3.3 (cfr. pág. 127), las cuales se deducen a partir de las propiedades del producto punto en lRn , que son en las que nos basamos para definir un producto interior en general. Así que, como es de esperar, la norma inducida por un producto interior, es decir, 111111 = V (11,11), también debe tener las mismas propiedades que su caso particular en lRn . En el siguiente teorema hacemos patentes las características esenciales de la norma inducida por un producto interior; a partir de ellas se puede deducir cualquier otra propiedad de dicha norma. Teorema 4.6 Sea E un espacio vectorial con producto interior (" .). Entonces, si 111111 = V (11,11) es la norma inducida por el producto interior, se tiene: l. 111111 ~ O \/11 E E. 2. 111111 = O q 11 = DE. 3. II'\ull = 1,\1111111 \fU E E, \/,\ E lR. 4. 1111+ vii <; 111111 + Ilvll \/11, v E E (Desigualdad triangular). www.Matematica1.com DEMOSTRACiÓN • 1. Ilull = vu· U 2' O I;IU E E. 2. IIOEII = V(OE,OE) = vO = O. Supongamos que Ilull = O, entonces (u,u) = O y, por tanto, u = OE. 3. Si A E lR Y u E E, entonces, de donde, 4. Sean u, v E E, entonces, De la desigualdad de Schwarz (4.7) Así que, IIAUl12 (AU,AU) A (u, AU) A2 (u, u) A211u112, IIAUII = IAlllull· (u+v,u+0 (u +v,u) + (u + v, v) (u, u) + (V, u) + (u, v) + (V, v) IIul12 + 2 (u, v) + IIvl12 . (u, v) .;; Ilullllvll. Ilu + vl12 IIul12 + 2 (u, v) + IIvl12 Luego, < IIul12 + 211ullllvll + IIvl12 (11ull + Ilvll)2. Ilu + vii.;; Ilull + Ilvll (4.8) • o Nota 4.4 Se puede probar que hay igualdad en (4.8) si y sólo si uno de los vectores es múltiplo escalar no negativo del otro. Distancia en espacios con producto interior Una vez que se tiene definido un producto interior en un espacio vectorial, se puede introducir el concepto de distancia entre vectores a través de la norma inducida por el producto interior; como hacemos patente en la siguiente definición. www.Matematica1.com Definición 4.6 Si u y v son un par de vectores en el espacio E, se define y denota la distancia entre ellos como d(u, v) = Ilu - vii. ~ Ejemplo 4.20 En 9Jl2x2 si A = [ - ~ ~] y B = [~ ~] , entonces, d(A,B) IIA-BII V(-3)2+(1)2+(-1)2 ,111 ..... ~ Ejemplo 4.21 Sean f y g un par de funciones continuas en [a,b]. Entonces la distancia entre ellas, medida con la norma inducida por el producto interior, es ( b ) 1/2 d(f,g)=lf-gll= 1 (f(x)-g(x))2dx Por ejemplo, si f(x) = 1 Y g(x) = x, entonces en e [O, 1] d(f,g) (11 2) 1/2 ( (l_x)3IX~I) 1/2 (l-x) dx - a 3 x=o La distancia entre dos funciones en e [a, b] es la raíz cuadrada del área de la diferencia cuadrática entre ellas en el intervalo [a,b], como se ilustra en la figura 4-4. a b :: _ _ Figura 4-4' Gráficas de las funciones J, g, (f - g)2 Y del área bajo esta curva en el intervalo [a,b]. www.Matematica1.com En realidad, la distancia entre dos funciones en e [a, b] es una medida de la variación promedio cuadrática entre ellas. Para entender esto, primero supongamos que '1' E e [a, b]; y sean N un entero no negativo; h = (b - al/N; Xk = a + kh, k = 0,1, ... ,N; Y x;; E [Xk-¡,Xk] un punto de este k-ésimo subintervalo, k = 1,2, ... ,N. Sabemos de la definición de integral que ¡b 'I'(x)dx = N lím L 'I'(xk)h N-+= k~l (b - a) lím Lr~l 'I'(xk) N-+= N Por lo que, 1, Lr~l 'I'(xk) 1 ¡b ()d 1m = 'l'xx. N-+= N b -a a De aquí que, para N grande, (4.9) Luego, el promedio de los valores de la función en los puntos x;; es aproximadamente el área bajo la curva y = 'I'(x) en el intervalo [a, b], dividida entre la longitud de este intervalo; y esta aproximación es más precisa a medida que es mayor el número de los puntos x;;. Para ilustrar este hecho numéricamente, consideremos el caso particular de la función 'I'(x) = x2 en el intervalo [0,1]. Los valores x;;, que incluimos en la siguiente matriz, se eligieron aleatoriamente del intervalo [0,1] para N = 9: 0.3365 0.2897 0.9254 0.2481 0.1814 0.3306 0.4026 0.5126 0.8847 Entonces, 1 9 L 'I'(xk) = 0.2662 9 k~l N 100 400 900 1600 2500 Lr~l 'I'(xkJ N .3596 .3215 .3370 .3291 .3312 N 3600 4900 6400 8100 14400 Lr~l 'I'(xkJ .3427 .3301 N .3362 .3390 .3327 :::::1 _ Tabla 4-1 • Valores promedio de los j; luego, las componentes de la matriz R = [(Vj,U¡)] son nulas para j < i; es decir, todas las componentes por debajo de diagonal. Así, la matriz R = [(Vj,U¡)] es triangular superior e invertible, pues, por (4.22) (V¡,U¡) f= O para todo i. La matriz A se puede factorizar entonces como el producto de una matriz cuyas columnas son vectores ortonormales y una matriz triangular superior no singular. Hacemos patente esta conclusión en el siguiente teorema. Teorema 4.13 Sean VI, V2, ... , vm vectores linealmente independientes en ]Rn; A la matriz n X m cuyas columnas son estos vectores y {U¡,U2," .,um} la base ortonormal que se obtiene del proceso de ortogonalización de Gram-Schmidt aplicado a la base {VI, V2, ... , vm} del espacio columna de A. Entonces A se puede factorizar como el producto de una matriz Q y una matriz triangular superior invertible R. Específicamente, A=QR, donde el primer factor es la matriz Q cuyas columnas son los vectores u¡ y el segundo factor es la matriz triangular superior no singular R = [(Vj, U¡)]; esto es, (V¡,U¡) (V2,U¡) (V3,U¡) (Vm,U¡) O (V2, U2) (V3,U2) (Vm,U2) R= O O (V3,U3) (Vm,U3) O O O ~ Ejemplo 4.33 Sea 1 1 1 O 1 -1 A= 1 1 O O O 1 1. Mostrar que las columnas de A son L.I. 2. Encontrar una base ortonormal para el espacio columna de la matriz A. 3. Factorizar A como el producto de una matriz Q cuyas columnas sean vectores ortonormales y una matriz R triangular superior ..... www.Matematica1.com Solución 1. Llevemos A a la forma escalonada mediante el método de Gauss: 1 1 1 O 1 -1 O O -1 O O 1 1 1 O 1 O O O O -~ • 1 . O Puesto que toda columna tiene pivote, el sistema AX = 5 sólo tiene la solución trivial y, por tanto, los vectores son L.I. 2. Dado que las columnas forman una base (ya que son vectores L.I.) del espacio columna, podemos aplicar el proceso de ortogonalización de Gram-Schmidt para obtener una base ortonormal: 111 = ;2 (1,0,1,0) = (1;V2,0,1;V2,0). W2 = (1,1,1,0) - ((1,1,1,0). (1/ V2,0, 1/ V2,0) ) (1/ V2,0, 1/ V2,0) = (1,1,1,0) - (2;V2) (1;V2,0, 1;V2,0) = (1,1,1,0) - (1,0,1,0) = (0,1,0,0) :. W3 = (1,-1,0,1) - ((1, -1,0, 1)· (ljV2,0, 1/V2,0)) (I/V2,0, I/V2,0) - ((1, -1,0, 1) . (O, 1,0,0)) (O, 1,0,0) = (1, -1,0,1) - (1;V2) (1;V2,0, 1;V2,0) - (-1 )(0,1,0,0) = (1, -1,0,1) + (-1/2,0, -1/2,0) + (O, 1,0,0) = (1/2,0,-1/2,1) : 3. Por el teorema 4.13, 1 1 V2 O V6 O 1 O Q= 1 1 V2 O V6 2 O O V6 www.Matematica1.com y si Vi son los vectores columna de A, Como y entonces, R~ [ (V¡,U¡) (V2,U¡) (V3,U¡) 1 O (V2, U2) (V3, U2) O O (V3,U3) (V¡,U¡) = (1,0,1,0)· (1;V2,0, 1;V2,0) = 2;V2, (V3,U2) = (1,-1,0,1)·(0,1,0,0) =-1 R= O O 1 O -1 3 V6 El lector puede verificar que efectivamente A=QR realizando el producto. V Matrices ortogonales Sea A una matriz cuadrada. Supongamos que las columnas de A son vectores Ki orto normales de ]Rn. Entonces, si cij es la componente i j del producto AtA, ~ ~ {1 si i = j cij = K';Kj = O en otro caso (4.23) Luego, AtA es la matriz identidad. Recíprocamente, si A es una matriz cuadrada de orden n tal que AtA = 1m la identidad de orden n, entonces nuevamente se tiene la relación (4.23) y, por ende, las columnas de esta matriz son vectores ortonormales de ]Rn. Hemos probado así el siguiente teorema. www.Matematica1.com Teorema 4.14 Sea A una matriz cuadrada de orden n. Las siguientes condiciones son equivalentes a pares: l. Las columnas de A son vectores ortonormales de ]Rn. 2. AtA =ln. 3. AesunamatrizinvertibleyA-1 =At Definición 4.10 Una matriz cuadrada A de orden n que satisface una de las condiciones del teorema 4.14 (y, por tanto, las otras dos) se llama matriz ortogonal. 15 ~ Ejemplo 4.34 Sean los vectores Entonces, si tenemos AtA = -lV6 3 O 1 O O 1 O O 1 [ O -v2/2 V2/ 2 Así los vectores 1110112 y 113 son orto normales (cfr. ejemplo 4.31) y la matriz A es ortogonal. .... o Nota4.6 1. Observe que si las columnas de una matriz A son ortonormales, entonces sus filas también y viceversa; pues, AtA = 1 q AAt = l. 2. En el caso de que A sea una matriz cuadrada, el teorema de factorización QR (4.13) afirma que si las columnas de A son vectores L.I., entonces A se puede factorizar como el producto de una matriz ortogonal con una matriz triangular superior. 15 Sería más adecuado usar el término ortonorrnal, pero éste se reserva para bases y no es común su uso en la literatura de álgebra lineal. www.Matematica1.com 4.1.5 Aproximación óptima de un vector por elementos de un subespacio En la figura 4-8 se ilustra el conocido hecho de geometria elemental que establece que la distancia mínima de un punto a una línea recta o a un plano es la longitud de la línea perpendicular de ese punto a la línea recta o al plano. En términos de lo que en este texto hemos estudiado, esto significa que la distancia mínima de un vector a un subespacio es la norma de la diferencia entre este vector y su proyección sobre el subespacio. En el siguiente teorema mostraremos que este hecho geométrico también es válido en espacios con producto interior. Nuevamente esta generalización no es una simple curiosidad matemática, sino que es de gran importancia en la teoría de aproximación; tema que introduciremos más adelante. La demostración de este teorema se basa en un artificio algebraico y el teorema de Pitágoras en espacios con producto interior; sin embargo, este artificio es completamente intuitivo geométricamente y vale la pena gastar un poco de tiempo en su explicación. En (b) de la figura 4-8, el segmento de línea que va del vector proyección p al punto u es ortogonal a todo punto de S y, por tanto, a toda línea de este plano; así que en particular es ortogonal a la línea recta que pasa por los puntos p y v. Por ende, el segmento de línea recta que va del punto u al punto ves la hipotenusa del triángulo rectángulo que pasa por los puntos u, p y v; y como en todo triángulo rectángulo la longitud de la hipotenusa es mayor que las longitudes de los catetos, se tiene d(u,p) <; d(u, v). P (a) (b) ==::::::1- Figura 4-8 • (a) La menor distancia de un punto P, exterior a una línea recta, está dada por la longitud de la perpendicular de la línea recta al punto P. (b) La menor distancia de un punto 11, exterior a un plano S, a cualquier punto ji del plano, se alcanza en el vector proyección ¡; de 11 sobre S. Teorema 4.15 Sean S un subespacio de E de dimensi6nfinita, u E E un vector dado y p E S el vector proyecci6n de u sobre S. Entonces Ilu - pll <; Ilu - vii \:IV ES. Es decir, el mínimo de la distancia d(u, v), cuando v varía en S, se alcanza en v = p. DEMOSTRACiÓN • Sea v E S cualquier vector, entonces p - v E S. Por lo que u - p .1 P - v; así (por el teorema de Pitágoras) Ilu - vl12 II(u - p) + (p - v) 112 Ilu - pl12 + IIp - vl12 > Ilu _ p112; www.Matematica1.com de donde Ilu - vii 2' Ilu - pll· • En forma equivalente, el teorema 4.15 afirma que dados un elemento u del espacio E y S, un subespacio de dimensión finita, existe un elemento P E S, de entre todos los elementos de S, que es el que mejor aproxima a u en el sentido de la norma inducida por el producto interior; es decir, 16 mnllu-vll = Ilu-pll VeS (4.24) Además, como el lector seguramente ya intuyó, el vector proyección p de u sobre S es el único elemento de S que aproxima óptimamente a u en S; esto es, cumple con la relación (4.24). En efecto, si PI E S y Ilu - PIII <; Ilu - vii para todo v E S, entonces se debe tener de donde se desprende Ilu-PIII <; Ilu-pll y Ilu - pll <; Ilu - PIII Ilu-PIII = Ilu-pll· Puesto que P es el vector proyección de u sobre S, u - P ~ v para todo v E S, en particular u - P ~ P - PI E S. Por el teorema de Pitágoras se tiene lo que implica y, por tanto, Ilu-PII1 2 = 1 (u-pl+(p-ptlI1 2 =, u_pI1 2+ IIp-P111 2 = Ilu - Jh 11 2 + IIp - P1112; PI =p. En resumen, hemos probado que en cualquier espacio con producto interior, E, dados un vector u y un subespacio S de dimensión finita, existe un único vector P E S tal que Ilu-pll <; Ilu-vll WES; es decir, para el cual (4.24) se cumple; donde 11·11 es la norma inducida por el producto interior y, en este caso, el vector P es la proyeción de u sobre el subespacio S. Llamaremos a P la aproximación óptima (o la mejor aproximación) de u en S (relativa a la norma inducida 11·11). 16La notación llÚn Ilil - vii significa el valor mínimo del conjunto de números reales {llil - viii v E S}. 'leS www.Matematica1.com o Nota4.7 1. En el último apartado de este capítulo estudiaremos el concepto de aproximaciones óptimas, pero en subespacios normados cuya norma no necesariamente proviene de un producto interior. 2. Una norma en el sentido más general, como veremos en la siguiente sección, es una función que permite medir magnitudes de vectores y distancias entre ellos; como se hace con la norma usual en ]Rn o con las normas inducidas en espacios con producto interior. Sin embargo, como veremos más adelante, no toda norma proviene de un producto interior. 3. De igual manera a como ocurre en espacios con producto interior veremos, en la siguiente sección, que en un espacio vectorial normado (aunque la norma no provenga de un producto interior), dado un vector 11 y un subespacio de dimensión finita S, siempre existe al menos una aproximación óptima para este vector en S; pero dicha aproximación no necesariamente es única. A continuación, encontraremos la aproximación óptima de vectores en subespacios para dos casos particulares en el espacio de funciones continuas, con el fin de ilustrar esta importante teoría. Aproximación con polinomios de Legendre ~ Ejemplo 4.35 Sean E = e [-1, 1] el espacio de funciones continuas en [-1,1] dotado del producto interior (f,g) = L J(x)g(x)dx, S2 = gn( 1,x,x2 ) y J E E una función dada. Apliquemos el proceso de ortogonalización de GramSchmidt a la base {1 ,x,x2 }: entonces U1 1 \12" W2 = x- (x, 1hl2) 1;V2, (x,1/V2)1;V2 = ~ (x, 1) IIxl12 1 t xdx 21-1 1 x2 11 2 -1 = O, ¡>2dX x311 3 -1 2 3 ' www.Matematica1.com así que por tanto así que La base ortonormal es (X2, I/V2l1/V2 = ~ l/dX = 1 X311 2 3 -1 1 3' = V3/ 2 x 41 1 4 -1 =0; 8 45 ' 1 U3 = IIw311 W3 =~v~(X2-D· Entonces, por (4.14) del teorema 4.11 (cfr. pág. 269), la proyección P2 de f sobre 52 es www.Matematica1.com Por ejemplo, si ¡(x) = sen(1TX), entonces!7 (f,UI) = 11 sen(7rx) ~ dx = o, -1 y2 (f,U2) = 11 sen(7rx) /3 xdx = 1 V6, -1 V 2 7r (f,U2) =11 sen(7rx) 3 /5 (x2_ 1 )dX=0. -1 2 V 2 3 Luego, p2(X) = 1 V6 /3 x 7r V 2 3 = X 7r es el polinomio de grado a lo más dos que mejor aproxima a ¡(x) = sen(7rx) en el sentido de que tiene el valor más pequeño al compararla con [1 (f(x) _q(x))2 dx para cualquier polinomio q(x) de grado a lo más dos. Las gráficas de ¡(x) y P2 (x) se ilustran en la figura 4-9. De hecho el lector puede comprobar, realizando la integral, que Ilsen(7rx) - ! xii ~ 0.6261572471. Las gráficas de (f(x) - P2 (x))2 Y de (f(x) - q(x))2, para q(x) = (1/10) (x2 - 2x + 2), se ilustran en la figura 4-10; en ella se puede apreciar que aparentemente el área bajo la curva (f(x) - P2(X))2 es menor 0.8 0.6 OA 0.2 O -0.2 -OA -0.6 -0.8 -0.5 O 0.5 :::::1 _ Figura 4-9 • Gráficas de ¡(x) = sen( 7rx) y la proyección, P2(X), de esta función sobre el subespacio S2 = gn(l,x,x2). 17Dejamos los detalles de los cálculos de las integrales de ejercicio para el lector. www.Matematica1.com 1.8 1.6 lA ~ (¡(x) -q(x)? 1.2 (¡(x) - P2(X)? 0.8 ~ 0.6 OA 0.2 O -1 -0.5 O 0.5 ~ _ Figura 4-10 • Gráficas de las funciones (¡(x) - P2 (x)? y (¡(x) - q(x)? El área bajo la primera curva debe ser inferior al área bajo la segunda curva. que el área bajo la curva (f(x) _q(x))2 en [-1,1]. Efectivamente, 11 (sen(1TX)-q(x))2dx= 1 (600 + 8537r) -1 7507r ~ 1. 391981242 de donde!8 Ilsen(7rx) -q(x)11 ~ V1.391981242 ~ 1.179822547 ..... A los polinomios ortonormales que se obtienen al aplicar el proceso de ortogonalización de GramSchmidt a la sucesión de polinomios L.I. en C[ -1, 1]' se les llaman polinomios de Legendre (nomIalizados). Estos polinomios tienen importantes aplicaciones en la teoría de aproximación, en física, en ecuaciones diferenciales, etc. Los primeros tres polinomios de Legendre normalizados los hemos calculado en el ejemplo precedente. Se puede probar que estos polinomios, antes de normalizar, están dados por la relación k! dk 2 k Wkll = (2k)! dxk (x -1) Por ejemplo, para k = 2, !"Recuerde que 11 sen( 1CX) - P2(X) 11 fue aproximadamente 0.6261572471. www.Matematica1.com que es el mismo polinomio que obtuvimos en el ejemplo anterior. Para k = 3, tenemos de donde 3! d3 (2 ) 3 W4 = 6! dx3 x - 1 3 =x3 - x 5 ' 2 V14' 35 ' 1 1 /7 (3 ) U4= Ilw411W4= 2V 2 5x -3x . De manera similar (los detalles del cálculo se dejan de ejercicio al lector), podemos obtener y 1 /11 U6 = 8 V 2 (63x5 - 70x3 + 15x) . 2.5 .--------,------,--------,------, 2 1.5 0.5 O -0.5 -1 -1.5 -2 -2.5 '--___ ---'-____ ....J.... ___ -'-___ ----' -1 -0.5 O 0.5 ::1_- Figura 4-11 • Gráficas de los primeros 6 polinomios de Legendre (normalizados). En la figura 4-11, se bosquejan las gráficas de los primeros 6 polinomios de Legendre, u;(x), que calculamos en el ejemplo precedente y en la ulterior discusión. Es claro que podemos extender este proceso y, dada una función continua f en el espacio C[ -1,1] Y un número entero no negativo n, construir un polinomio de grado a lo más n, combinación lineal de polinomios de Legendre, que es la mejor aproximación de f, de entre todos los polinomios de grado a lo más n, respecto a la norma inducida por el producto interior en C[ -1,1]. Así, por ejemplo (se dejan los detalles de los cálculos allector), la mejor aproximación para f(x) = sen( lTX) en 54 = gn( l,x,x2 ,x3 ,x4 ), el espacio de polinomios de grado a lo más 4, es www.Matematica1.com y la mejor aproximación de f en el espacio de polinomios de grado a lo más 6 es sen( 1TX) 0.8 P4(X) 0.6 OA 0.2 O -0.2 -OA -0.6 -0.8 -l~----~~~------~------~------~ -1 -0.5 o 0.5 == _ Figura 4-12' Gráficas de ¡(x) = sen(1TX) y P4(X). Observe que la diferencia entre las áreas bajo estas curvas (y entre las propias curvas) es muy poca. 0.045 0.04 0.035 0.03 0.025 0.02 0.015 0.01 0.005 -0.5 o 0.5 == _ Figura 4-13 • Gráfica de (¡(x) - P4(X))2 El área bajo esta curva es menor que el área bajo la curva (¡(x) - P2(X))2 Un bosquejo de las gráficas de f(x) = sen( 1TX) y P4(X) se ilustra en la figura 4-12. Mientras que la figura 4-13 contiene el área bajo la gráfica de la función (f(x) - P4(x)2, que ahora es menor que en el caso de aproximación en 52. Un cálculo un poco laborioso, el cual omitiremos, produce: Ilf(x) - P4(X) 11 ~ 9.370289878 x 10-2 y Ilf(x) - P6(X) 11 ~ 6.08092 8379 x 10-3 . www.Matematica1.com Parece que 11/(x) - Pn(x) 11 tiende a cero en la medida en que n aumenta. De hecho, esto no es un fenómeno que sólo sucede para I(x) = sen(1rx); en realidad, se puede probar que si I es cualquier función continua en C[-I, 1] y, para cada n E N, Pn es el polinomio de grado a lo más n que es la mejor aproximación relativa a la norma inducida por el producto interior para I en el espacio de polinomios de grado!9 a lo más n, entonces lím 11I - Pnll = O n~= (4.25) que equivale a Entonces, si se satisface 4.25, la sucesión (Pn) converge en promedio cuadrático a la función l. En general, en un espacio vectorial E con producto interior, se dice que un conjunto orto normal de vectores {un} es completo, si para todo v E E existe una sucesión Pn de combinaciones lineales finitas de los vectores Ui, que converge en promedio cuadrático a V. En este sentido, el conjunto de polinomios normalizados de Legendre es completo en C[ -1,1]. Aproximación por polinomios trigonométricos Sea n un entero no negativo y sean las funciones 1f'o(x) = 1, 1f'2k-¡(X) = cos(kx), 1f'2k(X) = sen(kx); k = 1,2, ... ,n; esto es, las 2n+ 1 funciones continuas 1f'o(x) = 1, 1f'¡(x) = cos(x), 1f'2(X) = sen(x), 1f'3(X) = cos(2x), 1f'4(X) = sen(2x)"",1f'2n-¡(X) = cos(nx), 1f'2n = sen(nx). Recordemos las identidades trigonométricas 1 sen(A)cos(B)= 2 (sen(A+B)+ sen(A-B)) (4.26) 1 cos(A)cos(B)= 2 (cos(A+B)+cos(A-B)) (4.27) 1 sen(A)sen(B)= 2 (cos(A-B) -cos(A+B)) (4.28) SeanA,B E {O, 1,2, ... ,2n + 1}, conA f= B. De (4.26): 1 h l1h sen(Ax) cos(Bx)dx = (sen ((A + B)x) + sen ((A - B)x)) dx o 2 o = 1 [(_ 1 ) COS((A+B)X)l h 2 A+B o + (-A ~B) cos ((A-B)x) C] =0. 19Recuerde que Pn es combinación lineal de polinomios de Legendre normalizados. www.Matematica1.com De (4.27): De (4.28) 1 27r cos(Ax) cos(Bx)dx 1127r = (cos ((A + B)x) + cos ((A - B)x)) dx u 2 o = 1 [( 1 ) sen ((A +B)x) 127r 2 A+B o =0. 1 27r sen(Ax)sen(Bx)dx = 1127r (cos ((A - B)x) - cos ((A + B)x)) dx o 2 o = ~ [ (A~B) Sen((A-B)X)C - (A!B) Sen((A+B)X)C] =0. Si A = B f= O, (4.26) implica 1 27r sen(Ax) cos(Bx)dx = 1127r sen(2Ax) dx o 2 o = - ~ cos(2Ax)I~7r =0. Con lo que hemos probado que y, por tanto, las funciones,pj son ortogonales en el espacio C[0,21T]. Por otra parte, al utilizar las identidades trigonométricas 2 1- cos2u sen u = 2 2 1 + cos2u cos u = 2 obtenemos (27r 1 (27r Jo sen 2 (Ax)dx = 2Jo (l-cos(2Ax))dx = 1T - 4~ sen(2Ax) 1~7r =1T www.Matematica1.com y (27r cos2(Ax)dx= 1 (27r (l+cos(2Ax))dx Jo 2 Jo = 7r + 4~ sen(2Ax)I~7r = 7r. Finalmente, (27r Jo dx = 27r. AS'I , e1 conj.u nto d e funC·l Ones { 'Po, 'PI, ... , 'P2n } , d on d e 'Po -- /1 ' 'P j -- ,p! j' .] -- 1, 2 , ... , 2n·, esto es y 27r y7r 1 1 1 'Po(x) = ! ,'PI(X) = ! cOS(X),'P2(X) = / sen(x), y27r y7r y7r 1 1 'P3(X) = V 7r COS(2X),'P4(X) = V7rsen(2x), ... (4.29) 1 1 'P2n-I(X) = V7r coS(nx),'P2n(X) = V7r sen(nx) es un conjunto ortonormal de funciones en e [0,27r]. A todo elemento del subespacio de dimensión 2n+ 1, Tn = gn( 'Po, 'PI, ... , 'P2n) = gn( ,po, ,pI, ... , ,p2n), se le llama polinomio trigonométrico. Entonces, si J es una función continua en [O, 27r], por el teorema 4.11, la proyección de J sobre el espacio de polinomios trigonométricos está dada por 2n pn = L (1, 'Pk) 'Pk k~O donde que es (4.30) donde, para k = 0,1,2, ... ,n, ak = 1 (27r J(x) cos(kx)dx Y bk = 1 (27r J(x)sen(kx)dx 7rJo 7rk (4.31) A los coeficientes ak Y bk se les dice coeficientes de Fourier de f. El teorema de aproximación garantiza entonces que mínllJ -qll qES www.Matematica1.com se alcanza en Pn. Por lo que Pn es la mejor aproximación para I en el espacio Tn de polinomios trigonométricos para la norma inducida por el producto interior en e [O, 27r]. ~ Ejemplo 4.36 Encontrar la mejor aproximación respecto a la norma inducida por el producto interior en C[0,27r] de la función I(x) = eX en el subespacio de polinomios trigonométricos T2 = gn(l,cosx,senx,cos2x,sen2x) ..... Solución La mejor aproximación para I(x) = eX en T2 está dada por (4.30) para n = 2. Esto es: donde los coeficientes de Fourier están dados por (4.31). Entonces2o 1 1,271" X e2 71" - 1 ao= e dx= 7r u 7r Luego, 1 eh -1 2 [1 eh - 1 1 k (1- eh) ] p2(X) = + L k2 cos(kx) + k2 sen(kx) 2 7r k~l 7r + 1 7r + 1 e h -l[11 1 1 2 ] = 7r 2 + 2 cos(x) + 5 cos(2x) - 2 sen(x) - 5 sen(2x) . Las gráficas de I y su aproximación P2 en T2 se encuentran bosquejadas en la figura 4-14; mientras que la gráfica de la función y = (eX - P2(X))2 y el área bajo esta curva se muestran en la figura 4-15. Nuevamente se puede probar que el conjunto de polinomios trigonométricos orto normales contenidos en (4.29) es completo en C[0,27r]; es decir, para cualquier función continua I en el intervalo [0,27r], existe una sucesión de polinomios trigonométricos Pn, combinación lineal de elementos ortonormales contenidos en el conjunto dado por 4.29, tal que pn converge en promedio cuadrático a 1; esto es, lím 11I - Pnll = O n~= 20Las integrales J eX cos(kx)dx, J eX sen(kx)dx, se pueden resolver mediante integración por partes; los detalles de estos cálculos se dej an de ej ercicio al lector. www.Matematica1.com 600 P2(X) 500 ¡(x) = eX 400 300 200 100 O -100 O 2 3 4 5 6 = __ Figura 4-14' Gráficas de ¡(x) = eX y su aproximación y = P2(X) en h 120000 , , , 100000 Y = (eX - P2(X))2 80000 60000 - 40000 20000 ~ O -- ), O 2 3 4 5 6 Figura 4-15 • Gráfica de la curva y = (eX - P2 (x)? y el área bajo la misma. que equivale a 127r lím (f(x)-Pn(x)?dx=O, n----1-00 o donde pn está dado por 4.30 y los coeficientes de Fourier ak, bk están dados por (4.31). Mínimos cuadrados Supongamos que tenemos un conjunto de datos experimentales (ai, bi), i = 1,2, ... ,n. Para fijar ideas, pensemos que hemos colgado de un resorte distintas masas de magnitudes ai Y hemos medido la elongación bi que producen estos pesos. El propósito es determinar una relación entre el peso que pende y la elongación que produce en el resorte. Para ello, graficamos los pares ordenados (ai,bi) obteniendo el bosquejo www.Matematica1.com ---r---- : b¡ --- - - ------ - - ---- y = ro +r¡x bn - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ~ ~ a¡ ai ~=-_. Figura 4-16 • La línea recta y = ro + r¡x que mejor se ajusta al conjunto de datos (ai, bi) es, de acuerdo con el criterio de mínimos cuadrados, aquella para la cual d = L7~¡ d¡ es mínima, donde di = ro + r¡ ai - bi; es decir, la diferencia entre el valor experimental bi y la ordenada de esta recta en ai. contenido en la figura 4-16. Podemos ver en esta figura que parece ser que la relación entre los pares (ai, bil es aproximadamente linea1. 2 ¡ Por tanto, lo que se pretende encontrar es la línea recta que mejor se ajuste a estos datos. Entonces, si y = ro + rlx es la relación buscada, se debe tener bi ~ ro + rlai, \ji = 1,2, ... , n; lo cual se puede expresar matricialmente como o, b ~Ar, con A= Entonces, una manera de definir la recta de mejor ajuste a este conjunto de datos, es pidiendo que sea aquella para la cual la distancia entre Ar y b sea mínima; es decir, eligiendo ro y rl de tal manera que sea mínima; lo cual se obtiene por el teorema 4.15, cuando Ar = p, con p la proyección de b sobre el subespacio W = gn( (1,1, ... ,1,1 l, (al, a2, .. . ,anl l. Y, entonces, por 4.16 (4.32) 21 Recuerde que, cuando se recopilan datos experimentales, existen errores en las mediciones. www.Matematica1.com N atemos, de la figura 4-16, que (4.33) donde di = ro + r¡ai - bi para i = 1,2, ... ,n. Así que, con este criterio, la recta que mejor se ajusta al conjunto de datos (ai,bi) es aquella para la cual d es mínima. Dado que se busca el mínimo de la suma de los cuadrados en el lado derecho de 4.33, a este criterio de ajuste se le llama aproximación (discreta) por mínimos cuadrados22 ~ Ejemplo 4.37 Ajustar linealmente por mínimos cuadrados el siguiente conjunto de datos: Solución ai 2 4 5 6 bi 6.5 8.5 11 12.5 Para este caso A t = [ ~ AtA [4 17] = 17 81 ' (AtA)-¡ = 1 [81 -17 35 17 4 [ 81/35 -17/35] 17/354/35 ' 81/35 17/35 [ 3.13 ] 1.53 . -17/35 4/35 ][~ 1 4 1 4 1 5 1 5 1 6 [ 6.5 1 8.5 1~~5 y la recta de ajuste por mínimos cuadrados de este conjunto de datos es y = 3.13 + 1.53x V En general, si se desean ajustar los datos (ai, bi) a un polinomio de grado k Pk(X) =ro+r¡x+r2x2+···+rkxk, 22Cuando aproximamos con polinomios de Legendre y polinomios trigonométricos se hizo mínima una integral de la forma J: (¡(x) - q(x) )2dx para una f dada. A este tipo de optimización también se le dice aproximación (continua) por llÚnimos cuadrados. www.Matematica1.com ponemos: l ro yA~ [ 1 a2 ak 1 ; al rl 1 1 r= 1 an a2 ak rk n n entonces, r = (AtA)-IAtb. Pues ahora el mínimo de liAr - b II se alcanza cuando Al' es la proyección de b sobre el subespacio W=gn((l,l, ... ,l), (al,a2, ... ,an ), (ai,a~, ... ,a~), ... , (a7,a~, ... ,a!)) ~ Ejemplo 4.38 Un objeto se deja caer desde un acantilado y se registra su posición, s, desde ese nivel (considerando positiva la dirección hacia abajo); y resultan los datos de la tabla siguiente: 1 2 3 4 s 4.85 19.55 44.04 78.35 donde t, el tiempo, se mide en segundos y s en metros. Realizar el ajuste por mínimos cuadrados a un polinomio de grado 2 para estimar s(t) en cualquier instante t. Escriba el resultado final redondeando a una cifra decimal. .... Solución En este caso: A~ [ 1 1 1 1 2 4 ] b = [ 149.8555 ] 1 3 9 44.04 Y 1 4 16 78.35 [ 1 1 1 ~l 1 1 1 AtA = 1 2 3 ] 1 2 4 1 3 9 1 4 9 1 4 16 = [ 4 10 30 1 10 30 100 . 30 100 354 Por el método de Gauss-Jordan, obtenemos (los detalles se dejan de ejercicio al lector): 31 4 27 4 5 4 27 4 129 20 5 4 www.Matematica1.com 5 4 5 4 1 4 Entonces, r= [(AtA)-IAt ] b [ 31 27 5 4 4 4 H¡ 1 1 [ 485 1~ ] 27 129 5 2 3 19.55 4 20 4 44.04 5 5 1 4 9 78.35 4 4 4 [ 9 3 5 3 • [ 485] 4 4 4 4 31 23 27 19 19.55 20 20 20 20 44.04 1 1 1 78.35 4 4 4 4 [ -.0375] -.0135 , 4.9025 que redondeado a una cifra decimal produce Luego, el ajuste es Mínimos cuadrados y factorización QR Recordemos que, en el método de minimos cuadrados, al ajustar un conjunto de datos (ai,bi) a un polinomio ro+rlx+"'+rkxk, si b = (b 1, ... ,bn ), r= (ro,rl, ... ,rk) Y A es la matriz que tiene por columnas a [ 1 1 ]', [ al an ]', [ai ... a~]' , ... , [af ... a~]', entonces Sea Q la matriz ortogonal y R la matriz triangular superior del teorema 4.13 para la factorización QR de la matriz A, entonces, puesto que Q es ortogonal (Qt Q = 1) Y la matriz R es invertible, se tiene y, por tanto, r= ((QR)'QR)-I(QR)'b = (R tQtQR)-I(RtQt)b = (R tIR)-I(R tQt)b = (R tR)-I(RtQt)b = R-1(R t )-IRtQtb =R-1IQtb =R-1Qtb luego r es la única solución del sistema www.Matematica1.com Jü=Qtb, el cual se puede resolver (puesto que la matriz R es triangular superior) simplemente haciendo sustitución regresiva. Esto puede representar una ventaja en algunos casos al simplificar los cálculos, pues no se tiene que calcular la inversa de la matriz AtA. ~ Ejemplo 4.39 Ajustar, por mínimos cuadrados, el conjunto de datos contenido en la siguiente tabla a un polinomio de grado 3. a¡ -2 -1 O 1 2 b¡ -3.98 0.90 O -1.02 3.95 .... Solución En este caso: 1 -2 4 -8 1 -1 1 -1 A= 1 O O O 1 1 1 1 1 2 4 8 y primero aplicamos el proceso de ortogonalización a las columnas de A: 11(1,1,1,1,1) 11 = V5, lÍ¡ = )5(1,1,1,1,1). W2 = (-2, -1,0, 1,2) - (( -2, -1,0, 1,2)· U¡)Ul = (-2, -1,0, 1,2), ~ 1 ~ U2 = IIw211 W2 U2 = )10(-2,-1,0,1,2). W3 = (4,1,0,1,4) -((4,1,0,1,4) ·u¡)ul-((4,1,0,1,4) 'U2)U2 = (4,1,0,1,4) - 2V5ul - OU2 = (2,-1,-2,-1,2), ~ 1 ~ U3 = IIw311 W3 U3 = )14 (2,-1,-2,-1,2). W4 = (-8,-1,0,1,8)-((-8,-1,0,1,8)·u¡)ul-((-8,-1,0,1,8)·u2)u2 _(( -8,-1,0,1,8) 'U3)U3 ~ 17 / ~ ~ = (-8,-1,0,1,8)-0- 5 y lOu2- 0 = (-8,-1,0,1,8)-(-354,-1;,0,1;,354) W4 = (- ~, 15 2 ,0, - 15 2 , ~) , www.Matematica1.com y ya que se tiene que U4 = 1 ~ IIw411 W4 U4 = (-110 VlO, ~ VlO,O, - ~ VlO, 110 VlO) . Q= R= 1 2 2 V5 VIO V14 1 1 1 V5 VIO V14 1 O - 2 V5 V14 1 1 1 V5 VIO V14 1 2 2 V5 VIO V14 Vl'Ul = (l,l,l,l,l)'ul =V5, =0, V3 . Ul = (4,1,0,1,4)· Ul =2V5, =0, VIO 10 VIO 5 O VIO 5 VIO 10 V2'U2 = (-2,-1,0,1,2)'u2 =VlO, =0, V4'U2 = (-8,-1,0,1,8)'u2 = 1; VlO, V3 . U3 = (4,1,0,1,4)· U3 =V14, =0, V5 O 2V5 O O VlO O 1; VlO O O V14 O O O O ~VlO www.Matematica1.com y puesto que Qtb = el sistema a resolver es V5 O O O ~V5 ~V5 ~V5 ~V5 ~V5 -3.98 -~VlO - /0 VlO O 110 VlO ~VlO 0.90 IV14 -1~VI4 -~VI4 -1~VI4 IV14 0.00 7 7 -1.02 -110 VlO ~VlO -.03V5 l.394VlO 4.2857 x 1O-3V14 l.177VlO O 2V5 O VlO O 1JvlO O V14 O O O ~VlO O ro rl r2 r3 -~VlO 110 VlO 3.95 -.03V5 l.394VlO 4.2857 x 1O-3V14 l.177VlO cuya solución es, al hacer sustitución regresiva: -3.8571 x 10- 2 j 4.2~~;:~~-3 . . 98083 Al redondear a dos cifras decimales, se obtiene el polinomio ajuste de tercer grado p(x) = -0.04 - 1.94x + 0.98x3 • Las gráficas de los datos (ai,bi) y el polinomio de ajuste p(x) se encuentran bosquejados en la figura 4-17. V 4 3 2 o -1 -2 -3 -4 ~ _ Figura 4-17 • -2 -1.5 ajuste + datos -1 -0.5 o 0.5 www.Matematica1.com 1.5 2 4.2 Espacios vectoriales normados En este capítulo hemos visto cómo en un espacio vectorial con producto interior existe una manera natural de precisar la idea de proximidad entre sus vectores por medio de la norma inducida por el producto interior y la distancia que esta norma define. Pero no en todo espacio vectorial se puede definir un producto interior que sea interesante y, sobre todo, útil. Sin embargo, aunque no se cuente con un producto interior en un espacio, la idea de proximidad entre sus elementos se puede llevar a cabo si se generaliza el concepto de norma de un vector; pues, por medio de la norma se puede definir la distancia entre vectores. Para generalizar el concepto de norma (o módulo) en un espacio necesitamos, como hicimos antes en otras generalizaciones (espacio vectorial, producto interior, etc.), abstraer las propiedades más elementales (o esenciales) que tiene la norma en lRn y en los espacios con producto interior. Estas propiedades son precisamente las que establecimos en los teoremas 3.3 y 4.6 (cfr. páginas 127 y 256). 4.2.1 Definiciones y ejemplos A partir de aquí, ya no supondremos que los espacios vectoriales con los que se trabaje son espacios con producto interior necesariamente. Definición 4.11 (Norma en un espacio vectorial) Sea E un espacio vectorial. Una nonna en E es una función, 11·11 : E -+lR, que a cada vector u E E le asigna un número real denotado como Ilull, llamado la norma (o módulo) de este vector, que satisface las siguientes condiciones: l. Ilull 2' O Vil E E. 2· llull=O{c?u=OE. 3. IIAul1 = IAlllul1 \:lA E lR, Vil E E. 4. Ilu + vii <; Ilull + Ilvll Vil, v E E (desigualdad triangular). Si en E se ha definido una norma, diremos que E es un espacio vectorial normado. ~ Ejemplo 4.40 Ya vimos en el teorema 4.6 que si E es un espacio vectorial con producto interior (-, .), entonces II ull = V (u, u) satisface las cuatro condiciones de la definición precedente; por tanto, la norma inducida por el producto interior es una norma en el espacio E. Así, en particular, en los espacios lRn , 9Jlmxn, t'2 Y e [a, b], II(X¡,X2, ... ,Xnlll = (~X¡) 1/2, II [aij] II = (l~ma¡j)I/2 =tra([aij]'[aij]), l:S;j:S;n II(xnlll = (~X~) 1/2 y Ilfll = (¡b [f(xWdX) 1/2 son normas en sendos espacios ..... www.Matematica1.com ~ Ejemplo 4.41 (Norma cúbica) Para cada u = (X¡,X2,'" ,Xn) E lRn si definimos23 Ilull~ = máx IXil, l:S;l:S;n entonces 11,11= es una norma en lRn , la llamada norma cúbica24 (o norma infinita o norma uniforme). En efecto: 1. Claramente II ull= 2" O \fU E lRn . 2. Es evidente que IiChn 11= = O. Supongamos que u = (X¡,X2,'" ,xn) y Ilull= = O, entonces O <; IXkl <; Ilull= = O para cada k = 1,2, ... ,n; por tanto, IXkl = O Vk, y por ende u = 5~{n. 3. Si A E lR Y u = (X¡,X2,'" ,Xn) E lRn, entonces = máx IAllXil l:S;l:S;n = IAI máx IXil l:S;l:S;n 4. Sean u = (X¡,X2,'" ,xn), V = (Y¡,Y2, ... ,Yn) E lRn. Sabemos, por las propiedades del valor absoluto (cfr. pág. 127), que si a,b E JH!., entonces la+bl <; lal + Ibl; por tanto, IXi+y¡I<;IXil+IYil Vi=I,2, ... ,n. Dado que, para cada i = 1,2, ... ,n, se tiene de donde Es decir, IXil <; Ilu' = y IYil <; Ilvl = De 1, 2, 3 Y 4, 11,11= es una norma en lRn . .... 23La notación rnáx significa el valor máximo del conjunto de números reales {lxll, ... , IXn I}. l :Si:Sn 24Más adelante aclararemos la razón del nombre de esta norma (norma cúbica) y de la notación 11· www.Matematica1.com Mostrar que II . III es una norma en lRn . ..... DEMOSTRACiÓN. L Es claro que Ilulll =L7~llxil2' O\lu= (X¡,X2'''''Xn) E lRn. 2. Es evidente que Ilehn II = O. Supongamos que u = (X¡,X2,'" ,xn) y que Ilulll = O, entonces, para cadak= 1,2, ... ,n, n IXkl <; L IXil = Ilull l = O; i=l de donde IXkl = O\lk= 1,2, ... ,n,portanto, u= 5~{n. 3. Sean A E lR Y u = (XI,X2, ... ,Xn ) E lRn , entonces i=l i=l i=l = IAlllull1 . 4. Sean u = (XI,X2, ... ,xn), V = (YI,Y2, ... ,Yn) E lRn, entonces n Ilu+vll l = L IXi+Yil i=l n <; L (IXil + IYil) i=l n n = Llxil+ LIYil i=l i=l = Ilull l + IIvl12 . De 1,2,3 Y 4,11,111 es una norma en lRn . • ~ Ejemplo 4.43 (Norma 11,11= en 'JJlmxn). Sea A = [aij] E 'JJlmxn, definimos IIAII= = l~\~~ laijl . l~j:S;m Así, por ejemplo www.Matematica1.com De manera análoga al ejemplo 4.41, se puede probar que 11,11= es una norma en 9Jlmxn ; esta demostración se deja de ejercicio al lector ..... ~ Ejemplo 4.44 (Norma 11·111 en 9Jlmxn)' En 9Jlmxn se define, para cada A = [aij], IIAlll = L laijl· l O. Por continuidad de III existe un intervalo J, de una de estas tres formas: [a,o], [xo - o,xo + o] o [o,b], contenido en [a,b] tal que II(xll > O \:Ix E 1. Luego,25 DI(xlldx > O. Pero, también de donde DI(xlldx=O. Entonces ¡ II(xl I dx > O Y ¡ II(xl I dx = O; lo cual es una contradicción. Por tanto, el suponer que I no es la función constante cero, aunque IIIIII = O, nos lleva a una conclusión absurda26 Así, I tiene que ser necesariamente la función constante cero en [a,b]. 3. Si lE C[a,b] y A E R entonces 4. Si I,g E C [a,b], entonces IIVIII = tlV(xlldx = tlAIII(xlldx = IAI t II(xlldx = IAIIIIII I · 111+g11I = tll(xl+g(xlldx <; t (11(xll + Ig(xllldx = t II(xll dx+ t Ig(xll dx = IIIIII + IlglII' De 1,2,3 y411'111 es una norma enC[a,b] . • En la figura 4-18 ilustramos la interpretación geométrica de la norma IIIIII en C[a, b]. 25Hemos utilizado la notación JI I¡(x) I dx para cualquiera de las integrales según se dé el caso. 26 Si el lector no se siente cómodo con esta demostración, puede intentar utilizar el teorema fundamental del cálculo de manera análoga a corno lo hicimos en el ejemplo 4.3 de la página 237. www.Matematica1.com a b (i) ( ii) ~-- Figura 4-18 • (i) Gráfica de una función 1 en Cla, b]. (ii) Gráfica de la función 111 y del área bajo esta curva en el intervalo [a,b]; 1I11h es el valor de esta área. ~ Ejemplo 4.47 (Norma uniforme 11·11= en C[a,b]). Si f E C[a,b] definimos entonces 11·11= es una norma en C[a,b]. A ésta se le llama la norma uniforme27 en el espacio de funciones continuas en el intervalo [a,b]. En efecto; 1. Ilfll= = máxa<;x<;b If(x) 1 2' O \:Ix E [a,b]. 2. Claramente Ilell = O. Puesto que se sigue que If(x)1 S; Ilfll= \:Ix E [a,b], Ilfll= = O =? If(x) < Ilfll= = O \:Ix E [a,b] =? If(x)1 = O \:Ix E [a,b] =? f(x) = O \:Ix E [a,b] =?f=e. 3. Si f E C[a,b] y A E lR, entonces = IAI máx If(x) 1 a5::x5::b = IAlllfll=· 4. Si f,g E C[a,b], entonces para todo x E [a,b]. If(x) + g(x)1 S; If(x) 1 + Ig(x)1 S; Ilfll= + Ilgll=· 27También se le dice norma cúbica o norma infinito. Hemos utilizado nuevamente la notación 1I . 11= por su analogía con esta norma en lR". La notación máx"S~b I¡(x) I significa el máximo de los valores I¡(x) I en el intervalo la, b]; la existencia de este valor está garantizada debido a la continuidad de la función en el intervalo cerrado la, b]. www.Matematica1.com De donde, Porl,2,3y411·11= es una norma en C[a,b] ..... (i) a b (ii) ::::::1_- Figura 4-19 • (i) Gráfica de una función j en C[a,b]. (ii) Gráfica de la función Ijl; la norma Iljll= es el máximo valor que toma esta función en el intervalo [a,b]. En la figura 4-19, se ilustra el significado geométrico de la norma uniforme en C[a,b]. 4.2.2 Distancia en espacios vectoriales normados Definición 4.12 Si 11 . 11 es una norma en un espacio vectorial E y U, v E E, se denota y define la distancia entre este par de vectores (distancia relativa a la norma 11·11) como d(u, v) = Ilu - vii. ~ Ejemplo 4.48 L En JR4 con la norma cúbica, d((-1,2,0,1),(2,0,1,1)) = 11(-1,2,0,1)-(2,0,1,1)11= = 11(-3,2,-1,0)11= = 3. www.Matematica1.com 2. En ]¡¡:4 con la norma 11·111 d((-1,2,0,1),(2,0,1,1)) = 11(-1,2,0,1) - (2,0,1,1)111 = 11(-3,2,-1,0)111 =6. 3. En 9Jl2x2 con la norma 11·11=, =2. 4. En 9Jl2x2 con la norma 11·111, =6 ..... ~ Ejemplo 4.49 EnC[0,2] con la nOfllla Ilfll l = Ji If(x)ldx, sif(x) =x2 y f(x) =x, entonces d(f,g) = Ilf - glll = l f(x) - g(x)1 dx = 12Ix2- xldx. Puesto que x2 <; x en [0,1] Y x2 2" x en [1,2], tenemos si O <; x <; 1, si 1 <; x <; 2; como se ilustra en la figura 4-20. Entonces, 121x2 -xl dx = 11 (x-x2) dx+ J2 (x2 -x) dx =1. Luego, d(f,g) = 1. .... De manera análoga a la norma inducida por el producto interior (f,g) = ¡b f(x)g(x)dx en [a,b], la interpretación geométrica de Ilf-glll = tlf(x)-g(x)ldx www.Matematica1.com 4r---------r---------~--------,_--------~ 3.5 3 2.5 2 1.5 0.5 y =X2 y=X y= IX2-xl 0.5 1.5 2 ~ _ Figura 4-20 • Gráficas de las funciones y = x2; y = x; y = Ix2 - xl; y el área bajo esta última curva en el intervalo [0,21, IIx2 -xlh· es el valor del área bajo la gráfica de la función y = If(x) - g(x)1 en el intervalo [a,b]; como ilustramos en la figura 4-20 para el caso particular de f(x) = x2 y g(x) = x. o Nota 4.9 De aquí en adelante, aunque no se mencione explícitamente, supondremos que E es un espacio normado con norma 11 . 11. Los casos concretos, ya sea para espacios o normas, los haremos patentes específicamente. Bolas y esferas en espacios normados Definición 4.13 Si Uo es un vector del espacio normado E y r > O, a los conjuntos l. S(uo,r) = {VE Ellluo-vll = r}, 2. B(uo,r)={vEEllluo-vll O; Y si x E (xo - r,xo + r), Ix -xol < r. Así, la diferencia entre cualquier punto de este intervalo y el centro del mismo, xo, es inferior a r y este número es el que define el grado de proximidad para puntos respecto a xo. Por ejemplo, si r = 10-6 , entonces la diferencia entre Xo y cualquier punto del intervalo (xo - r,xo + r) es inferior a 0.000001. Dependiendo del valor de r es el grado de proximidad a Xo y ese grado de proximidad es relativo y convencional. Lo mismo sucede con las bolas abiertas en espacios normados, pues en estos casos se utiliza simplemente Iluo - ull en lugar del valor absoluto. Observe que si g E B(jo,r) en la figura 4-26 y r es pequeño, dado que Ifo(x) - g(x)1 <; Ilfo - gll= < r, entonces g(x) es muy cercano a JO(x), para cada x E [a,b]; y, por tanto, la gráfica de la función g es muy próxima a la gráfica de la función JO; por esta razón, la norma uniforme es una herramienta muy útil para medir proximidad en el espacio de funciones continuas. o Nota 4.11 Hemos utilizado los símbolos Iliíll= y 11111= en los espacios ]Rn y C[a,b]. Cuando se haga uso de este símbolo en ]Rn, siempre utilizaremos el término nonna cúbica; mientras que cuando se emplee en C[a, b] diremos que se trata de la norma unifonne (o de algunos sinónimos que veremos más adelante). El contexto en cada caso será suficientemente claro para evitar cualquier confusión. www.Matematica1.com 4.2.3 Normas que provienen de productos interiores Sabemos que todo producto interior (.,.) en un espacio vectorial induce una norma en éste, a saber 11 ull = V (u, u). Supongamos que en el espacio E se tiene dada una norma 11 . 11, surgen naturalmente las siguientes dos cuestiones: 1. ¿Esta norma proviene de un producto interior en E? Es decir, ¿ existe un producto interior (" .) en E cuya norma inducida es precisamente la norma dada II·II? 2. ¿Bajo qué condiciones se puede definir un producto interior en el espacio E por medio de esa norma, de tal suerte que coincida con la norma inducida por ese producto interior? Por fortuna, estos dos interrogantes tienen una respuesta completa; para dar ésta haremos uso nuevamente del origen geométrico que tienen el producto interior y la norma. Identidad del paralelogramo Consideremos el paralelogramo ilustrado en (i), (ii) Y (iii) de la figura 4-27: (i) ( ii) ( iii) == _ Figura 4-27 • • De (i) de esta figura se desprende que e = e 1 por ser ángulos correspondientes y, por tanto, ¡3 = 180 - e. • De (ii) y la ley de cosenos, tenemos • De (iii) y la ley de cosenos, se desprende Ilu + vl1 2 = II u l1 2 + IIvl1 2 - 211 u llllvll cos¡3 = IIul12 + IIvl1 2 - 211ullllvll cos (180 - e) = IIul1 2 + IIvl1 2 - 211ullllvll (- cos (e)) • Tenemos entonces de (4.36) y (4.37) www.Matematica1.com (4.36) (4.37) (4.38) La igualdad (4.38) se llama identidad del paralelogramo y es un hecho conocido de geometría elemental: en todo paralelogramo la suma de los cuadrados de las longitudes de sus diagonales es igual a la suma de los cuadrados de las longitudes de los lados del paralelogramo. Ahora supongamos que tenemos un espacio vectorial E con producto interior (.,.). Sean U, v un par de vectores en este espacio, entonces y Ilu+vI12 = (u+v,u+V) = (u, u) + (u, v) + (v, u) + (¡J, v) Ilu+vI12 = IIul12 +2 (u, v) + IIvl12 Ilu-vI12= (u-v,u-V) = (u, u) - (u, v) - (v, u) + (v, v) Ilu - v112= IIul12 - 2 (u, v) + IIvl12 (4.39) (4.40) Al sumar lado a lado las igualdades (4.39) y (4.40) se obtiene la identidad del paralelogramo en espacios con producto interior: Hemos probado así el siguiente teorema. Teorema 4.16 (Identidad del paralelogramo) Sea E un espacio con producto interior (" .) y norma inducida 11·11. Entonces, \lu, v E E, se cumple (4.41) Por otra parte, si E es un espacio normado con norma 11·11 que proviene de un producto interior, entonces la norma dada y la inducida por este producto deben coincidir y, por tanto, 11· 11 tiene que satisfacer la identidad del paralelogramo (4.41) del teorema 4.16. Es decir, para que una norma provenga de un producto interior es necesario que satisfaga la identidad del paralelogramo. Resumimos este resultado en el siguiente teorema. Teorema 4.17 Sea E un espacio normado con norma 11·11. Para que 11·11 provenga de un producto interior, es necesario que esta norma cumpla con la identidad del paralelogramo (4.41). Así, para probar que una norma no proviene de algún producto interior basta probar, con un contraejemplo, que no cumple con la identidad del paralelogramo. ~ Ejemplo 4.53 Determinar si la norma cúbica, 11 . 11= , proviene de un producto interior en ]Rn ..... www.Matematica1.com Solución Sean u = (1,2,0, ... ,0), v = (2, -3,0, ... ,0) E ]Rn. Por un lado y, por otro, =9+25 =34 2 (1Iull: + Ilvll:) = 2 (11 (1,2,0, ... ,0) 11: + 11(2, -3,0, ... ,0) 11:) = 2(4+9) = 26. De donde se desprende que la norma cúbica no cumple con la identidad del paralelogramo (4.41), por lo que no proviene de un producto interior. V o Nota 4.12 El lector debe reflexionar con cuidado el significado del hecho mostrado en el ejemplo anterior: no existe producto interior en ]Rn cuya nonna inducida sea la nonna cúbica. Supongamos nuevamente que tenemos un espacio con producto interior (-,.) y norma inducida por este producto 11 . 11, entonces, al restar miembro a miembro las igualdades (4.39) Y (4.40) se obtiene Ilu + vl1 2 -llu - vl1 2 = 4 (u, v); de donde, Con lo que hemos probado el siguiente teorema. Teorema 4.18 (Identidad de polarización) Sea E un espacio con producto interior (-,.) y norma inducida 11·11. Entonces, VU, v E E se cumple la siguiente igualdad (4.42) llamada identidad de polarización. Así, para que una norma 11 . 11 provenga de un producto interior (.,.), necesita primero satisfacer la identidad del paralelogramo (4.41); y en caso de que así sea, el producto interior de donde proviene debe cumplir con la identidad de polarización (4.42). Entonces, conjeturamos que si una norma satisface la identidad del paralelogramo, el producto interior definido por (4.42) es, efectivamente, un producto escalar cuya norma inducida es precisamente esta norma. En el siguiente teorema probamos esta conjetura. www.Matematica1.com Teorema 4.19 Sea E un espacio nonnado con norma 11·11 que satisface la identidad del paralelogramo (4.41). Si se define, para cada U, v E E, entonces (.,.) es un producto interior cuya nonna inducida es precisamente 11 . 11. DEMOSTRACiÓN • L Sea u E E, entonces y, por tanto, Puesto que (u, u) = ~ [llu+uI12-IIOEI12] = 1112ul12 4 = 411ul12 4 = IIul12 2' O siendo 11 . 11 la norma dada del espacio, se sigue que, de ser C·) un producto interior, la norma inducida coincide con la norma dada en el espacio; es decir, 11·11 proviene de este producto interior. 2. Si u,VE E, 3. Sean u, v E E, entonces (u, v) = ~ [llu+vI12-llu-vI12] = ~ [llv+uI12 -llv- uI12] = (V, u) . Por la identidad del paralelogramo (4.41) (recuerde que la norma de este espacio la cumple por hipótesis) Y, por tanto, www.Matematica1.com esto es, Sean ahora U, V, w E E tres vectores arbitrarios. Entonces, por (4.43), y Donde Por otra parte, Por la identidad del paralelogramo y Por tanto, Ilu+v+wI12 = II(u +v) +w112 = 211u+v112 +211w112 -llu+v-wI12 = 2 (211u112 + 211vl12 -llu - v112) + 211wl12 -llu+v-wI12 Ilu-v-wf = II(u-w) _v112 = 211u - wl12 +211v112 -11(u - w) +vI12. (u,v+w) = ~ [2(21IuI12+21IvI12_llu-vI12)+21IwI12 -llu+v _w112 - 211u - wl12 - 211vl12 + II(u-w)+vI12] = ~ [41IuI12+21IvI12_21Iu-vI12+21IwI12_21Iu-wI12] = ~ [21IuI12+21IvI12_21Iu-vI12+21IuI12+21IwI12 -21Iu- wI12] = ~ [llul12 + IIvl12 -llu - vl12 + IIul12 + IIwl12 -llu - w112] www.Matematica1.com (4.43) Esto es, (u~, v~ + w~) = (u~,~ v) + (u~, ~w) (4.44) 4. Sean U, v E E un par de vectores fijos pero arbitrarios. Mostraremos por inducción28 que para todo entero no negativo m se cumple (u,mv) = m (u, v) Para m = 1, (u, v) = 1 (u, v) . Sea k > 1 un entero y supongamos que: (u, kv) = k (u, v) Entonces, (u,(k+ l)v) = (u,kv+v) y por (4.44) y la hipótesis de inducción (4.46) (u,(k+ l)v) = (u,kv+v) = (u, kv) + (u, v) = k (u, V) + (u, v) = (k + 1) (u, v) . Por inducción se sigue que (4.45) es válida para todo entero no negativo m. Por otra parte, Por tanto, (u,-v) = ~ [llu-vI12-1 u+vI12] = - ~ [llu+vI12 -' u- vI12] = - (u, v) (u,mv) = m (u, v) para todo entero m. Sea ahora'\ fe O un número real. Entonces, por (4.43), (,\u, v) = ~ [11,\uI12 + IIvl12 -11'\u - v112] = ~ [,\21IuI12 + ,\211(1/ '\)vI12 - ,\211u - (1/ '\)vI12] =,\2 ~ [lluI12+ 11(1/'\)vI12-llu- (1/'\)vI12] =,\2 (u,(l/'\)V). (4.45) (4.46) 28En el apéndice A se puede consultar un breve estudio del principio de inducción, herramienta fundamental para demostraciones que involucran a los números enteros. www.Matematica1.com Sea q f= O un entero, entonces / 1 ~ ~) 1 (~ ~) \ q u, v = q2 U, qv q (~ ~) = 2 U,V q 1 (~ ~) = u,v. q En síntesis, hemos probado que (u,mv) = m (u, v) para todo entero m, \ 1 u~ ,v~ ) -_ 1 (u~ ,v~) q q para todo entero q f= O; Y por simetría se tiene también (mu, V) = m (u, v) , / ~ 1~) 1(~ ~) \ u, q v = q u, v . Sean ahora p,q un par de enteros con q f= O. Entonces, \ ~ u, v) = \P Gu) ,v ) / 1~~) = P\qU,V = P (u~ ,~v) . q Sea la función f: lR --+ lR definida por f(A) = IIAull· Entonces, por la desigualdad triangular, If(A¡) - f(A2)1 = IIIA[UII-IIA2ulll <; IIA[U - A2ull = IA[ - A2111ull; de donde f es una función continua en lR y, por tanto, la función también es continua en lR. Sea A E lR un número real cualquiera fijo; sea pn una sucesión de números racionales Pn = an/bn que converge a A; esto es, www.Matematica1.com Por la continuidad de29 'P, lím 'P (Pn) = 'P(A); n-+= es decir, (AU, \1) = 'P(A) = lím 'P (Pn) n-+= = lím 1 [IIPnuI12 + 11\1112 -IIPnu - v112] n-+= 2 = lím (Pnu, \1) n-+= = lím pn (u, \1) n-+= = A (u, \1). Por ende, (AU, \1) = A (u, \1) para todo A E lR Y Vu, \1 E E. De 1, 2, 3 Y 4 (-,.) es un producto interior y la norma inducida por éste coincide con la norma del espacio, lo cual demuestra el teorema. • o Nota 4.13 Observe que con el resultado precedente se prueba que una condición necesaria y también suficiente para que una norma en un espacio vectorial provenga de un producto interior, es que cumpla con la identidad del paralelogramo (4.41). En tal caso, el producto de donde proviene está definido por la identidad de polarización (4.42). 4.2.4 Normas equivalentes El concepto de proximidad es relativo a la norma con la que se mide la distancia entre los vectores. No es lo mismo que dos funciones f,g E C[a,b] estén próximas con la norma Ilf - gil = (lb (f(x) - g(x))2 dx y2 que con la norma uniforme Ilf(x) - g(x) 11=. Sin embargo, existen pares de normas para las que dos vectores son próximos respecto a una de ellas si y sólo si son próximos respecto a la otra norma. A este tipo de normas se les dice equivalentes y nos abocamos a su estudio en este apartado. Definición 4.14 Sean E un espacio vectorial y 11,11, 11.11 1 un par de normas en E. Diremos que la primera norma es equivalente a la segunda si existen a, fJ E lR positivos tales que a Ilulll <; Ilull <; fJ Ilulll \fU E E. En tal caso escribiremos Ilull ~ Ilull'. 29La continuidad de gen .\ E JH: equivale a ;~~ I¡(x") - .\1 ~ O para toda sucesión (x") tal que ~~ Ix" -.\1 ~ O. www.Matematica1.com ~ Ejemplo 4.54 En ]Rn la norma canónica 11 (Xl,X2, .. . ,xn) 11 = (Lk~1 xi) 1/2 es equivalente a la norma cúbica lI(xl,x2, ... ,xn)ll= = máxl<;k<;nlxkl. En efecto, si u= (Xl,X2,""Xn), entonces, puesto que IXkl <; Ilull= \fU E E, se tiene Por tanto, Luego, El siguiente teorema es sencillo de probar y su demostración se deja de ejercicio al lector. Teorema 4.20 Sea E un espacio vectorial y 11,11, 11,11', 11,11" nonnas en este espacio. Entonces: l. 11·11 ~ 11·11 (Reflexividad). 2. 11·11 ~ 11,11' =? 11,11' ~ 11·11 (Simetria). 3. 11·11 ~ 11,11' y 11,11' ~ 11,11" =? 11·11 ~ 11,11" (Transitividad). Así, del teorema anterior, si una norma es equivalente a una segunda, por simetría ésta será equivalente a la primera. Por esta razón, de aquí en adelante, diremos que dos normas son equivalentes si satisfacen la definición 4.14. Sean ahora 11·11, 11,11' un par de normas equivalentes en el espacio E, Uo E E Y B(uo,r¡) y B'(uo, r¡) bolas abiertas respecto a sendas normas. Sean a, fJ números positivos tales a Ilull' <; Ilull <; fJ Ilull' \fu E E. 1. Sea r = rt/ fJ, entonces VEB'(uo,r) =? lIuo-vll' < r =? lIuo - vii <; fJ Iluo - vii' < fJr = fJ ~ = rl =? vEB(uo,r¡) =? B'(uo,r) e B(uo,r¡). www.Matematica1.com 2. Sea rl = exr2, entonces vE B(uo,rl) =? Iluo-vll < rl =? IIu~o - V~I II <; 1 IIu~o - v~I I < 1 r I = 1 exr2 = r2 ex ex ex =? V E BI (uo, r2) =? B(uo,r') e B I(uo,r2)' Con lo cual, hemos probado el siguiente teorema que justifica la discusión dada al inicio de esta subsección respecto a la proximidad entre vectores relativa a distintas normas. Teorema 4.21 Sea E un espacio vectorial y 11,11, 11.11 1 un par de normas equivalentes en este espacio. Entonces: l. Toda bola B(uo,r¡) relativa a la norma 11·11 contiene una bola BI(uo,r) relativa a la norma 11·ll i 2. Toda bola B I(uo,r2) relativa a la norma 11.11 1 contiene una bola B(uo,r) relativa a la norma 11·11· La figura 4-28 ilustra este teorema en el caso de las normas equivalentes del ejemplo 4.54 para n = 2. ~ _ Figura 4-28 • Toda bola relativa a la norma canónica contiene una bola del mismo centro relativa a la norma cúbica y viceversa. ~ Ejemplo 4.55 Determinar si las normas 11/111 = ll/(x)ldX y la norma 11/11= = máxo<;x<;tl/(x) 1 son equivalentes en C[O, 1] ..... Solución Supongamos que existen ex > O Y P > O, un par de números reales tales ex 11/11= <; 11/111 <; P 11/11= \jI E C[O, 1]. www.Matematica1.com Sea, para cada número entero positivo m, la función continua Im(x) = e-mx, O <; x <; 1. Entonces, para cada m, Por tanto, Illmll = máx le-mxl = e-mo = 1 Y = 00;<;1 od <; 1 (l-e-m) \/m= 1,2, ... m Pero, el lado derecho de la precedente desigualdad tiende a O cuando m tiende a infinito. Luego, existe 1 mo tal que (1 - e-mo ) < n, tendríamos entonces mo lo cual es una contradicción. Por tanto, estas normas no pueden ser equivalentes30 V El ejemplo precedente muestra que no todas las normas son equivalentes. La dificultad intrinseca de este ejemplo radica en el hecho de que la dimensión del espacio C[O, 1] es infinta. Sin embargo, en espacios de dimensión finita, la situación cambia completamente; pues en ellos resulta ser que todas las normas son equivalentes. Este importantísimo resultado lo hacemos patente en el siguiente teorema, aunque no lo demostraremos aquí; e invitamos al lector a consultar, si así lo desea, la demostración dada en el apéndice C. Teorema 4.22 (Equivalencia de normas en dimensión finita) Si E un espacio vectorial, entonces cualquier par de normas en E son equivalentes; es decir, en un espacio de dimensión finita todas las normas en él son equivalentes. La proximidad de vectores es un concepto fundamental de las matemáticas. A través de la idea de proximidad es como se pueden definir límites, continuidad, derivación, diferenciación, derivadas parciales, optimización (máximos y mínimos locales) para funciones de una y de varias variables; convergencia de sucesiones y series; y conceptos geométricos avanzados que tienen que ver con una importante rama de las matemáticas llamada topología (particularmente de los espacios vectoriales normados en nuestro caso); etc. En todos estos temas de estudio, la proximidad depende de las normas con la que se trabaje; sin embargo, todo aquello que, en términos de proximidad, valga para ciertas normas, seguirá siendo válido si éstas se cambian por sendas normas equivalentes. Por ello, el teorema 4.22 bien 30Note que en este caso sí existe f3 tal que Ilfll! ~ f3llft V fE Cia, b]; pues, dado que If(x) I ~ 11ft para todo x E la, b], se tiene Jo! If(x)ldx ~ Jo! Ilftdx ~ (b- a) 11ft. Luego f3 ~ b-a es un escalar que funciona para este fin. www.Matematica1.com podría ser llamado el teorema fundamental de espacios vectoriales normados de dimensión finita, pues significa que en estos espacios se puede trabajar con las normas que se deseen, evidentemente las más cómodas, pues todo lo que sea válido para ellas (en términos de proximidad) será valido para cualesquiera otras normas de estos espacios. Así que el lector debe tener muy en cuenta esto, utilizar las normas que más convengan y no necesariamente trabajar con normas que, por ser históricas en las matemáticas o por desconocimiento del teorema 4.22, se utilizan con gran frecuencia como es el caso de la norma euclidiana, la norma canónica en el espacio ]Rn. Normas p Terminamos este apartado con un ejemplo de normas que son generalización directa de la norma canónica en ]Rn, las normas 11'llp (p 2' 1). Este ejemplo bien podría haberse dado al inicio de esta sub sección; pero por la dificultad que entraña se decidió ponerlo al final. Además, es una buena excusa para ilustrar el concepto de equivalencia de normas en ]Rn en este extenso conjunto de normas y explicar el porqué de la notación 11·11 = para la norma cúbica. Definición 4.15 Sea p 2' 1 un número real y 11 = (XI,X2, ... ,xnl E ]Rn. Se define A 1I1111p se le llama norma p del vector u. o Nota 4.14 Observe que si p = 2, se obtiene la norma canónica en ]Rn. y si p = 1 se obtiene la norma 11·111 que estudiamos en el ejemplo 4.42. Antes de mostrar que Ilullp es efectivamente una norma, necesitamos probar algunos resultados preliminares. En el lema 3.1 (cfr. pág. 123) vimos que para cualquier par de números reales a y b. El lema 4.2 es una generalización de este resultado que utilizaremos para demostrar la desigualdad triangular de las normas p. Definición 4.16 Sean p > 1 Y p' > 1 números reales. Se dice que p y p' son índices conjugados si ~ Ejemplo 4.56 • p = 2 Y p' = 2 son índices conjugados . 1 1 + = l. p p' • p = 3 Y p' = 3/2 son índices conjugados ..... Las siguientes propiedades de índices conjugados, contenidas en el lema 4.1, son fáciles de probar y su demostración se deja de ejercicio al lector. www.Matematica1.com Lema 4.1 Sean p y p' índices conjugados. Entonces: 1 1 l. =1- 3. p'(p-l)=p. p' p 1 1 2. =1- 4. p(p' - 1) = p' . p p' Lema 4.2 Sean a,b E lR un par de números positivos y p,p' índices conjugados. Entonces, (4.47) DEMOSTRACiÓN • Sea a E lR, O < a < 1, Y sea f: [O, =) -+ lR la función definida por f(x)=x"-ax+a. Entonces, j'(x)=a(x"-I-I) y f"(x) = a(a -1)x"-2 < O en (0,=). Por tanto, el máximo de f en [O, =) se alcanza en x = 1 y, por ende, x"-ax+a<;f(I)=1 7XE[0,=) (4.48) Sean a = l/p Y x = a/b. Entonces O < a < 1 Y a/b E (0,=), por tanto, al sustituir estos valores en (4.48) se obtiene: 1 a 1 + < 1 pb p Multipliquemos ambos lados de la desigualdad (4.49) por b para tener: que equivale a a b + <; b, p p al/Pbl-l/p < a +b- b - p P =;+b(I-~). Pero 1 - 1 = p' (por el lema 4.1); por tanto, la desigualdad precedente se transforma en p l/p l/p' a b a b < + - p p' que es lo que se queria demostrar. • www.Matematica1.com (4.49) o Nota 4.15 Si sustituimos el caso particular p = 2 en (4.47) se obtiene al / 2bl / 2 < a + b -2 2 y al elevar al cuadrado ambos lados de la desigualdad anterior b (a+bj2 a <- 4 que equivale a esto es, Es decir, que la desigualdad (4.47) tiene como caso particular la desigualdad (3.5) del lema 3.1 (cfr. pág. 123); que se utilizó para probar la desigualdad de Schwarz (teorema 3.1, cfr. pág. 124). El siguiente lema establece una generalización de la desigualdad de Schwarz en ]Rn, la desigualdad de Holder, que como en el caso de la desigualdad de Schwarz, servirá para demostrar la desigualdad triangular de la norma p. Lema 4.3 Sean u = (XI,X2, ... ,xn) y V = (YI ,Y2, .. . ,Yn) un par de vectores en ]Rn y p, p* índices conjugados. Entonces l. I~XiYi I <; Ilullp Ilvllp ' (Desigualdad de Holder) (4.50) 2. Ilu + vll p <; Ilullp + 1IVllp (Desigualdad de Minkowski) (4.51) DEMOSTRACiÓN • 1. Sea i E {1, 2, .. . ,n} un índice fijo por el momento y pongamos31 y en la desigualdad (4.47) del lema 4.2, entonces l;Ii=1,2, ... ,n. Al sumar todos los índices desde i = 1 hasta i = n en la precedente desigualdad obtenemos 31 Observe la analogía que hay con la demostración de la desigualdad de Schwarz (teorema 3.1, cfr. pág. 124). www.Matematica1.com que equivale a y, por tanto, n L IXillYil <; Ilullp Ilvllp ' (4.52) i=l Pero, puesto que IXillYil = IXiYil y por la desigualdad triangular para el valor absoluto de números reales, IL7~lXiYil <; L7~1IxiYil, la desigualdad (4.52) implica 2. Para cada i = 1,2, .. . ,n se tiene IXi +YiIP = IXi +Yillxi +YiIP- 1 <; (IXil + IYill IX;+YiIP- 1 = IXillx;+YiIP-1 + IYillx;+YiIP- 1 y, por tanto, n n n L IX;+YiIP <; L IXillx;+YiIP-1 + L IYillx;+YiIP- 1. i=l i=l i=l n L IXil IXi +YiIP- 1 <; Ilullp Ilwllp ' y i=l n L IYillx;+YiIP- 1 <; Ilvllp Ilwllp ' i=l Por lo que n L IXi +YiIP <; Ilullp Ilwllp ' + Ilvllp Ilwllp ' i=l Pero, www.Matematica1.com Por tanto. de donde L?~lIX¡ +y¡IP <; IIUII + Ilvll ; (~n 1 .+ 'IPl 1 /P 4.-i=l Xl Yl ' P P esto es: que equivale (pues 1- 1/ p' = 1/ p) a Es decir, o Nota 4.16 Observe que la desigualdad de HOlder (4.50) tiene como caso particular la desigualdad de Schwarz en ]Rn; pues si sustituimos p = 2 en ésta obtenemos 1 u . vi <; IIul1211 v112; pero 11·112 es precisamente la norma canónica inducida por el producto punto de vectores en ]Rn. Estamos ya capacitados para demostrar que las nOTInas p son efectivamente naTIllas en ]Rn, lo cual hacemos en el siguiente teorema. Teorema 4.23 Si p 2' 1 es un número real, entonces DEMOSTRACiÓN • Si p = 1, ya probamos esta afirmación en el ejemplo 4.42 (cfr. pág. 305). Supongamos entonces que p>1. 1. Ilullp = (L:~llx¡IPll/P 2' O \IU= (Xl,X2, ... ,xnl E ]Rn. 2. Claramente IIO_{n IIp = O. Supongamos que Ilullp = O, entonces n IX¡IP <; L IX¡IP = Ilull~ = O =? X¡ = O \ji =? u = O_{n. n=l www.Matematica1.com 4. La desigualdad triangular ya se probó en el lema 4.3 (desigualdad de Minkowski (4.51». • ~ Ejemplo 4.57 Mostrar, sin utilizar el teorema de equivalencia de normas en espacios de dimensión finita, que si p > 1, entonces en el espacio euclidiano ]Rn . .... DEMOSTRACiÓN • Sea 11 = (XI,X2, ... ,xnl E ]Rn, entonces IXilP <; 111111~ Vi= 1,2, ... ,n. Por tanto, n n L IXilP <; L 111111~ = n 111111~· i=l i=l Luego, Por otra parte, es claro que n 111111~ <; L IXiIP, i=l de donde De (4.53) Y (4.54) se desprende 11 1111= <; 1I1111p <; n l / p 11 1111= Y, por ende, 11'llp ~ 11·11= con a = 1 Y P = nI/p. • www.Matematica1.com (4.53) (4.54) (4.55) p=8 p=5 ~ _ Figura 4-29 • La norma p de cualquier vector tiende a la norma cúbica de éste cuando p toma valores cada vez más grandes. En esta figura hemos graficado las esferas S(O,r) relativas a la norma p = 1,2,3,5,8 Y la esfera SIIII~ de mismo centro y radio relativa a la norma cúbica. Observe cómo las esferas para las normas p son cada vez más cercanas a la esfera para la norma cúbica en la medida en que p crece. Ahora estamos listos para explicar la razón de la notación 11·11= para la norma cúbica. Para ello, fijemos un vector arbitrario Li E ]Rn y calculemos lím 1 Lill p • p--'+= Por (4.55) se tiene de donde Esto es, la norma p tiende a la norma cúbica cuando p tiende a infinito. Debido a este hecho es que tradicionalmente a la norma cúbica se le denota con el símbolo 11·11=. En la figura 4-29, hemos graficado las esferas de centro (O, O) relativas a la norma p para algunos valores crecientes de p y la esfera de mismo centro relativa a la norma cúbica, todas con el mismo radio r. En ella se puede observar cómo las p-esferas se aproximan al cuadrado de arista 2r con centro en el origen (la esfera para la norma cúbica) conforme p aumenta. 4.2.5 Construcción de normas en espacios de dimensión finita a partir de normas en]Rn En esta breve sub sección veremos cómo es posible, de manera natural, construir normas en un espacio de dimensión finita a través de normas en ]Rn. Esta construción siempre dependerá de la base con la www.Matematica1.com que se estén describiendo los vectores del espacio. En realidad, el objetivo de este apartado es ahorrar tiempo al lector para que no tenga que demostrar que las normas que se definen por analogía directa de normas en ]Rn a espacios de dimensión finita, son efectivamente normas en estos espacios. Sean E un espacio vectorial de dimensión finita y {e'¡,e2, ... ,en} una base de este espacio; entonces si u E E, existen escalares al,a2, ... ,an tales que (4.56) Si bl ,b2, ... ,bn son escalares tales que también entonces, y puesto que los vectores ei son L.I., se desprende que ai=bi Vi=1,2, ... ,n. Luego, todo vector u E E se puede escribir como combinación lineal de los vectores ei como en (4.56) de manera única. Si convenimos en que el orden en los términos de (4.56) es el mismo para cualquier vector (el primer término es un escalar que multiplica al primer vector el, el segundo término un escalar por el vector e2, etc., y el último término es un escalar que multiplica al vector en), diremos que la base está ordenada y escribiremos (el, e2, . .. , en) en lugar de {el, e2, ... , en} para subrayar este hech032 En tal caso a (a 1, a2, ... , an) le llamaremos el vector de coordenadas del vector u relativo a la base ordenada (eb e2, ... ,en ). ~ Ejemplo 4.58 Sea la base ordenada (3,x -1,2x2 ) del espacio de polinomios P2. Encontrar el vector de coordenadas del polinomio p(x) = 1 - 3x + 4x2 relativo a esta base ordenada ..... Solución Busquemos escalares al,a2,a3, tales que entonces, y, por tanto, 32 Cfr. la discusión que precede al teorema 4.9 en la página 265. www.Matematica1.com de donde 2 a2=-3,a3 =2,a¡=-3 . Por lo que el vector de coordenadas del polinomio p(x) relativo a esta base ordenada es (-2/3,-3,2). V Sea ahora II . II una norma en ]Rn (no necesariamente la canónica) y (e¡, e2, ... , en) una base ordenada del espacio E. Entonces, si u E E Y (a¡,a2, ... ,an) E]Rn es el vector de coordenadas de u relativo a la base ordenada, definimos Afirmamos que ésta es una norma en E. En efecto: 1. IlullE = II(a¡,a2," .,an)ll2" O I;!u E E. 2. DE = Oe¡ +Oe2 + +0 en, por tanto, IIDEIIE = IID~{nll = o. IlullE = O =? II(a¡,a2, ... ,an)11 = O =? (a¡,a2,'" ,an) = D~{n =? U = a¡e¡ + a2e2 + ... + anen = DE. llAUllE = "A(a¡e¡ +a2e2+"'+anen)IIE =' (Aa¡)e¡ + (Aa2)e2 + ... + (Aan)enIIE = IIA(a¡,a2, ... ,an)11 = IAIII(a¡,a2 •... ,an)11 = IAlllullE· 4. Si u, v E E Y (a¡,a2,'" ,an), (b¡, b2, ... ,bn ) son los vectores de coordenadas de u y v, respectiva~ mente, entonces Ilu +vlIE = II(a¡ +b¡)e¡ + (a2 + b2)e2 + ... + (an + bn)enllE = II(a¡ +b¡,a2 +b2, ... ,an+bn)11 = II(a¡,a2, ... ,an)+(b¡,b2, ... ,bn)11 <; II(a¡,a2, ... ,an)11 + II(b¡,b2, ... ,bn)11 = IlullE + IlvlIE· ~ Ejemplo 4.59 Sea el caso dado en el ejemplo 4.58 y la norma canónica en ]Rn, 11·11. Entonces IIp(x) IIp2 = 11(-2/3, -3,2) II 11 3 Si se toma 11·11= en lugar de la canónica se tiene IIp(x) IIp2 = 11(-2/3, -3,2) 11= = 3 ..... www.Matematica1.com Recíprocamente, toda norma II·IIE del espacio E produce una norma en ]Rn; pues si (a¡,a2," .,an) E ]Rn y U = a¡e'¡ + a2e2 + ... + ane:z, entonces la aplicación en una norma en ]Rn. 4.2.6 Aproximaciones óptimas en espacios normados Aquí veremos cómo es posible encontrar aproximaciones óptimas en espacios normados como lo hicimos en espacios con producto interior; aunque dicha norma no necesariamente provenga de un producto escalar. Definición 4.17 (Aproximaciones óptimas) Sean E un espacio vectorial normado con norma 11,11, u un vector dado de E y S un subespacio. Decimos que p* es aproximación óptima de u en S si o, de manera equivalente, si w!r Ilu - vii = Ilu - p* 11· El siguiente teorema garantiza la existencia de aproximaciones óptimas en el caso de ser S un subespacio de dimensión finita. Su demostración requiere de algunos conceptos básicos de funciones continuas en espacios vectoriales normados y la postergaremos al apéndice C. Invitamos al lector a que la consulte en el momento que desee y recomendamos su lectura, pues tiene aspectos muy interesantes y puede ser de gran provecho el intentar comprenderlos, al menos grosso modo. Teorema 4.24 (Aproximaciones óptimas en espacios normados) Sean E un espacio vectorial normado con norma 11,11, S un subespacio de dimensión finita en E y u un vector dado de E. Entonces, existe una aproximación óptima p* de 11 en S. Aproximaciones óptimas en C[a, b] con la norma uniforme Sean f E C[a,b] y S = Pn = gn(l,x,x2, .. . ,xn); por el teorema 4.24 existe un polinomo p:(x) de grado a lo más n tal que para todo polinomio pn de grado a lo más n. Esto ocurre para cada n E N; como es natural, surge la cuestión de si la sucesión de aproximaciones óptimas P:, n = 1,2, ... , converge a f respecto a la norma uniforme; esto es, www.Matematica1.com 1+E ............ '---- / '- / / / / / / / 1-E '-,--- / I l E I ¡- lE I ~-- Figura 4-30' Si 1 E C[a,b], para cualquier bola abierta B(f, E), relativa a la norma uniforme II'II~, existe un polinomio de grado n dentro de ella. Recordemos que en el caso de las aproximaciones óptimas de polinomios trigonométricos a funciones continuas vimos que esta convergencia se daba en promedio cuadrático; esto es, para la norma 11I - g 11 = (J: (f - g J2 ) 1/2 Para las aproximaciones óptimas, con la norma uniforme, esto también sucede. El teorema que garantiza este hecho es uno de los más célebres e importantes resultados en las matemáticas. A continuación lo enunciamos y haremos su demostración plausible en la discusión posterior. Teorema 4.25 (De aproximación de Weierstrass) Sea I E C[a,b]. Entonces, para cada E> O existe un polinomio pn de grado n (que depende de E) tal que 11I - Pnll= < E (4.57) La interpretación geométrica de este teorema viene ilustrada en la figura 4-30. En ella se muestra una función continua I en un intervalo [a,b], una bola de centro I y radio E respecto a la norma uniforme 11 . 11= y un polinomio Pn dentro de esta bola; por lo cual (4.57) se cumple para este polinomio. o Nota 4.17 1. El teorema de aproximación de Weierstrass equivale a que, para cada función I E C[a,b], existe una sucesión de polinomios (Pn) que converge uniformemente a 1, i.e., lím 11I - Pnll= = O n~= (4.58) En efecto, si (Pn) es una sucesión de polinomios tal que límn~= 11I - Pnll= = O Y E> O es dado, entonces, por definición de límite, existe no E N tal que y se cumple entonces (4.57) del teorema de Weierstrass. Supongamos inversamente que se cumple (4.57) del teorema 4.25, entonces para cada n E N, existe un polinomio Pn tal que www.Matematica1.com de donde se desprende que (4.58) es válida. 2. Si E > O es dado, por el teorema aproximación de Weierstrass existe un polinomio de grado no E N tal que 11!-pf1{)11= 1.<>2 ..... <>n) son las curvas parametrizadas dadas por (4.60). Es así como Chebichev introduce la norma uniforme (también llamada norma de Chebichev) para resolver este tipo de problemas. Note que razón por la cual algunos métodos actuales de solución de problemas análogos a éste son llamados métodos "mínimax". Problema de la cuerda vibrante Supongamos ahora que una cuerda de longitud L está sujeta en sus dos extremos, el izquierdo en el origen de coordenadas y el derecho en (O,L). La cuerda se encuentra tensa con una fuerza de tensión www.Matematica1.com y = ¡(x) ------ L --------~ (a) (b) = __ Figura 4-33' (a) Cuerda tensa, sujeta en sus dos extremos, de longitud L en estado de equilibrio (sin vibrar). (b) "Instantánea", en el tiempo t = T, de la cuerda en uno de sus estados de oscilación. T, como se muestra en la figura 4-33( a). En el instante t = O se modifica su estado estirándola de su posición de equilibrio para que comience a vibrar en el plano x,y (se supone que la amplitud de la vibración es pequeña). En el instante t = T, la cuerda tiene la forma de una función y = ¡(x) como se ilustra en la figura 4-33(b). Se desea encontrar una función y = O tal que 1L(f'(x))2dX <; M2 Y 1 L ( O, existe un subconjunto M del intervalo [a,b] de longitud inferior a E, tal que la subsucesión (,pn) converge uniformemente a la función I en [a, b] - M (y, por tanto, también en promedio).

Archivo

Mostrar más
Related Posts Plugin for WordPress, Blogger...