Geometría Analítica con Matlab/Matrices

De Wikilibros, la colección de libros de texto de contenido libre.

Matrices[editar]

Luego de la fundamentación de la teoría de matrices al final del sigo XIX, se observó que muchas nociones matemáticas que fueron consideradas ligeramente diferentes de las matrices, eran en efecto, similares. Por ejemplo, objetos tales como puntos en el plano bidimensional, puntos en el espacio tridimensional, polinomios, funciones continuas, funciones diferenciables satisfacen las mismas propiedades aditivas y propiedades de multiplicación por escalares. Por lo cual se pensó que era más eficiente y productivo estudiar muchos tópicos a la vez, al analizar las propiedades comunes que ellos satisfacen; este hecho condufo a la definición axiomática de espacio vectorial. La primera publicación sobre el tema se debe al polaco Hermann Grassmann (1808 - 1887), en 1844; en su trabajo dejó planteados los conceptos que se refieren a dependencia lineal, bases y dimensión.

El italiano Giuseppe Peano (1858 - 1932) dio una axiomatización similar a la que actualmente se usa y que fue propuesta posteriormente por el alemán Hermann Weyl (1885 - 1955) ignorando el trabajo de Peano. El éxito de Weyl radicó en el manejo geométrico del espacio vectorial.

Espacio Vectorial[editar]

Un espacio vectorial involucra cuatro (4) "objetos": dos (2) conjuntos V y F, y dos operaciones algebraicas llamadas adición vectorial y multiplicación escalar; V es un conjunto no vacío de objetos llamados vectores. F es un campo escalar, ya se el campo de los número reales, o bien el campo de los números complejos.

La adición vectorial (denotada como ) es una operación entre elementos de V. La multiplicación escalar (denotada como ) es una operación entre elementos de F y de V. Entonces, el conjunto V es llamado espacio vectorial sobre F cuando la adición vectorial y la multiplicación escalar satisfacen las propiedades que se enuncian a continuación:

Para la adición de vectores


Propiedades para la multiplicación escalar:


Si al módulo mencionadao en (A4) se le denomina vector nulo y se denota por O, y teniendo en cuenta que cualquier escalar t multiplicado por él da nuevamente el vector nulo, , se puede decir:

NOTA 1 Si x es un vector no nulo y , entonces el escalar K es 0.

Esto resulta al suponer que , entonces , lo cual es absurdo.

Independencia Lineal[editar]

Dados los vectores y los escalares , una expresión de la forma


es llamada uan combinación lineal de ellos.

Un conjunto de vectores se dice linealmente independiente, o que es un sistema libre si la única combinación lineal igual al vector nulo es aquella en que todos los escalares son cero. En caso contrario, se dice que es linealmente dependiente o que es un sistema ligado.

Subespacio[editar]

Si V es un espacio vectorial sobre F y si , entonces W es un subespacio de V si bajo las operaciones de V, W mismo forma un espacio vectorial sobre F.

Para establecer la estructura de subespacio no es necesario revisar todas las 10 condiciones definidas para determinar si un subconjunto es también un subespacio. Para tal fin se plantean dos caracterizaciones:

atención
atención
'Caracterización 1: Sea un conjunto no vacío. Entonces W es un subespacio de V si y solo si

Prueba

Sólo si se quiere probar que W es subespacio de V.

Con , resulta (A1). Las propiedades asociativa y conmutativa [(A2), (A3)] las conserva el subconjunto W. Con se obtiene , y con ello se cumple (A4). Ahora, dado , tomando se concluye que el opuesto y en consecuencia por (A1) satisface (A4). Si y se tiene (M5).

Las restantes propiedades (M2), (M3), (M4) son consecuencia por ser W subconjunto del espacio vectorial V.

Una segunda caracterización tiene en cuenta únicamente las condiciones clausurativas (A1) y (M1):

atención
atención
'Caracterización 2: Sea un conjunto no vacío. Entonces W es un subespacio de V si y solo si

Prueba

Sólo se requiere establecer que (A1), (M1) implican que W es subespacio de V.

Siendo W subconjunto de V, salvo las propiedades (A4) y (A5) de manera inmediata se satisfacen las restantes. (A4) y (A5) se obtienen de (A1), (M1) al escribir , dado cualquier elemento .

La caracterización 2 permite deducir que para un conjunto de vectores del espacio V, el espacio formado con todas las combinaciones lineales de sus elementos , es un subespacio vectorial de V. Este subespacio es llamado el espacio generado por W.

La dimensión de un espacio vectorial V se refiere al máximo número de vectores, o bien al mínimo número de vectores linealmente independientes necesario para generar V. Y se denomina base todo conjunto de vectores, linealmente independientes, que genera el espacio V.

Producto Interior[editar]

Al considerar F el campo de los número reales o el de los complejos, al espacio vectorial se le asocia un producto interior denotado , que a cada par de vectores asocia un único escalar, y cumple las propiedades.

En el caso del espacio vectorial real de la forma (con ), un producto punto es el correspondiente a la suma de los productos de las respectivas componentes. Es decir, dados los vectores


se toma

.


Al utilizar la notación matricial, los vectores habitualmente se toman en columna y, en este caso el producto anterior se desarrolla como , donde indica la transpuesta de u.

En el caso de vectores con componentes complejas, el producto interno debe ser modificado para tener la definición de longitud, y la modificación habitual es conjugar el primer vector en el producto interno. Esto significa que x es reemplazado por , y el producto interno de x y y resulta:


Y se toma el producto interno de x con él mismo, se tiene el cuadrado de su longitud: .

Puesto que en el caso complejo no siempre coincide con , se debe tener en cuenta el orden de los vectores para el producto interno. Hay otra novedad: si x es cambiada por cx, entonces el producto interno de x y y es multiplicado por .

Nótese que si se tomara en el caso complejo tal como se desarrolla el caso real, con el vector aparecería por ejemplo el resultado

,


incumpliendo la segunda parte de la propiedad (P1).

Una norma para un espacio vectorial V, real o complejo, es la función definida sobre V que satiface:

.


En un espacio V con producto interior , dos vectores x, y son ortogonales si . En el producto interios habitual es . En el espacio , como se restringió antes, el producto interior usual es .

Si los dos vectores ortogonales tiene norma o longitud 1, se dice que son ortonormales.

Matrices[editar]

Arthur Cayley

Suma y multiplicación[editar]

Recuérdese que una matriz es un arreglo rectangular de número que pueden ser reales o complejos y se representa normalmente entre paréntesis. El orden o tamaño de una matrz está dado por el número de filas y el de columnas.

Los elementos de una matriz general de tamaño se representan normalmente utilizando un doble subíndice; el primer subíndice, j, indica el número de fila y el segundo, k, el número de columna. Así pues, el elemento, está en la segunda fila, tercera columna de la matriz M; se puede representar de forma abreviada como . También se usa la notación .

La suma de dos matrices sólo está definida si ambas tienen el mismo tamaño. Así, dadas y , entonces la suma se define como la matriz , en la que ; es decir, para sumar dos matrices de igual tamaño basta con sumar los elementos correspondientes.

En el conjunto de todas las matrices de un determinado tamaño, la adición tiene las propiedades asociativa y conmutativa. Además hay una matriz única O, denominada matriz cero o nula, tal que para cualquier matriz A, se cumple y, para la matriz dada A existe una matriz única B tal que .

La multiplicación de una matriz A por un escalar t (número real o complejo), da una matriz formada por todos los términos de A multiplicados por el escalar t, conservando su posición inicial.

De esta manera, el conjunto de todas las matrices de orden , con la operación suma y la multiplicación por escalares tiene estructura de espacio vectorial.

La multiplicación o producto AB de dos matrices, A y B, está definido sólo si el número de columnas del factor izquierdo, A, es igual al número de filas del factor derecho, B; si es de tamaño y es de mañaño , el producto es de tamaño y está dado por

.

Es decir, el elemento de la fila j y la columna k des producto, es la suma de los productos de cada uno de los elementos de la fila j de factor izquierdo multiplicado por el correspondiente elemento de la columna k del factor derecho.

Para el caso de una matriz cuadrada, se adopta la notación para representar el producto AA.

La multiplicación de matrices no es conmutativa, pero si cumple la propiedad asociativa. Esto es

. (1.1


El caso particular de la multiplicación de una matriz de orden por una matriz de orden , es una matriz de orden (vector columna). De acuerdo con la definición es


la cual puede expresarse en la forma

(1.2a


es decir, es una combinación lineal de las columnas de la matriz de orden , y los escalares corresponden a las componentes del vector columna.

Cuando se tiene la multiplicación de una matriz de orden , por otra formada por dos (o más) columnas (dos vectores columna), se puede plantear en la forma

,


o brevemente, denotanto X el vector columna y Y el vector

. (1.2b


Matriz inversa[editar]

La matriz unidad, es una matriz cuadrada en la cual todos los elementos son cero, excepto los de la diagonal principal, que son 1 y es el elemento neutro para la multiplicación de matrices. Si A y B son dos matrices cuadradas de forma que , la matriz B se llama inversa de A y se denota .

Si una matriz no posee inversa se dice singular; en caso contrario se le dice no singular o regular (es inversible).

Si se supone que dos matrices B, C cumplen


de , se tiene que la inversa, si existe es única. En particular .

Sobre dos matrices M y N, inversibles, si son de igual tamaño se cumple

. (1.3


Esto se sigue de la asociatividad de la multiplicación:


y de manera análoga se obtiene , verificándose la propiedad (1.3)

.

En el caso sencillo de una matriz A de orden 2

,


su inversa, si existe, es de la forma

,


con .

Además de la matriz nula y la matriz identidad, se tienen otras matrices. Matriz escalar es la matriz obtenida de multiplicar la identidad I por un escalar (real o complejo).

La matriz A es involutiva si ella es su propia inversa; es decir si . Una matriz A se dice idempotente si .

La matriz transpuesta de una matriz A de orden es la matriz de orden , denotada (transpuesta de A), que se obtiene permutando las filas por las columnas. La fila j de es la columna j de A, y la columna j de es la fila j de A. En particular la transpuesta de la matriz unidad es ella misma, esto es . También .

Con la multiplicación se cumple:

, (1.4


y con esta propiedad se establece una relación entre la inversa de la transpuesta con la inversa de la matriz dada. Esto es:

, (1.5


ya que ; y de la misma forma .

En el caso de tener sólo números reales, la matriz se llama ortogonal si cumple

,


que equvale a

(1.6


lo cual significa que la inversa de la matriz, simplemente es la transpuesta.

Con esto se puede decir:

NOTA 2 Una matriz A es regular si y solo si lo es. O también, A es singular si y solo si lo es.

Una matriz real A es simétrica si ella es igual a su transpuesta; es decir si . Una matriz B es antisimétrica (hemisimétrica) si ; en este caso los elementos de la diagonal principal son nulos. Resulta del hecho , y esto implica .

Una matriz cuadrada A de orden n se llama unitaria si:

,


o sea, si

. (1.7


La matriz se denomina matriz conjugada de A y se obtiene tomando el conjugado de cada elemento. En el producto se cumple

En el caso de tener sólo números reales, es el caso de la matriz ortogonal.

Los Cuatro Subespacios Fundamentales[editar]

Asociado a una matriz A de orden se tienen cuatro subespacios vectoriales fundamentales. Dos de ellos, subespacios de y los otros dos de .

La conexión entre funciones lineales y matrices surgió de la observación de Cayley que la composición de dos funciones lineales puede representarse mediante la multiplicación de dos matrices. En general una función o transformación lineal relaciona dos espacios vectoriales U y V sobre el mismo cuerpo F, cumpliendo:

.


.


Así que, dada una matriz A de orden , la función de en definida por es una aplicación lineal

Espacio columna, espacio fila[editar]

Sea A una matriz real de tamaño

.


El espacio columna de A, es el subespacio de generado por las n columnas de A y coincide con el recorrido de la aplicación lineal (o transformación lineal) . Este subespacio se simboliza por . Es decir,


Observando el producto Ax, en la forma (1.2)

, se observa efectivametne que es el espacio generado por las columnas de A. Su dimensión es el número de columnas linealmente independientes.

Ahora, si a cambio de la matriz A se considera su transpuesta , el recorrido de la aplicación lineal constituye el espacio columna de , el cual equivale al espacio generado por las filas de A.

NOTA 3 En esta sección se habla en términos de matrices reales y espacio real, pero todos los resultados obtenidos son análogos en matrices complejas, basta reemplazar por .

En resumen, dada una matriz , por el momento hay dos espacios vectoriales asociados a ella:

a) el espacio determinado por las columnas de A (Espacio Columna). Es decir
.
b)  el espacio determinado por las filas de A (espacio fila): 
.


Luego de obtener una matriz escalonada a través de la eliminación gaussiana, se puede calcular el rango r de la matriz escalonada, que corresonde precisamente a la dimensión del espacio fila de A.

Dicho de otra forma, la dimensión del espacio fila de A corresponde al número de filas distintas de cero que tenga la nueva matriz escalonada.

Algunas veces se desea saber si dos matrices tienen o no el mismo espacio fila o el mismo rango. El siguiente teorema, conocido como Teorema de Rangos iguales, establece una solución. Se hace uso de la notación para indicar que existe una matriz regular P tal que . Análogamente significa que existe una matriz regular Q, tal que .

Para dos matrices A y B de orden :

. (1.8


. (1.9


Prueba

Para verificar (1.8)

, primero se asume , esto es, existe una matriz regular P tal que . Para ver que , se sigue de:


Ahora, para el recíproco, si entonces los espacios vectoriales generados por las filas de A y las filas de B coinciden. Esto es

,


por lo tanto cada fila de B es una combinación de las filas de A y viceversa. Con base en este hecho se puede decir que es posible reducir A a B usando solamente operaciones de filas, y de esta manera . La prueba de B se sigue, reemplazando A y B con y .

Espacio nulo, espacio nulo a izquierda[editar]

A partir de la transformación lineal de en , definida por , con A una matriz de orden , el conjunto es llamado espacio nulo de . También se le representa como haciendo referencia a la matriz que genera la transformación.

Este espacio nulo es un subespacio vectorial del dominio . Para ello se revisa que se cumplen las propiedades A1, M1 enunciadas en la sección 1.1, Caracterización 2:

Sean , con . Entonces la imagen de la suma

,


ya que la multiplicación de matrices es distributiva respecto de la suma, y puesto que , resulta que .

Sea , y cualquier escalar del cuerpo F. Entonces

.

Si se sigue el proceso de eliminación para simplificar un sistema de ecuaciones lineales, el sistema se reduce a , siendo U la matriz escalonada obtenida de A, al aplicar la eliminación gaussiana, y este proceso es reversible. En este caso. Los elementos de este espacio son las soluciones del sistema homogéneo

. (1.10


Ya que el espacio nulo de A, es el conjunto de vectores que satisfacen , es el mismo espacio nulo de U y, de las m restricciones impuestas por las m ecuaciones de , solo r son independientes, que corresponden a las r filas de A linealmente independientes, o también por las r filas no nulas de U.

De esta manera, el espacio nulo , también llamado el kernel de A, es de dimensión . Una base puede construirse reduciendo a , que tiene variables libres correspondientes a las columnas de U que no contienen pivotes. Entonces, seguidamente, se da a cada variable libre el valor 1, a las otras variables libres el valor 0, y se resuelve sustituyendo en reversa las variables (básicas) faltantes; los vectores producidos de esta forma son una base para .

Siendo un subespacio vectorial, contiene el vector nulo ; es decir, satisface el sistema (1.1)

, y se dice habitualmente que es solución trivial.

NOTA 4 La condición necesaria y suficientes para que tenga solución distinta de la trivial es que la característica de A sea
NOTO 5 Si la característica de es , el sistema tiene, exactamente soluciones linealmetne independientes de forma que cada solución es combinación lineal de estas , y cada una de estas combinaciones lineales es una solución.

Si ahora se halla el espacio nulo para el operador generado por , entonces con , es llamado el espacio nulo izquierdo de A porque es el conjunto de todas las soluciones del sistema homogéneo izquierdo

.


En resumen, dada una matriz , hay dos espacios nulos asociados a ella:

el espacio nulo de A.

Es decir:


el espacio nulo izquierdo de A.

Es decir:


Matriz Orgotonal[editar]

Ya en la sección 1.2.2 se estableció que una matriz es ortogonal si su inversa es su propia transpuesta. En función de sus líneas, acudiendo al producto escalar de vectores, se puede decir que una matriz ortogonal es simplemente una matriz cuadrada con columna (filas) ortonormales.

Si Q es matriz ortogonal y sus columnas las cuales satisfacen: y , se puede visualizar de la siguiente manera:

.


A partide de la conexión entre la norma y el producto interior para vectores reales o complejos, pueden establecerse dos propiedades sobre las matrices orgonales:

atención
atención
Una matriz ortogonal preserva longitudes. Esto significa
. (1.11a


Una matriz ortogonal preserva productos internos y ángulos:

. (1.11b

Prueba de 1

De la definición de norma (sección 1.1.3),

.


Prueba de 2

Dados dos vectores x,y al tomar el producto punto entre sus imágenes mediante Q

.


Cuando A es una matriz ortogonal, la ecuación se soluciona fácilmente ya que resulta , de donde .

Inversa y multiplicación de matrices ortogonales[editar]

Sobre este tipo de matrices se tiene que su inversa (transpuesta), también es matriz ortogonal; así mismo el producto de dos matrices ortogonales es otra matriz ortogonal. Se procede a verificar estas afirmaciones:

atención
atención
Si A es ortogonal, entonces es ortogonal.

Basta ver . Lo cual se deduce de aplicar (1.5)

y la propiedad asociativa
,


y puesto que A es ortogonal

.


atención
atención
Si A,B son ortogonales, entonces AB es ortogonal.

Se debe probar . Aplicando (1.4)

y la propiedad asociativa
,


ahora por ser A, B ortogonales

.


De forma similar, se obtiene .

Matriz hermitiana[editar]

Una matriz cuadrada tal que se llama hermitiana o autoadjunta. Este es el análogo complejo de simetría. Los elementos de la diagonal principal de una matriz hermitiana han de ser números reales, puesto que deben cumplir . Si la matriz es además unitaria, significa que , es decir es involutiva. Si todos los elementos son reales, es una matriz simétrica, como se ha mencionado anteriormente.

Con la notación , se tiene que A es hermitiana si . Si A es de orden entonces es de orden .

Sobre una matriz hermitiana sucede:

atención
atención
Si H es hermitiana no siempre lo es.

Se deriva del hecho , que puede no coincidir con H.

Así mismo,

atención
atención
Si H, T son hermitianas, entonces no siempre el producto HT lo es.

Se debe a que , que no siempre es igual a .

Una matriz cuadrada tal que se llama hemi-hermitiana. Este es el análogo complejo de antisimetría. Los elementos de la diagonal principal de una matriz hemi-hermitiana han de ser números nulos o imaginarios puros. Es consecuencia del hecho , puesto que , y esto implica .

Entonces, si una matriz hermitiana H, se multiplica por un escalar k, resulta:


También a una matriz hermitiana se le denomina matriz hermitica.