Geometría Analítica con Matlab/Matrices

Matrices

Luego de la fundamentación de la teoría de matrices al final del sigo XIX, se observó que muchas nociones matemáticas que fueron consideradas ligeramente diferentes de las matrices, eran en efecto, similares. Por ejemplo, objetos tales como puntos en el plano bidimensional, puntos en el espacio tridimensional, polinomios, funciones continuas, funciones diferenciables satisfacen las mismas propiedades aditivas y propiedades de multiplicación por escalares. Por lo cual se pensó que era más eficiente y productivo estudiar muchos tópicos a la vez, al analizar las propiedades comunes que ellos satisfacen; este hecho condufo a la definición axiomática de espacio vectorial. La primera publicación sobre el tema se debe al polaco Hermann Grassmann (1808 - 1887), en 1844; en su trabajo dejó planteados los conceptos que se refieren a dependencia lineal, bases y dimensión.

El italiano Giuseppe Peano (1858 - 1932) dio una axiomatización similar a la que actualmente se usa y que fue propuesta posteriormente por el alemán Hermann Weyl (1885 - 1955) ignorando el trabajo de Peano. El éxito de Weyl radicó en el manejo geométrico del espacio vectorial.

Espacio Vectorial

Un espacio vectorial involucra cuatro (4) "objetos": dos (2) conjuntos V y F, y dos operaciones algebraicas llamadas adición vectorial y multiplicación escalar; V es un conjunto no vacío de objetos llamados vectores. F es un campo escalar, ya se el campo de los número reales, o bien el campo de los números complejos.

La adición vectorial (denotada como $x+y$ ) es una operación entre elementos de V. La multiplicación escalar (denotada como $\alpha x$ ) es una operación entre elementos de F y de V. Entonces, el conjunto V es llamado espacio vectorial sobre F cuando la adición vectorial y la multiplicación escalar satisfacen las propiedades que se enuncian a continuación:

Para la adición de vectores

{\begin{cases}(A1)\;\;\forall x,y\in V,\;\;x+y\in V;&{\text{(Propiedad clausurativa).}}\\(A2)\;\;\forall x,y,z\in V,\;\;(x+y)+z=x+(y+z);&{\text{(Propiedad asociativa).}}\\(A3)\;\;\forall x,y\in V,\;\;x+y=y+x;&{\text{(Propiedad conmutativa).}}\\(A4)\;\;\forall x\in V,\;\exists e\in V,\;\;x+e=x;&{\text{(Existencia de módulo).}}\\(A5)\;\;\forall x\in V,\exists x^{-1}\in V,\;x+x^{-1}=e;&{\text{(Existencia de inversos).}}\end{cases}}

Propiedades para la multiplicación escalar:

{\begin{cases}(M1)\;\;\forall \alpha \in F\;y\;\forall x\in V,\;\;\alpha x\in V.&{\text{(Propiedad clausurativa).}}\\(M2)\;\;\forall \alpha ,\beta \in F,\;y\;\forall x\in V,\;\;(\alpha \beta )x=\alpha (\beta x).&{\text{(Propiedad asociativa).}}\\(M3)\;\;\forall \alpha \in F,\;y\;\forall x,y\in V,\;\;\alpha (x+y)=\alpha x+\alpha y.&{\text{(Propiedad distributiva escalar sobre la adicion vectorial).}}\\(M4)\;\;\forall \alpha \beta \in F\;y\forall x\in V,\;\;(\alpha +\beta )x=\alpha x+\beta x.&{\text{(Propiedad distributiva vectorial sobre la adicion escalar).}}\\(M5)\;\;\forall x\in V,\;\;1x=x.&{\text{(Existencia de modulo).}}\end{cases}}

Si al módulo $e$ mencionadao en (A4) se le denomina vector nulo y se denota por O, y teniendo en cuenta que cualquier escalar t multiplicado por él da nuevamente el vector nulo, $tO=O$ , se puede decir:

NOTA 1 Si x es un vector no nulo y

kx=O

, entonces el escalar K es 0.

Esto resulta al suponer que $k\neq O$ , entonces $x={\tfrac {1}{k}}(kx)=O$ , lo cual es absurdo.

Independencia Lineal

Dados los vectores $v_{1},v_{2},\ldots ,v_{r}\in V$ y los escalares $\alpha _{1},\alpha _{2},\ldots ,\alpha _{r}\in F$ , una expresión de la forma

\alpha _{1}v_{1}+\alpha _{2}v_{2}+\ldots +\alpha _{r}v_{r}

es llamada uan combinación lineal de ellos.

Un conjunto de vectores se dice linealmente independiente, o que es un sistema libre si la única combinación lineal igual al vector nulo es aquella en que todos los escalares son cero. En caso contrario, se dice que es linealmente dependiente o que es un sistema ligado.

Subespacio

Si V es un espacio vectorial sobre F y si $W\subset V$ , entonces W es un subespacio de V si bajo las operaciones de V, W mismo forma un espacio vectorial sobre F.

Para establecer la estructura de subespacio no es necesario revisar todas las 10 condiciones definidas para determinar si un subconjunto es también un subespacio. Para tal fin se plantean dos caracterizaciones:

atención

'Caracterización 1: Sea $W\subseteq V$ un conjunto no vacío. Entonces W es un subespacio de V si y solo si

w_{1},w_{2}\in W,\;\alpha ,\beta \in F\;\;{\text{implica}}\;\;\alpha w_{1}+\beta w_{2}\in W

Prueba

Sólo si se quiere probar que W es subespacio de V.

Con $\alpha =\beta =1$ , resulta (A1). Las propiedades asociativa y conmutativa [(A2), (A3)] las conserva el subconjunto W. Con $\alpha =0=\beta$ se obtiene $O\in W$ , y con ello se cumple (A4). Ahora, dado $w_{1}\in W$ , tomando $\alpha =-1,\beta =0$ se concluye que el opuesto $-w_{1}\in W$ y en consecuencia por (A1) satisface (A4). Si $\alpha =1$ y $\beta =0$ se tiene (M5).

Las restantes propiedades (M2), (M3), (M4) son consecuencia por ser W subconjunto del espacio vectorial V.

Una segunda caracterización tiene en cuenta únicamente las condiciones clausurativas (A1) y (M1):

atención

'Caracterización 2: Sea $W\subseteq V$ un conjunto no vacío. Entonces W es un subespacio de V si y solo si

{\begin{cases}(A1)\;\forall x,y\in W,\;x+y\in W\;\;{\text{y}}\\(M1)\;\forall x\in W,\;\forall \alpha \in F,\;\alpha x\in W.\end{cases}}

Prueba

Sólo se requiere establecer que (A1), (M1) implican que W es subespacio de V.

Siendo W subconjunto de V, salvo las propiedades (A4) y (A5) de manera inmediata se satisfacen las restantes. (A4) y (A5) se obtienen de (A1), (M1) al escribir $-x=(-1)x$ , dado cualquier elemento $x\in W$ .

La caracterización 2 permite deducir que para un conjunto $W={v_{1},v_{2},\ldots ,v_{r}}$ de vectores del espacio V, el espacio formado con todas las combinaciones lineales de sus elementos $gen(W)={\alpha _{1}v_{1}+\alpha _{2}v_{2}+\ldots +\alpha _{r}v_{r}}$ , es un subespacio vectorial de V. Este subespacio es llamado el espacio generado por W.

La dimensión de un espacio vectorial V se refiere al máximo número de vectores, o bien al mínimo número de vectores linealmente independientes necesario para generar V. Y se denomina base todo conjunto de vectores, linealmente independientes, que genera el espacio V.

Producto Interior

Al considerar F el campo de los número reales o el de los complejos, al espacio vectorial se le asocia un producto interior denotado $u\cdot v$ , que a cada par de vectores asocia un único escalar, y cumple las propiedades.

${\begin{array}{ll}(P1)&v\cdot v\geq 0,\;\;{\text{para todo}}\;v\in V,\;\;{\text{y}}\\&v\cdot v=0\;\;{\text{si y solo si}}\;v=O;\\(P2)&v\cdot w=w\cdot v,\;\;{\text{para todo par}}\;v,w\in V;\\(P3)&u\cdot (\alpha v+\beta w)=\alpha (u\cdot v)+\beta (u\cdot w),\;\;{\text{para cualesquier}}\;u,v,w\in V,\\&{\text{y todo par}}\;\alpha ,\beta \in F.\end{array}}$

En el caso del espacio vectorial real de la forma $\mathbb {R} ^{n}$ (con $F=\mathbb {R}$ ), un producto punto es el correspondiente a la suma de los productos de las respectivas componentes. Es decir, dados los vectores

u=\left[x_{1},x_{2},\ldots ,x_{n}\right],\;\;v=\left[y_{1},y_{2},\ldots ,y_{n}\right]

se toma

u\cdot v=x_{1}y_{1}+x_{2}y_{2}+\cdots +x_{n}y_{n}

.

Al utilizar la notación matricial, los vectores habitualmente se toman en columna y, en este caso el producto anterior se desarrolla como $u^{t}v$ , donde $u^{t}$ indica la transpuesta de u.

En el caso de vectores con componentes complejas, el producto interno debe ser modificado para tener la definición de longitud, y la modificación habitual es conjugar el primer vector en el producto interno. Esto significa que x es reemplazado por ${\bar {x}}$ , y el producto interno de x y y resulta:

{\bar {x}}^{t}y={\bar {x}}_{1}y_{1}+\ldots +{\bar {x}}_{n}y_{n},

Y se toma el producto interno de x con él mismo, se tiene el cuadrado de su longitud: ${\bar {x}}^{t}x=\|x\|^{2}$ .

Puesto que en el caso complejo ${\bar {y}}^{t}x$ no siempre coincide con ${\bar {x}}^{t}y$ , se debe tener en cuenta el orden de los vectores para el producto interno. Hay otra novedad: si x es cambiada por cx, entonces el producto interno de x y y es multiplicado por ${\bar {c}}$ .

Nótese que si se tomara en el caso complejo tal como se desarrolla el caso real, con el vector $u=\left[i,1,0,\ldots ,0\right]$ aparecería por ejemplo el resultado

u\cdot u=i^{2}+1=0

,

incumpliendo la segunda parte de la propiedad (P1).

Una norma para un espacio vectorial V, real o complejo, es la función $\|\;\|$ definida sobre V que satiface:

{\begin{array}{l}\|x\|>0\;{\text{y,}}\;\;\|x\|=0\;{\text{si y solo si}}\;\;x=O,\\\\\|\alpha x\|=|\alpha |\|x\|\;{\text{para cualquier escalar}}\;\;\alpha ;\\\\\|x+y\|\leq \|x\|+\|y\|\end{array}}

.

En un espacio V con producto interior $\cdot$ , dos vectores x, y son ortogonales si $x\cdot y=0$ . En $\mathbb {R} ^{n}$ el producto interios habitual es $x\cdot y=x^{t}y$ . En el espacio $\mathbb {C} ^{n}$ , como se restringió antes, el producto interior usual es $x\cdot y={\bar {x}}^{t}y$ .

Si los dos vectores ortogonales tiene norma o longitud 1, se dice que son ortonormales.

Matrices

Arthur Cayley

Suma y multiplicación

Recuérdese que una matriz es un arreglo rectangular de número que pueden ser reales o complejos y se representa normalmente entre paréntesis. El orden o tamaño de una matrz está dado por el número de filas y el de columnas.

Los elementos de una matriz general de tamaño $m\times n$ se representan normalmente utilizando un doble subíndice; el primer subíndice, j, indica el número de fila y el segundo, k, el número de columna. Así pues, el elemento, $m_{23}$ está en la segunda fila, tercera columna de la matriz M; se puede representar de forma abreviada como $M=\left(m_{jk}\right)$ . También se usa la notación $M_{m\times n}$ .

La suma de dos matrices sólo está definida si ambas tienen el mismo tamaño. Así, dadas $A=\left(a_{jk}\right)$ y $B=\left(b_{jk}\right)$ , entonces la suma $C=A+B$ se define como la matriz $\left(c_{jk}\right)$ , en la que $c_{jk}=a_{jk}+b_{jk}$ ; es decir, para sumar dos matrices de igual tamaño basta con sumar los elementos correspondientes.

En el conjunto de todas las matrices de un determinado tamaño, la adición tiene las propiedades asociativa y conmutativa. Además hay una matriz única O, denominada matriz cero o nula, tal que para cualquier matriz A, se cumple $A+O=O+A=A$ y, para la matriz dada A existe una matriz única B tal que $A+B=B+A=O$ .

La multiplicación de una matriz A por un escalar t (número real o complejo), da una matriz formada por todos los términos de A multiplicados por el escalar t, conservando su posición inicial.

De esta manera, el conjunto de todas las matrices de orden $m\times n$ , con la operación suma y la multiplicación por escalares tiene estructura de espacio vectorial.

La multiplicación o producto AB de dos matrices, A y B, está definido sólo si el número de columnas del factor izquierdo, A, es igual al número de filas del factor derecho, B; si $A=\left(a_{jk}\right)$ es de tamaño $m\times n$ y $B=\left(b_{jk}\right)$ es de mañaño $n\times p$ , el producto $AB=C=\left(c_{jk}\right)$ es de tamaño $m\times n$ y $c_{jk}$ está dado por

c_{jk}=\sum _{h=1}^{n}a_{jh}b_{hk}

.

Es decir, el elemento de la fila j y la columna k des producto, es la suma de los productos de cada uno de los elementos de la fila j de factor izquierdo multiplicado por el correspondiente elemento de la columna k del factor derecho.

Para el caso de una matriz cuadrada, se adopta la notación $A^{2}$ para representar el producto AA.

La multiplicación de matrices no es conmutativa, pero si cumple la propiedad asociativa. Esto es

(AB)C=A(BC)

.

(1.1)

El caso particular de la multiplicación de una matriz de orden $m\times n$ por una matriz de orden $n\times 1$ , es una matriz de orden $m\times 1$ (vector columna). De acuerdo con la definición es

\left[{\begin{array}{cccc}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\&\vdots &\ddots &\\a_{m1}&a_{m2}&\cdots &a_{mn}\end{array}}\right]\left[{\begin{array}{c}x_{1}\\x_{2}\\\vdots \\x_{n}\end{array}}\right]=\left[{\begin{array}{c}a_{11}x_{1}+a_{12}x_{2}+\cdots +a_{1n}x_{n}\\a_{21}x_{1}+a_{22}x_{2}+\cdots +a_{2n}x_{n}\\\vdots \\a_{n1}x_{1}+a_{n2}x_{2}+\cdots +a_{mn}x_{n}\end{array}}\right]

la cual puede expresarse en la forma

\left[{\begin{array}{cccc}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\&\vdots &\ddots &\\a_{m1}&a_{m2}&\cdots &a_{mn}\end{array}}\right]\left[{\begin{array}{c}x_{1}\\x_{2}\\\vdots \\x_{n}\end{array}}\right]=x_{1}\left[{\begin{array}{c}a_{11}\\a_{21}\\\vdots \\a_{m1}\end{array}}\right]+x_{2}\left[{\begin{array}{c}a_{12}\\a_{22}\\\vdots \\a_{m2}\end{array}}\right]+\cdots +x_{n}\left[{\begin{array}{c}a_{1n}\\a_{2n}\\\vdots \\a_{mn}\end{array}}\right]

(1.2a)

es decir, es una combinación lineal de las columnas de la matriz de orden $m\times n$ , y los escalares corresponden a las componentes del vector columna.

Cuando se tiene la multiplicación de una matriz $M=\left(a_{ij}\right)$ de orden $m\times n$ , por otra formada por dos (o más) columnas (dos vectores columna), se puede plantear en la forma

\left[{\begin{array}{cccc}a_{11}&a_{12}&\cdots &a_{1n}\\a_{21}&a_{22}&\cdots &a_{2n}\\&\vdots &\ddots &\\a_{m1}&a_{m2}&\cdots &a_{mn}\end{array}}\right]\left[{\begin{array}{cc}x_{1}&y_{1}\\x_{2}&y_{2}\\\vdots &\vdots \\x_{n}&y_{n}\end{array}}\right]=\left[M\left[{\begin{array}{c}x_{1}\\x_{2}\\\vdots \\x_{n}\end{array}}\right]M\left[{\begin{array}{c}y_{1}\\y_{2}\\\vdots \\y_{n}\end{array}}\right]\right]

,

o brevemente, denotanto X el vector columna $\left[{\begin{array}{cccc}x_{1}&x_{2}&\cdots &x_{n}\end{array}}\right]^{t}$ y Y el vector $\left[{\begin{array}{cccc}y_{1}&y_{2}&\cdots &y_{n}\end{array}}\right]^{t}$

M\left[{\begin{array}{cc}\vdots &\vdots \\X&Y\\\vdots &\vdots \end{array}}\right]=\left[{\begin{array}{cc}\vdots &\vdots \\MX&MY\\\vdots &\vdots \end{array}}\right]_{m\times 2}

.

(1.2b)

Matriz inversa

La matriz unidad, es una matriz cuadrada en la cual todos los elementos son cero, excepto los de la diagonal principal, que son 1 y es el elemento neutro para la multiplicación de matrices. Si A y B son dos matrices cuadradas de forma que $AB=BA=I$ , la matriz B se llama inversa de A y se denota $B=A^{-1}$ .

Si una matriz no posee inversa se dice singular; en caso contrario se le dice no singular o regular (es inversible).

Si se supone que dos matrices B, C cumplen

AB=BA=I,\;\;AC=CA=I,

de $C=CI=C(AB)=(CA)B=IB=B$ , se tiene que la inversa, si existe es única. En particular $I^{-1}=I$ .

Sobre dos matrices M y N, inversibles, si son de igual tamaño se cumple

\left(MN\right)^{-1}=N^{-1}M^{-1}

.

(1.3)

Esto se sigue de la asociatividad de la multiplicación:

{\begin{array}{cll}\left(MN\right)\left(N^{-1}M^{-1}\right)&=\left(\left(MN\right)N^{-1}\right)M^{-1}&=\left(M\left(NN^{-1}\right)\right)M^{-1}\\&=(MI)M^{-1}&=MM^{-1}=I,\end{array}}

y de manera análoga se obtiene $\left(M^{-1}N^{-1}\right)\left(MN\right)=I$ , verificándose la propiedad (1.3)

.

En el caso sencillo de una matriz A de orden 2

A=\left[{\begin{array}{cc}a&b\\c&d\end{array}}\right]

,

su inversa, si existe, es de la forma

A^{-1}={\frac {1}{ab-cb}}\left[{\begin{array}{cc}d&-b\\-c&a\end{array}}\right]

,

con $ad-cb\neq 0$ .

Además de la matriz nula y la matriz identidad, se tienen otras matrices. Matriz escalar es la matriz obtenida de multiplicar la identidad I por un escalar (real o complejo).

La matriz A es involutiva si ella es su propia inversa; es decir si $A^{2}=I$ . Una matriz A se dice idempotente si $A^{2}=A$ .

La matriz transpuesta de una matriz A de orden $m\times n$ es la matriz de orden $n\times m$ , denotada $A^{t}$ (transpuesta de A), que se obtiene permutando las filas por las columnas. La fila j de $A^{t}$ es la columna j de A, y la columna j de $A^{t}$ es la fila j de A. En particular la transpuesta de la matriz unidad es ella misma, esto es $I^{t}=I$ . También $\left(A^{t}\right)^{t}=A$ .

Con la multiplicación se cumple:

\left(AB\right)^{t}=B^{t}A^{t}

,

(1.4)

y con esta propiedad se establece una relación entre la inversa de la transpuesta con la inversa de la matriz dada. Esto es:

\left(A^{-1}\right)^{t}=\left(A^{t}\right)^{-1}

,

(1.5)

ya que $I=I^{t}=\left(A^{-1}A\right)^{t}=A^{t}\left(A^{-1}\right)^{t}$ ; y de la misma forma $\left(A^{-1}\right)^{t}A^{t}=I$ .

En el caso de tener sólo números reales, la matriz se llama ortogonal si cumple

AA^{t}=A^{t}A=I

,

que equvale a

A^{t}=A^{-1}

(1.6)

lo cual significa que la inversa de la matriz, simplemente es la transpuesta.

Con esto se puede decir:

NOTA 2 Una matriz A es regular si y solo si

A^{t}

lo es. O también, A es singular si y solo si

A^{t}

lo es.

Una matriz real A es simétrica si ella es igual a su transpuesta; es decir si $A^{t}=A.$ . Una matriz B es antisimétrica (hemisimétrica) si $B=-B^{t}$ ; en este caso los elementos de la diagonal principal son nulos. Resulta del hecho $a_{hh}=-a_{hh}$ , y esto implica $a_{hh}=0$ .

Una matriz cuadrada A de orden n se llama unitaria si:

\left({\bar {A}}\right)^{t}A=A\left({\bar {A}}\right)^{t}=I

,

o sea, si

\left({\bar {A}}\right)^{t}=A^{-1}

.

(1.7)

La matriz ${\bar {A}}$ se denomina matriz conjugada de A y se obtiene tomando el conjugado de cada elemento. En el producto se cumple ${\bar {AB}}={\bar {A}}{\bar {B}}$

En el caso de tener sólo números reales, es el caso de la matriz ortogonal.

Los Cuatro Subespacios Fundamentales

Asociado a una matriz A de orden $m\times n$ se tienen cuatro subespacios vectoriales fundamentales. Dos de ellos, subespacios de $\mathbb {R} ^{n}$ y los otros dos de $\mathbb {R} ^{n}$ .

La conexión entre funciones lineales y matrices surgió de la observación de Cayley que la composición de dos funciones lineales puede representarse mediante la multiplicación de dos matrices. En general una función o transformación lineal relaciona dos espacios vectoriales U y V sobre el mismo cuerpo F, cumpliendo:

\left[i\right]T(x+y)=T(x)+T(y),\;\;{\text{para todo par de vectores}}\;x,y\in U

.

\left[ii\right]T(\alpha x)=\alpha T(x),\;\;{\text{para todo escalar}}\;\alpha \in F,\;\;{\text{todo vector}}\;x\in U

.

Así que, dada una matriz A de orden $m\times n$ , la función $f$ de $\mathbb {R} ^{n}$ en $\mathbb {R} ^{m}$ definida por $f(x)=Ax$ es una aplicación lineal

Espacio columna, espacio fila

Sea A una matriz real de tamaño $m\times n$

A=\left[{\begin{array}{ccccc}a_{11}&a_{12}&a_{13}&\cdots &a_{1n}\\a_{21}&a_{22}&a_{23}&\cdots &a_{2n}\\&\vdots &\vdots &\vdots &\\a_{m1}&a_{m2}&a_{m3}&\cdots &a_{mn}\end{array}}\right]

.

El espacio columna de A, es el subespacio de $\mathbb {R} ^{m}$ generado por las n columnas de A y coincide con el recorrido de la aplicación lineal (o transformación lineal) $f(x)=Ax$ . Este subespacio se simboliza por $\Re (A)$ . Es decir,

\Re (A)=\left\{Ax|x\in \mathbb {R} ^{n}\right\}\subseteq \mathbb {R} ^{m}

Observando el producto Ax, en la forma (1.2)

, se observa efectivametne que $\Re (A)$ es el espacio generado por las columnas de A. Su dimensión es el número de columnas linealmente independientes.

Ahora, si a cambio de la matriz A se considera su transpuesta $A^{t}$ , el recorrido de la aplicación lineal $g(x)=A^{t}x$ constituye el espacio columna de $A^{t}$ , el cual equivale al espacio generado por las filas de A.

NOTA 3 En esta sección se habla en términos de matrices reales y espacio real, pero todos los resultados obtenidos son análogos en matrices complejas, basta reemplazar

A^{t}

por

{\bar {A}}^{t}

.

En resumen, dada una matriz $A\in \mathbb {R} ^{m\times n}$ , por el momento hay dos espacios vectoriales asociados a ella:

a)

\Re (A)

el espacio determinado por las columnas de A (Espacio Columna). Es decir

b\in \Re (A)\Longleftrightarrow b=Ax\;\;{\text{para algun}}\;x\in \mathbb {R} ^{n}

.

b)  $\Re (A^{t})$  el espacio determinado por las filas de A (espacio fila):

a\in \Re (A^{t})\Longleftrightarrow a^{t}=y^{t}A\;\;{\text{para algun}}\;y\in \mathbb {R} ^{m}

.

Luego de obtener una matriz escalonada a través de la eliminación gaussiana, se puede calcular el rango r de la matriz escalonada, que corresonde precisamente a la dimensión del espacio fila de A.

Dicho de otra forma, la dimensión del espacio fila de A corresponde al número de filas distintas de cero que tenga la nueva matriz escalonada.

Algunas veces se desea saber si dos matrices tienen o no el mismo espacio fila o el mismo rango. El siguiente teorema, conocido como Teorema de Rangos iguales, establece una solución. Se hace uso de la notación $A{\stackrel {row}{\thicksim }}B$ para indicar que existe una matriz regular P tal que $PA=B$ . Análogamente $A{\stackrel {col}{\thicksim }}B$ significa que existe una matriz regular Q, tal que $AQ=B$ .

Para dos matrices A y B de orden $m\times n$ :

\left[i\right]\;\;\Re \left(A^{t}\right)=\Re \left(B^{t}\right)\;\;{\text{si y solo si}}\;A{\stackrel {row}{\thicksim }}B

.

(1.8)

\left[ii\right]\;\;\Re \left(A\right)=\Re \left(B\right)\;\;{\text{si y solo si}}\;A{\stackrel {col}{\thicksim }}B

.

(1.9)

Prueba

Para verificar (1.8)

, primero se asume $A{\stackrel {row}{\thicksim }}B$ , esto es, existe una matriz regular P tal que $PA=B$ . Para ver que $\Re \left(A^{t}\right)=\Re \left(B^{t}\right)$ , se sigue de:

{\begin{array}{lcl}a\in \Re \left(A^{t}\right)&\Longleftrightarrow &a^{t}=y^{t}A=y^{t}P^{-1}\;\;{\text{para algun}}\;\;y\in \mathbb {R} ^{m},\\&\Longleftrightarrow &a^{t}=z^{t}B\;\;{\text{con}}\;\;z^{t}=y^{t}P^{-1},\;\;{\text{pues}}\;\;PA=B,\\&\Longleftrightarrow &a\in \Re \left(B^{t}\right).\end{array}}

Ahora, para el recíproco, si $\Re \left(A^{t}\right)=\Re \left(B^{t}\right)$ entonces los espacios vectoriales generados por las filas de A y las filas de B coinciden. Esto es

span\left\{A_{1*},A_{2*},\ldots ,A_{m*}\right\}=span\left\{B_{1*},B_{2*},\ldots ,B_{m*}\right\}

,

por lo tanto cada fila de B es una combinación de las filas de A y viceversa. Con base en este hecho se puede decir que es posible reducir A a B usando solamente operaciones de filas, y de esta manera $A{\stackrel {row}{\thicksim }}$ . La prueba de B se sigue, reemplazando A y B con $A^{t}$ y $B^{t}$ .

Espacio nulo, espacio nulo a izquierda

A partir de la transformación lineal $f$ de $\mathbb {R} ^{n}$ en $\mathbb {R} ^{m}$ , definida por $f(x)=Ax$ , con A una matriz de orden $m\times n$ , el conjunto $N(f)=\left\{x\in \mathbb {R} ^{n}\;|\;f(x)=O\right\}$ es llamado espacio nulo de $f$ . También se le representa como $N(A)$ haciendo referencia a la matriz que genera la transformación.

Este espacio nulo es un subespacio vectorial del dominio $\mathbb {R}$ . Para ello se revisa que se cumplen las propiedades A1, M1 enunciadas en la sección 1.1, Caracterización 2:

$\left[A1\right]$ Sean $x,y\in \mathbb {R} ^{n}$ , con $x,y\in N(f)$ . Entonces la imagen de la suma

f(x+y)=A(x+y)=Ax+Ay

,

ya que la multiplicación de matrices es distributiva respecto de la suma, y puesto que $Ax=f(x)=O,\;\;Ay=f(y)=O$ , resulta que $x+y\in N(f)$ .

$\left[M1\right]$ Sea $x\in N(f)$ , y $\alpha$ cualquier escalar del cuerpo F. Entonces

f(\alpha x)=A(\alpha x)=\alpha Ax=\alpha f(x)

.

Si se sigue el proceso de eliminación para simplificar un sistema de ecuaciones lineales, el sistema $Ax=O$ se reduce a $Ux=O$ , siendo U la matriz escalonada obtenida de A, al aplicar la eliminación gaussiana, y este proceso es reversible. En este caso. Los elementos de este espacio son las soluciones del sistema homogéneo

Ax=O,\;\;\;O\in \mathbb {R} ^{m}

.

(1.10)

Ya que el espacio nulo de A, es el conjunto de vectores que satisfacen $Ax=O$ , es el mismo espacio nulo de U y, de las m restricciones impuestas por las m ecuaciones de $Ax=O$ , solo r son independientes, que corresponden a las r filas de A linealmente independientes, o también por las r filas no nulas de U.

De esta manera, el espacio nulo $N(A)$ , también llamado el kernel de A, es de dimensión $n-r$ . Una base puede construirse reduciendo a $Ux=O$ , que tiene $n-r$ variables libres correspondientes a las columnas de U que no contienen pivotes. Entonces, seguidamente, se da a cada variable libre el valor 1, a las otras variables libres el valor 0, y se resuelve $Ux=O$ sustituyendo en reversa las variables (básicas) faltantes; los $n-r$ vectores producidos de esta forma son una base para $N(A)$ .

Siendo $N(A)$ un subespacio vectorial, contiene el vector nulo $O\in \mathbb {R} ^{n}$ ; es decir, $O$ satisface el sistema (1.1)

, y se dice habitualmente que $O$ es solución trivial.

NOTA 4 La condición necesaria y suficientes para que

Ax=O

tenga solución distinta de la trivial es que la característica de A sea

r<n

NOTO 5 Si la característica de

Ax=O

es

r<n

, el sistema tiene, exactamente

n-r

soluciones linealmetne independientes de forma que cada solución es combinación lineal de estas

n-r

, y cada una de estas combinaciones lineales es una solución.

Si ahora se halla el espacio nulo para el operador generado por $A^{t}$ , entonces $N\left(A^{t}\right)=\left\{x\in \mathbb {R} ^{m}\;|\;A^{t}x=O\right\}$ con $O\in \mathbb {R} ^{n}$ , es llamado el espacio nulo izquierdo de A porque es el conjunto de todas las soluciones del sistema homogéneo izquierdo

x^{t}A=O^{t},\;\;O\in \mathbb {R} ^{n}

.

En resumen, dada una matriz $A\in \mathbb {R} ^{m\times n}$ , hay dos espacios nulos asociados a ella:

\left[c\right]\;\;N\left(A\right)

el espacio nulo de A.

Es decir:

d\in N\left(A\right)\Longleftrightarrow Ab=O\in \mathbb {R} ^{m}.

$\left[b\right]\;\;N\left(A^{t}\right)$ el espacio nulo izquierdo de A.

Es decir:

b\in N\left(A^{t}\right)\Longleftrightarrow A^{t}b=O\in \mathbb {R} ^{n}.

Matriz Orgotonal

Ya en la sección 1.2.2 se estableció que una matriz es ortogonal si su inversa es su propia transpuesta. En función de sus líneas, acudiendo al producto escalar de vectores, se puede decir que una matriz ortogonal es simplemente una matriz cuadrada con columna (filas) ortonormales.

Si Q es matriz ortogonal y $q_{1},q_{2},\ldots ,q_{n}$ sus columnas las cuales satisfacen: $q_{i}^{t}q_{j}=0\;\;(i\neq j)$ y $q_{i}^{t}q_{i}=1$ , se puede visualizar de la siguiente manera:

Q^{t}Q=\left[{\begin{array}{c}\leftarrow q_{1}^{t}\rightarrow \\\leftarrow q_{2}^{t}\rightarrow \\\vdots \\\leftarrow q_{n}^{t}\rightarrow \end{array}}\right]\left[{\begin{array}{cccc}\uparrow &\uparrow &&\uparrow \\q_{1}&q_{2}&\cdots &q_{n}\\\downarrow &\downarrow &&\downarrow \end{array}}\right]=\left[{\begin{array}{cccc}1&0&\cdots &0\\0&1&\cdots &0\\&\vdots &\vdots \\0&0&0&1\end{array}}\right]

.

A partide de la conexión entre la norma y el producto interior para vectores reales o complejos, pueden establecerse dos propiedades sobre las matrices orgonales:

atención

$\left[1\right]$ Una matriz ortogonal preserva longitudes. Esto significa

\|Qx\|=\|x\|

.

(1.11a)

$\left[2\right]$ Una matriz ortogonal preserva productos internos y ángulos:

\left(Qx\right)^{t}\left(Qy\right)=x^{t}y

.

(1.11b)

Prueba de 1

De la definición de norma (sección 1.1.3),

\|Qx\|^{2}=\left(Qx\right)^{t}\left(Qx\right)=x^{t}Q^{t}Qx=x^{t}Ix=x^{t}x=\|x\|^{2}

.

Prueba de 2

Dados dos vectores x,y al tomar el producto punto entre sus imágenes mediante Q

\left(Qx\right)^{t}\left(Qy\right)=x^{t}Q^{t}Qy=x^{t}Iy=x^{t}y

.

Cuando A es una matriz ortogonal, la ecuación $Ax=b$ se soluciona fácilmente ya que resulta $A^{t}Ax=A^{t}b$ , de donde $x=A^{t}b$ .

Inversa y multiplicación de matrices ortogonales

Sobre este tipo de matrices se tiene que su inversa (transpuesta), también es matriz ortogonal; así mismo el producto de dos matrices ortogonales es otra matriz ortogonal. Se procede a verificar estas afirmaciones:

atención

Si A es ortogonal, entonces $A^{-1}$ es ortogonal.

Basta ver $A^{-1}\left(A^{-1}\right)^{t}=I$ . Lo cual se deduce de aplicar (1.5)

y la propiedad asociativa

A^{-1}\left(A^{-1}\right)^{t}=A^{-1}\left(A^{t}\right)^{-1}

,

y puesto que A es ortogonal

A^{-1}\left(A^{-1}\right)=A^{t}\left(A^{t}\right)^{-1}=I

.

atención

Si A,B son ortogonales, entonces AB es ortogonal.

Se debe probar $(AB)(AB)^{t}=(AB)^{t}(AB)=I$ . Aplicando (1.4)

y la propiedad asociativa

(AB)(AB)^{t}=(AB)\left(B^{t}A^{t}\right)=\left((AB)B^{t}\right)A^{t}=\left(A\left(BB^{t}\right)\right)A^{t}

,

ahora por ser A, B ortogonales

\left(AB\right)(AB)^{t}=(AI)A^{t}=AA^{t}=I

.

De forma similar, se obtiene $(AB)^{t}(AB)=I$ .

Matriz hermitiana

Una matriz cuadrada $A=\left(a_{jk}\right)$ tal que ${\bar {A}}^{t}=A$ se llama hermitiana o autoadjunta. Este es el análogo complejo de simetría. Los elementos de la diagonal principal de una matriz hermitiana han de ser números reales, puesto que deben cumplir ${\bar {a}}_{hh}=a_{hh}$ . Si la matriz es además unitaria, significa que $A^{-1}=A$ , es decir es involutiva. Si todos los elementos son reales, es una matriz simétrica, como se ha mencionado anteriormente.

Con la notación ${\bar {A}}^{t}=A^{H}$ , se tiene que A es hermitiana si $A=A^{H}$ . Si A es de orden $m\times n$ entonces $A^{H}$ es de orden $n\times m$ .

Sobre una matriz hermitiana sucede:

atención

Si H es hermitiana no siempre $H^{t}$ lo es.

Se deriva del hecho ${\overline {\left(\left(H^{t}\right)^{t}\right)}}={\bar {H}}$ , que puede no coincidir con H.

Así mismo,

atención

Si H, T son hermitianas, entonces no siempre el producto HT lo es.

Se debe a que ${\overline {(HT)^{t}}}={\overline {T^{t}H^{t}}}={\bar {T}}^{t}{\bar {H}}^{t}?=TH$ , que no siempre es igual a $HT$ .

Una matriz cuadrada $A=\left(a_{jk}\right)$ tal que ${\overline {A^{t}}}=-A$ se llama hemi-hermitiana. Este es el análogo complejo de antisimetría. Los elementos de la diagonal principal de una matriz hemi-hermitiana han de ser números nulos o imaginarios puros. Es consecuencia del hecho ${\bar {a}}_{hh}=-a_{hh}$ , puesto que ${\bar {a}}_{hh}+a_{hh}=2RE\left(a_{hh}\right)=0$ , y esto implica $a_{hh}=0+iIm\left(a_{hh}\right)$ .

Entonces, si una matriz hermitiana H, se multiplica por un escalar k, resulta:

{\begin{cases}kH\;\;{\text{es hermitiana si}}\;\;k\;\;{\text{es un real, y}}\\kH\;\;{\text{es hemi-hermitiana si}}\;\;k\;\;{\text{es un imaginario puro.}}\end{cases}}

También a una matriz hermitiana se le denomina matriz hermitica.