Softwae de sistemas
De Wikilibros, la colección de libros de texto de contenido libre.
Contenido
|
[editar] Unidad 1: Introducción
[editar] Revisión Modelo Von Newman
[editar] Del Problema al Programa Cargado
== Lenguajes Formales ==,
[editar] Editores
[editar] Editores De Carácter
[editar] Editores De Línea
[editar] Editores De Pantalla
[editar] Lenguajes De Programación
[editar] Niveles Lenguajes De Programación(Bajo, intermedio y alto)
[editar] Lenguajes De Programación Tipos (interpretes y compiladores)
[editar] Comparación Interpretes y Compiladores
[editar] Unidad 2: Ensamblador
[editar] Importancia Lenguaje Ensamblador
¿Por que es importante el lenguaje ensamblador? hay muchas razones, por ahora solo las enumero
Trabaja directamente en memoria Poco uso de memoria.
>
Esto no es completamente cierto, la principal importancia que tiene el lenguaje ensamblador, se da a medida de que si conoces que valores deben tomar los registros del cpu (ax, bx, cx, dx, ..etc) en funcion con las interrupciones para poder realizar alguna operacion, entonces no te encuentras limitado a lo que tu lenguaje de programacion te ofrezca, Ejemplo, en pascal, c, c++ , me refiero a las versiones de "turbo" que corren bajo ambiente DOS, ... estos tipos de lenguajes de programacion traen rutinas para hacer lo que deseemos mediante sus librerias, pero que pasa si yo deseo activar el raton??? entonces tengo que utilizar el lenguaje ensamblador, ya sea de manera cotidiana con el
asm {
mov ax, 10
add ax, 20
}
en caso de c/c++
o utilizando la libreria dos.h que permite trabajar el ensdamblador con lenguaje de alto nivel: con : union REGS r; y las interrupciones int86(0x33,&r,&r); para tener un codigo tal como:
r.x.ax = 0;
int86(0x33,&r,&r);
r.x.ax = 1;
int86(0x33,&r,&r);
Estas instrucciones, hacen referencia a AX del CPU, para alimentarlo de valores, que al llamar la interrupcion 33h (que es la encargada de alojar el raton de la pc) entonces permite mostrar el puntero del raton.
Escrito Por: PANCHO LOPEZ DEL <<<TEC>>>
[editar] Manejo De Memoria
2.4.- GESTIÓN DE MEMORIA EN ENSAMBLADOR Métodos de Direccionamiento. El campo de operación de una instrucción especifica la operación que se va a ejecutar. Esta operación debe realizarse sobre algunos datos almacenados en registros de computadora o en palabras de memoria. La manera en que eligen los operandos durante la ejecución del programa depende del modo de direccionamiento de la instrucción. El modo de direccionamiento especifica una regla para interpretar o modificar el campo de dirección de la instrucción antes de que se haga la referencia real al operando. Las computadoras utilizan técnicas de modo de direccionamiento para acomodar una o las dos siguientes consideraciones: 1. Proporcionar al usuario versatilidad de programación al ofrecer facilidades como apuntadores a memoria, contadores para control de ciclo, indexación de datos y reubicación de datos. 2. Reducir la cantidad de bits en el campo de direccionamiento de la instrucción. La disponibilidad de los modos de direccionamiento proporciona al programador con experiencia en lenguaje ensamblador la flexibilidad para escribir programas mas eficientes en relación con la cantidad de instrucciones y el tiempo de ejecución. Para comprender los diferentes modos de direccionamiento que se presentaran en esta sección, es imperativo entender el ciclo de operación básico de la computadora. La unidad de control de una computadora esta diseñada para recorrer un ciclo de instrucciones que se divide en tres fases principales: 1. Búsqueda de la instrucción de la memoria. 2. Decodificar la instrucción. 3. Ejecutar la instrucción. Hay un registro en la computadora llamado contador de programa o PC, que lleva un registro de las instrucciones del programa almacenado en la memoria. Pc contiene la dirección de la siguiente instrucción que se va a ejecutar y se incrementa cada vez que se recupera una instrucción de la memoria. La decodificación realizada en el paso 2 determina la operación que se va a ejecutar, el modo de direccionamiento de la instrucción y la posición de los operandos. Después la computadora ejecuta la instrucción y regresa al paso 1 para hacer la búsqueda de la siguiente instrucción en secuencia. En algunas computadoras el modo de direccionamiento de la instrucción se especifica con un código binario distinto, como se hace con el código de operación. Otras computadoras utilizan un código binario único que representa la operación y el modo de la instrucción. Pueden definirse instrucciones con diversos modos de direccionamiento y, en ocasiones, se combinan dos o mas modos de direccionamiento en una instrucción. Aunque la mayoría de los modos de direccionamiento modifican el campo de dirección de la instrucción, hay dos modos que no necesitan el campo de dirección. Son los modos implícito e inmediato.
Modo Implicito. En este modo se especifican los operandos en forma implícita en la definición de la instrucción. Por ejemplo, la instrucción "complementar acumulador" es una instrucción de modo implícito porque el operando en el registro de acumulador esta implícito en la definición de la instrucción. De hecho todas las instrucciones de referencia a registro que utilizan un acumulador son instrucciones de modo implícito. Las instrucciones de dirección cero en una computadora organizada con pila son instrucciones de modo implícito porque esta implícito que los operandos están en la parte superior de la pila.
Modo Inmediato. En este modo se especifica el operando en la instrucción misma. En otras palabras, una instrucción de modo inmediato tiene un campo operando, en lugar de una campo de dirección. Un campo de operando contiene el operando real que se va a usar junto con la operación especificada en la instrucción. Las instrucciones de modo inmediato son útiles para inicializar registros en un valor constante. Se menciono antes que el campo de dirección de una instrucción puede especificar una palabra de memoria o un registro de procesador. Cuando el campo de dirección especifica un registro de procesador se dice que la instrucción esta en modo de registro. Modo de Registro. En este modo, los operandos están en registros que residen dentro de la CPU. Se selecciona el registro particular de un campo de registro en la instrucción. Un campo k bits puede especificar cualquiera de 2 a la k registros.
Modo Indirecto por Registro. En este modo la instrucción especifica un registro en la CPU cuyo contenido proporciona la dirección del operando en la memoria. En otras palabras, el registro seleccionado contiene la dirección del operando en lugar del operando mismo. Antes de utilizar una instrucción de modo indirecto por registro, el programador debe asegurarse de que la dirección de memoria del operando esta colocada en el registro del procesador con una instrucción previa. Entonces una referencia al registro es equivalente a especificar una dirección de memoria. La ventaja de una instrucción de modo de registro indirecto es que el campo de dirección de la instrucción utiliza menos bits para seleccionar un registro de los que necesitaría para especificar una dirección de memoria en forma directa. Modo de Direccionamiento Directo. En este modo la dirección efectiva es igual a la parte de dirección de la instrucción. El operando reside en memoria y su dirección la proporciona en forma directa el campo de dirección de la instrucción. En una instrucción de tipo brinco el campo de dirección especifica la dirección de transferencia de control del programa real. Modo de Direccionamiento Indirecto. En este modo, el campo de dirección de la instrucción proporciona la dirección en que se almacena la dirección efectiva en la memoria. El control recupera la instrucción de la memoria y utiliza su parte de dirección para accesar la memoria una vez mas con el fin de leer la dirección efectiva. Unos cuantos modos de direccionamiento requieren que el campo de dirección de la instrucción se sume al contenido de un registro especifico en la CPU. En estos modos la dirección efectiva se obtiene del calculo siguiente: Dirección efectiva = Parte de la instrucción + El contenido de registro CPU. El registro de CPU utilizado en el calculo puede ser el contador de programa, un registro de índice o un registro base. En cualquier caso tenemos un modo de direccionamiento diferente que se utiliza para una aplicación distinta. Modo de Direccionamiento Indexado. En este modo el contenido de un registro índice se suma a la parte de dirección de la instrucción para obtener la dirección efectiva. El registro índice es un registro CPU especial que contiene un valor índice. Un campo de dirección de la instrucción define la dirección inicial del arreglo de datos en la memoria. Cada operando del arreglo se almacena en la memoria en relación con la dirección inicial. La distancia entre la dirección inicial y la dirección del operando es el valor del índice almacenado en el registro de índice. Cualquier operando en el arreglo puede accesarse con la misma instrucción siempre y cuando el registro índice contenga el valor de índice correcto. El registro índice puede incrementarse para facilitar el acceso a operandos consecutivos. Nótese que si una instrucción de tipo índice no incluye un campo de dirección en su formato, la instrucción se convierte al modo de operación de indirecto por registro. Algunas computadoras dedican un registro de CPU para que funcione exclusivamente como un registro índice. De manera implícita este registro participa cuando se utiliza una instrucción de modo índice. En las computadoras con muchos registros de procesador, cualquiera de los registros de la CPU pueden contener el numero de índice. En tal caso, el registro debe estar especificado en forma explícita en una campo de registro dentro del formato de instrucción. Modo de Direccionamiento de Registro Base. En este modo, el contenido de un registro base se suma a la parte de dirección de la instrucción para obtener la dirección efectiva. Esto es similar al modo de direccionamiento indexado, excepto en que el registro se denomina ahora registro base, en lugar de registro índice. La diferencia entre los dos modos esta en la manera en que se usan mas que en la manera en que se calculan. Se considera que un registro base contiene una dirección base y que el campo de dirección de la instrucción proporciona un desplazamiento en relación con esta dirección base. El modo de direccionamiento de registro base se utiliza en las computadoras para facilitar la localización de los programas en memoria. Concepto de INTERRUPCION. Una interrupción es una operación que suspende la ejecución de un programa de modo que el sistema pueda realizar una acción especial. La rutina de interrupción ejecuta y por lo regular regresa el control al procedimiento que fue interrumpido, el cual entonces resume su ejecución.
Tabla de Servicio de Interripción. Cuando la computadora se enciende, el BIOS y el DOS establecen una tabla de servicios de interrupción en las localidades de memoria 000H-3FFH. La tabla permite el uso de 256 (100H) interrupciones, cada una con un desplazamiento:segmento relativo de cuatro bytes en la forma IP:CS. El operando de una instrucción de interrupción como INT 05H identifica el tipo de solicitud. Como existen 256 entradas, cada una de cuatro bytes, la tabla ocupa los primeros 1, 024 bytes de memoria, desde 000H hasta 3FFH. Cada dirección en la tabla relaciona a una ruina de BIOS o del DOS para un tipo especifico de interrupción. Por lo tanto los bytes 0-3 contienen la dirección para la interrupción 0, los bytes 4-7 para la interrupción 1, y así sucesivamente:
Eventos de una Interrupcion. Una interrupción guarda en la pila el contenido del registro de banderas, el CS, y el IP. por ejemplo, la dirección en la tabla de INT 05H (que imprime la que se encuentra en la pantalla cuando el usuario presiona Ctrl + PrtSC) es 0014H (05H x 4 = 14H). La operación extrae la dirección de cuatro bytes de la posición 0014H y almacena dos bytes en el IP y dos en el CS. La dirección CS:IP entonces apunta al inicio de la rutina en el área del BIOS, que ahora se ejecuta. La interrupción regresa vía una instrucción IRET (regreso de interrupción), que saca de la pila el IP, CS y las banderas y regresa el control a la instrucción que sigue al INT. Tipos de Interrupciones. Las interrupciones se dividen en dos tipos las cuales son: Externas y Internas. Una interrupción externa es provocada por un dispositivo externo al procesador. Las dos líneas que pueden señalar interrupciones externas son la línea de interrupción no enmascarable (NMI) y la línea de petición de interrupción (INTR). La línea NMI reporta la memoria y errores de paridad de E/S. El procesador siempre actúa sobre esta interrupción, aun si emite un CLI para limpiar la bandera de interrupción en un intento por deshabilitar las interrupciones externas. La línea INTR reporta las peticiones desde los dispositivos externos, en realidad, las interrupciones 05H a la 0FH, para cronometro, el teclado, los puertos seriales, el disco duro, las unidades de disco flexibles y los puertos paralelos. Una interrupción interna ocurre como resultado de la ejecución de una instrucción INT o una operación de división que cause desbordamiento, ejecución en modo de un paso o una petición para una interrupción externa, tal como E/S de disco. Los programas por lo común utilizan interrupciones internas, que no son enmascarables, para accesar los procedimientos del BIOS y del DOS.
Interrupcion de BIOS. El BIOS contiene un extenso conjunto de rutinas de entrada/salida y tablas que indican el estado de los dispositivos del sistema. El dos y los programas usuarios pueden solicitar rutinas del BIOS para la comunicación con los dispositivos conectados al sistema. El método para realizar la interfaz con el BIOS es el de las interrupciones de software. Conocer los servicios de BIOS que nos permiten manejar el teclado, a más bajo nivel que DOS; especialmente, el manejo del teclado sin requerir de espera. A continuación se listan algunas interrupciones del BIOS. INT 00H: División entre cero. Llamada por un intento de dividir entre cero. Muestra un mensaje y por lo regular se cae el sistema. Video. Teclado. INT 01H: Un solo paso. Usado por DEBUG y otros depuradores para permitir avanzar por paso a través de la ejecución de un programa. Texto. Teclado. INT 02H: Interrupción no enmascarare. Usada para condiciones graves de hardware, tal como errores de paridad, que siempre están habilitados. Por lo tanto un programa que emite una instrucción CLI (limpiar interrupciones) no afecta estas condiciones. Texto. Tecaldo. INT 03H: Punto de ruptura. Usado por depuración de programas para detener la ejecución. Texto. INT 04H: Desbordamiento. Puede ser causado por una operación aritmética, aunque por lo regular no realiza acción alguna. INT 05H: Imprime pantalla. Hace que el contenido de la pantalla se imprima. Emita la INT 05H para activar la interrupción internamente, y presione las teclas Cltr + PrtSC para activarla externamente. La operación permite interrupciones y guarda la posición del cursor. Video. INT 06H y 07H: Texto. INT 08H: Sistema del cronometro. Una interrupción de hardware que actualiza la hora del sistema y (si es necesario) la fecha. Un chip temporizador programable genera una interrupción cada 54.9254 milisegundos, casi 18.2 veces por segundo. Texto. INT 09H: Interrupción del teclado. Provocada por presionar o soltar una tecla en el teclado. Texto. INT OBH, INT OCH: Control de dispositivo serial. Controla los puertos COM1 y COM2, respectivamente. Grafico. INT 0DH, INT OFH: Control de dispositivo paralelo. Controla los puertos LPT1 y LPT2, respectivamente. Grafico. INT 0EH: Control de disco flexible. Señala actividad de disco flexible, como la terminación de una operación de E/S. INT 10H: Despliegue en vídeo. Acepta el numero de funciones en el AH para el modo de pantalla, colocación del cursor, recorrido y despliegue. INT 11H: Determinación del equipo. Determina los dispositivos opcionales en el sistema y regresa el valor en la localidad 40:10H del BIOS al AX. (A la hora de encender el equipo, el sistema ejecuta esta operación y almacena el AX en la localidad 40:10H). INT 12H: Determinación del tamaño de la memoria. En el AX, regresa el tamaño de la memoria de la tarjeta del sistema, en términos de kilobytes contiguos. INT 13H: Entrada/salida de disco. Acepta varias funciones en el AH para el estado del disco, sectores leídos, sectores escritos, verificación, formato y obtener diagnostico.
Interrupción del DOS. Los dos módulos del DOS, IO.SYS y MSDOS.SYS, facilitan el uso del BIOS. Ya que proporcionan muchas de las pruebas adicionales necesarias, las operaciones del DOS por lo general son mas fáciles de usar que sus contrapartes del BIOS y por lo común son independientes de la maquina. IO.SYS: Es una interfaz de nivel bajo con el BIOS que facilita la lectura de datos desde la memoria hacia dispositivos externos. MSDOS.SYS: contiene un administrador de archivos y proporciona varios servicios. Por ejemplo, cuando un programa usuario solicita la INT 21H, la operación envía información al MSDOS.SYS por medio del contenido de los registros. Para completar la petición, MSDOS.SYS puede traducir la información a una o mas llamadas a IO.SYS, el cual a su vez llama al BIOS. Las siguientes son las relaciones implícitas:
Interrupciones del DOS. Las interrupciones desde la 20H hasta la 3FH están reservadas para operaciones del DOS. A continuación se mencionan algunas de ellas. INT 20H: Termina programa. Finaliza la ejecución de un programa .COM, restaura las direcciones para Cltr + Break y errores críticos, limpia los bufer de registros y regresa el control al DOS. Esta función por lo regular seria colocada en el procedimiento principal y al salir de el, CS contendría la dirección del PSP. La terminación preferida es por medio de la función 4CH de la INT 21H. INT 21H: Petición de función al DOS. La principal operación del DOS necesita una función en el AH. Ejemplo. INT 22H: Dirección de terminación. Copia la dirección de esta interrupción en el PSP del programa (en el desplazamiento 0AH) cuando el DOS carga un programa para ejecución. A la terminación del programa, el DOS transfiere el control a la dirección de la interrupción. Sus programas no deben de emitir esta interrupción. INT 23H: Dirección de Cltr + Break. Diseñada para transferir el control a una rutina del DOS (por medio del PSP desplazamiento 0EH) cuando usted presiona Ctlt + Break o Ctlr + c. La rutina finaliza la ejecución de un programa o de un archivo de procesamiento por lotes. Sus programas no deben de emitir esta interrupción. INT 24H: Manejador de error critico. Usada por el dos para transferir el control (por medio del PSP desplazamiento 12H) cuando reconoce un error critico (a veces una operación de disco o de la impresora).Sus programas no deben de emitir esta interrupción. INT 25H: Lectura absoluta de disco. Lee el contenido de uno o mas sectores de disco. INT 26H: Escritura absoluta de disco. Escribe información desde la memoria a uno o mas sectores de disco. INT 27H: Termina pero permanece residente (reside en memoria). Hace que un programa .COM al salir permanezca residente en memoria. INT 2FH: Interrupción de multiplexion. Implica la comunicación entre programas, como la comunicación del estado de un spooler de la impresora, la presencia de un controlador de dispositivo o un comando del DOS tal como ASSIGN o APPEND. INT 33H: Manejador del ratón. Proporciona servicios para el manejo del ratón.
[editar] Direccionamiento Memoria
[editar] Formato De Un Programa
[editar] Proceso de Ensamble y Ligado
[editar] Instrucciones
[editar] Instrucciones Aritméticas
[editar] Instrucciones De Comparación
[editar] Instrucciones De Saltos
[editar] Instrucciones Para Stack
[editar] Macros Ensamblador
[editar] Interrupciones Ensamblador
[editar] Unidad 3: Compiladores Funciones
[editar] Fases de un Compilador
[editar] Fase de Análisis Compilador
[editar] Análisis Lexicografico Compilador
Texto en negrita==== Análisis Sintáctico Compilador ==== Texto en cursiva
[editar] Análisis Semántica Compilador
[editar] Fase De Síntesis Compilador
[editar] Generación Optimización Código Intermedio
[editar] Generación Optimización Código Objeto
[editar] Diferencias entre Intérpretes y Compiladores
[editar] Unidad 4: Ligadores y cargadores
[editar] Ligadores
[editar] = Liga de bibliotecas de código objeto
[editar] Ligadores Estáticos
Cuando se utilizan subrutinas en un programa, el código ejecutable de cada una de ellas debe encontrarse en memoria al tiempo de ejecución. Para esto, antes de cargar un programa, debe ligarse su código objeto con los códigos objeto (guardados en uno o más archivos) de cada una de las subrutinas invocadas por él, obteniendo así un programa ejecutable que contiene tanto el código del módulo invocador como el código de los módulos invocados. En este punto, es posible guardar el resultado del proceso de liga en un archivo que podrá ser utilizado por un cargador, o el mismo programa ligador puede también realizar la tarea de carga. Esto último evita el tener que guardar el código ejecutable en un archivo, con lo que se ahorra espacio en disco. Este ahorro de espacio en disco se paga con el tiempo gastado al tener que ligar todos los módulos cada vez que se necesite ejecutar el programa.
[editar] Ligadores Dinámicos
Ligado dinámico El ligado dinámico ofrece algunas ventajas sobre los otros tipos de ligado. Proporciona la posibilidad de cargar las rutinas sólo cuando y si se necesitan. SI las subrutinas son grandes o tienen muchas referencias externas, se pueden conseguir ahorros considerables de tiempo y espacio de memoria. De forma similar, supóngase que en cualquier ejecución un programa usa sólo pocas de una gran cantidad de subrutinas posibles, pero el número exacto de rutinas necesarias no puede predecirse hasta que el programa examina su entrada. Esta situación podría presentarse, con un programa que permita al usuario llamar interactivamente a cualquiera de las subrutinas de una gran biblioteca matemática y estadística. El usuario podría suministrar la entrada de datos desde un terminal de tiempo compartido, y los resultados podrían exhibirse en el terminal. En este caso podrían ser necesarias todas las subrutinas de la biblioteca, pero en cualquier sesión de terminal solo se usarían unas cuantas. El ligado dinámico evita la necesidad de cargar la biblioteca completa para cada ejecución. El ligado dinámico puede incluso hacer innecesario que el programa conozca el conjunto de subrutinas que se podría utilizar. El nombre de la subrutina se trataría simplemente como otro elemento de entrada. Para realizar la carga de ligado de una subrutina llamada se puede utilizar varios mecanismos distintos. En el método que se analiza aquí, las rutinas que se carguen dinámicamente deben llamarse por medio de una solicitud de servicio al sistema operativo. Este método también podría considerarse como una solicitud a una parte del cargador que se mantiene en la memoria durante la ejecución del programa. Cuando se utiliza ligado dinámico, la asociación de una dirección real y el nombre simbólico de la rutina llamada no se hace hasta que se ejecuta la proposición llamada.
[editar] Cargadores
[editar] Carga Absoluta y Relocalizable
EL PROCESO DE CARGA ABSOLUTA Los cargadores absolutos existen en sistemas de los que los compiladores generan código absoluto (no relocalizables).De esta forma se obliga a que el programa se obliga a cargar las mismas posiciones son relativamente pero no permiten tener multiprogramación. La carga absoluta necesita que el modulo de carga ocupe siempre la misma posición de memoria principal. Así pues, todas las referencias del modulo de carga para el cargador deben ser direcciones especificas o absolutas en memoria principal. La asignación de direcciones específica a la referencia de memoria de un programa puede ser realizada tanto por el programador en tiempo de compilación o ensamblaje. Con este método se tienen varias desventajas las cuales son: ¤ Todos los programadores tendrán que conocer la estrategia de asignación deseada para situar los módulos en memoria principal. ¤ Si se hace alguna modificación en el programa que se suponga inserciones o borrados en el cuerpo modulo tendrán que cambiarse las direcciones por consiguiente es expresar simbólicamente y que se resuelvan en el momento de la compilación o ensamblaje. Cuando se prepara el modulo para la entrada a un cargador absoluto, el ensamblador o el compilador convertirá todas esas diferencias a direcciones. Se denomina cargador absoluto porque carga el programa ejecutable en una posición fija. En algunas cargadores absolutos la dirección de carga esta
denominada por un campo en el encabezado del archivo ejecutable .Aunque esta estrategia es un poco mas general que el empleo de una constante predefinida, la posición usada para el programa se sigue determinando al ensamblar y enlazar el programa. En esencia el cargador copia los segmentos de texto y datos de un archivo ejecutable a la memoria de la maquina. A continuación se presenta el pseudo código para un cargador sencillo /***definir la estructura del registro de encabezado ***/ struct enc_ejec{ unsigned int dir_ini; /* las otras partes del encabezado del archivo ejecutable */ }; /***prototipos para las funciones usadas por el cargador***/ struct enc_ejec leer_enc( FILE *); char leer_byte ( FILE *); /***--------el cargador ---------***/ char *carga (File *arch_ejec); { struct enc enc_ejec encabezado ; char *dire_byte; /* leer encabezado del archivo */* encabezado = leer enc(arch_ejec); /*copiar a la memoria los segmentos de texto y datos */ dir_byte = DIR_CARGA; while(leof(arch_ejec)){ dir_byte=leer (arch_ejec); dir_byte= dir_byte+1 ; } return (char*) encabezado dir_ini); } En este código, el cargador comienza leyendo la porción de encabezado contiene la dirección de inicio , ósea la dirección de la primera instrucción que ese ejecuta la .Después de leer el encabezado el cargador entra a u lazo en el cual se copian a la memoria de la maquina los demás bytes del archivo ejecutable (los segmentos de texto y datos ).Por ultimo , el cargador devuelve el valor del campo de dirección inicial del encabezado. Supuestamente, este valor se usa como destino de una instrucción de ramificación (o de salto o subrutina) cuando se ejecuta el programa.
Hay dos aspectos del programa cargador que requiera una mayor explicación: la variable dir_ byte el campo dir_ini. Comenzaremos por la variable dir_byte , que se declara como apuntadores a un carácter, ósea, es la dirección de un carácter. Es razonable suponer que la almacena un carácter usando un byte de memoria y que, por consiguiente, la variable dir_byte contiene la dirección de un byte de memoria .Inicialmente, esta variable se asigna igual a la constante DIR_CARGA. En cada interacción el lazo while, a la posición de memoria identificada por dir_byte se le asigna el siguiente byte del archivo ejecutable; después se incrementa en un valor de dir_byte. De esta manera, el contenido del archivo ejecutable se copia a posiciones consecutivas de la memoria de DIR_CARGA EL PROCESO DE CARGA RELOCALIZABLE En la relocalización dinámica se establece la correspondencia entre las direcciones usadas en el programa a y direcciones físicas cada vez que se utilizan durante la ejecución del programa. Las direcciones 1ógicas generadas por el ensamblador y el enlazador no se alteran durante la carga. Comenzaremos por ver un sencillo método en el cual el programa se carga en posiciones contiguas de la memoria; es decir, el programa no esta disperso por la memoria. En la figura 1.2 se presenta un cargador sencillo que puede usarse con la relocalización dinámica. En este caso, el cargador lee el encabezado del archivo ejecutable y determina la cantidad de espacio necesaria para el programa. Después asigna espacio suficiente para el programa y copia el archivo ejecutable a memoria. Cuando se carga el programa en la memoria, el cargador establece la correspondencia necesaria para el programa, pasando la dirección de carga y el tamaño del programa a una rutina llamada establecer_ correspondencia. AI leer este código, observe que la función de carga devuelve un entero sin signo en lugar de un apuntador. Esto refleja el hecho de que la dirección inicial es una dirección 1ógica y no una dirección física. Pseudo código para un cargador sencillo (relocalización dinámica) Struct enc_ejc{ Unsigned int dir_ini; Unsigned int tamaño_texto, tamaño_datos, tamaño_bss; /*otros campos del registro de encabezado*/ }; /***prototipo para las funciones usadas por el cargador***/ struct enc_leer_enc(FILE*); char leer_byte(FILE*); char*obtener_memoria(unsigned int); void establecer_correspondencia(char*unsigned int); /***el cargador***/ unsigned int*carga (FILE*arch_ejec) { struct enc_ejec encabezado; char*dir-byte, *dir_carga; unsigned int tamaño_prog; encabezado=leer_rnc(arch_ejec); /*determinar el tamaño del programa y asignar el espacio*/ tamaño_prog=encabezado.tamaño_texto + encabezado. Tamaño_datos+ encabezado.tamaño_bss; dir_carga=obtener_memoria (tamaño_prg); /*copiar los segmentos de texto y datos*/ dir_byte =dir_carga; while(!eof(arch_ejec){
- dir_byte=leer_byte(arch_ejec);
dir_byte=dir_byte+1; } /*establecer la correspondencia de direcciones*/ establecer_correspondencia(dir_carga,tamaño_prog); return ((char*)encabezado.dir_ini); } Con esto llegamos al hardware de correspondencia de direcciones, ilustrado en la figura 1.3. Cuando la UCP tiene que realizar un acceso a memoria (lectura o escritura), presenta al hardware de correspondencia de memoria el resultado del cálculo de la dirección efectiva. El hardware de correspondencia de direcciones traduce la dirección 1ógica a una dirección física.
Perspectiva operacional de la correspondencia de direcciones.