



## Le virtual machine e la memoria virtuale

Prof. Alberto Borghese Dipartimento di Informatica

alberto.borghese@unimi.it

Università degli Studi di Milano

Riferimento Patterson: 5.6, 5.7, 2.12.

A.A. 2023-2024 1/53 http://borghese.di.unimi.it/



## **Sommario**



 $http: \hspace{-0.05cm} \ \ \, | borghese.di.unimi.it \rangle$ 

#### Le virtual machine

La memoria virtuale

La traduzione degli indirizzi



## Virtual machines (VM)



La VM è un **software** (middleware) che fornisce un **ambiente completo** a <u>livello di sistema</u> **operativo**, compatibile con una certa ISA (e.g. x86, MS-DOS, Linux): VMware, ESX Server...

Sviluppate negli anni 60 e riprese recentemente per:

- Sicurezza e isolamento di sotto-sistemi.
- Condivisione dello stesso sistema da parte di molti utenti (e.g. cloud computing)
- Riproduzione di SO vintage.

La velocità dei processori rende il costo della virtualizzazione accettabile.

Lo stesso calcolatore può **supportare più VM** e può quindi supportare più SO e ambienti, anche obsoleti, quali ad esempio il DOS e quindi programmi non più eseguibili direttamente. Esempio:

- MS-DOS
- Linux Ubuntu
- Beta-release di un SO (per testing)

Può consentire l'esecuzione di un'applicazione nel suo ambiente nativo (versione corretta del SO: e.g. Windows 2000, Windows XP).



### Caratteristiche di una VM



SW di emulazione. (e.g. Java Virtual Machine): non è una macchina fisica!

Il Sistema operative è deputato a gestire i componenti HW dell'architettura (e.g. interrupt per la gestione dell'I/O).

VM di un'ISA: ambiente di sistema congruente con una certa ISA (elementi di stato, funzionalità di I/O previste = messe a disposizione dai componenti hardware).

Le VM creano l'illusione, ad esempio, di avere a disposizione una macchina MS-DOS su una macchina Linux.

Essendo la VM SW, diverse VM possono essere eseguite sulla stessa macchina ospitante, emulando diversi SO. Le diverse VM vengono eseguite in modo segregato. Ciascuna VM, quando è in esecuzione, utilizza l'hardware a disposizione nella macchina ospitante come se fosse suo.

Il software eseguito da una VM (software ospitato) deve essere eseguito esattamente **come se fosse eseguito sull'ISA nativa** (a parte le prestazioni).

A.A. 2023-2024 4/53 http:\\borghese.di.unimi.it\





## Il Monitor (VMM)



Le VM sono supportate da uno strato software particolare chiamato **Monitor della Virtual Machine** (VMM, Virtual Machine Monitor) o **Hypervisor**. Questo software fa da tramite tra la propria VM e l'ambiente ospitante (hardware + SO).

Il costo principale è legato all'intervento del SO della CPU ospitante per tradurre le richieste del SO ospitato (I/O, memoria....) in richieste comprensibili dal SO (e dall'ISA) della CPU ospitante.

Il VMM è la parte di controllo della VM. E' un ruolo delicato:

- Deve proteggere i SW ed i sistemi operativi ospitati.
- Deve proteggersi dagli (altri) sistemi operativi ospitati.



A.A. 2023-2024

6/53

http:\\borghese.di.unimi.it\



## Il funzionamento del VMM



- un VMM ha privilegi di sistema (deve interfacciarsi con la CPU ospitante).
- una VM ha i privilegi di utente (è equivalente a un comune programma per la CPU ospitante).

Il software eseguito da una VM **non deve modificare nulla delle risorse della macchina ospitante direttamente**, ma deve passare attraverso il SO della macchina ospitante (per cui le richieste di modifica delle risorse vengono rilevate (trapped) dal VMM che le traduce in richieste che siano recepibili dal SO e dall'hardware ospitante).

Un VMM mappa le risorse virtuali (della VM) nelle risorse fisiche della CPU opsitante:

- Time-sharing
- Partizionamento
- Emulazione.
- Multi-thread.

Per **esempio**, nel caso in cui un processo ospitato (guest) sia basato su un timer (eccezione di sistema), l'eccezione dovrà essere «tradotta» dal VMM. La «traduzione» potrebbe utilizzare il timer di sistema della CPU ospitante, se disponibile o essere tradotta in un task del SO.

Il timer del processo ospitato non accede direttamente al timer, ma ci accede attraverso il VMM che si interfaccia con il SO della macchina ospitante che accede all'HW della macchina ospitante.



## Il VMM e le istruzioni privilegiate



Il costo della virtualizzazione dipende dal tipo di processo eseguito.

Tradurre istruzioni "semplice" quali una somma, richiede un overhead minimo. Mentre richiede un costo elevato la traduzione delle istruzioni in istruzioni del SO ospitante.

Tanto maggiore è il ricorso al SO, tanto maggiore il costo della virtualizzazione (e.g. processi con un I/O intensivo hanno un overhead elevato, processi di calcolo intensivi hanno poco over-head).

#### L'overhead dipende

- Numero di chiamate al SO (e di istruzioni che devono essere emulate)
- Aumento del tempo di esecuzione di ciascuna di queste istruzioni (e.g. timer HW ha un costo molto inferiore di una "traduzione" SW di un task del SO, come per esempio la "traduzione" della risposta a Intterrupt).

A.A. 2023-2024 8/53 http:\\borghese.di.unimi.it\



## Richiesta al SO



Cosa succede quando un programma ospitato fa una richiesta privilegiata attraverso il suo SO, ospitato, (e.g. lancia un interrupt o un'eccezione?).

Queste devono essere intercettate (**trap**) dal VMM che le gestirà nel modo più appropriato tenendo conto dello stato della CPU opsitante e delle altre VM.

Questo processo può rilevarsi molto costoso soprattutto quando l'applicazione ospitata fa molto uso di I/O ma anche di altre funzionalità.

Applicazioni che eseguono principalmente funzioni di calcolo o fanno poco utilizzo della virtualizzazione, sono quelle eseguite più velocemente dalle VM.

A.A. 2023-2024 9/53 http://borghese.di.unimi.it/





## **Amazon Web Services (AWS)**



### Utilizza le VM per il cloud computing:

- I diversi utenti vengono protetti uno dall'altro.
- Il SO e la sua configurazione, richiesto da un cliente può venire istallato su più machine del cloud.
- AWS può eliminare le VM che non servono più risparmiando risorse.
- Si possono utilizzare macchine eterogenee, non della stessa generazione, aggiornandole via via. Le prestazioni vengono specificate "Equivalent CPU capacity".
- Il VMM può essere configurato per misurare:
  - Lo spazio su disco
  - L'utilizzo della rete
  - L'utilizzo del processore

Per poi fatturare al cliente.

A.A. 2023-2024 11/53 http://borghese.di.unimi.it/



## Sommario



Le virtual machine

La memoria virtuale

La traduzione degli indirizzi

.A. 2023-2024 12/53

 $http: \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} http: \hspace{-0.05cm} \hspace{-0.05c$ 





## Le origini della Memoria Virtuale



1) L'insieme di dati e di memoria (working set) di un task può essere maggiore di quanto si può caricare in memoria principale.

Il working set si può suddividere in moduli che possono risiedere alternativamente in memoria. Questi moduli condividono lo stesso spazio di indirizzi fisico e non potranno coesistere nella memoria.

Il meccanismo che gestisce il caricamento / scaricamento dei moduli di uno stesso task si chiama(va) **overlay**. Era il programmatore a specificare quali moduli potevano essere in overlay, poi ha iniziato a pensarci il linker. **Moduli bilanciati.** 

2) Necessità di protezione dello spazio di memoria (principale) di un processo. Nessun altro processo deve potere scrivere nel suo spazio di lavoro (**protezione della memoria**).

.A. 2023-2024 14/53



### La memoria virtuale



Principio: distinzione tra memoria logica e memoria fisica.

Meccanismo. Viene assegnata la memoria principale logica a ogni processo in una quantità sufficientemente grande (anche maggiore della memoria fisica presente sulla CPU) e in posizione assoluta (indipendentemente da altri task presenti in memoria al momento dell'esecuzione).

La memoria principale fisica è la stessa per diversi programmi in esecuzione, i quali condividono lo stesso spazio di indirizzamento fisico e quindi devono risiedere in zone diverse della memoria principale.

La memoria virtuale consente di mappare lo spazio di memoria logico (software) di ciascun processo sulla memoria fisica (reale).

Lo spazio virtuale viene mappato dalla MMU sulla MM, memoria fisica, evitando sovrapposizioni e consente una gestione sicura della memoria.

La memoria virtuale consente anche di nascondere al programmatore la **dimensione limitata della memoria principale fisica** rispetto alla memoria logica richiesta dal processo.

A.A. 2023-2024 15/53 http:\\borghese.di.unimi.it\



## **Terminologia**



Un blocco di memoria principale: virtuale o fisica (della stessa dimensione) viene chiamato **pagina** (equivalente alla linea della cache).

L'accesso alla memoria principale avviene mediante l'indirizzo virtuale (che è quello specificato dall'ISA, lw \$t0, address. Address fa quindi riferimento alla memoria virtuale – indirizzo virtuale).

L'indirizzo virtuale del processo deve essere trasformato in un indirizzo fisico dalla MMU.

- · Il processo può essere mappato ovunque in MM.
- L'indirizzo fisico viene assegnato all'atto del caricamento (loading) del processo da disco a MM, viene caricato in un certo numero di pagine della memoria fisica.

Inizialmente i dati e le istruzioni risiedono su disco.

Una miss dalla memoria principale in giù viene chiamata page fault.

Se si verifica una **hit** nella memoria principale, il micro-blocco viene trasferito dalla memoria principale alla linea di cache, se si verifica un **page fault**, occorre caricare la pagina da disco in memoria principale e poi trasferire il micro-blocco contenuto in quella pagina nella opportuna linea di cache.

\text{\lambda.} \text{\lambda.



## Indirizzi fisici e indirizzi virtuali





Ciascun programma ha il suo spazio di indirizzamento (virtuale) che viene mappato su disco e sulla memoria principale (indirizzi fisici).

Il processore genera indirizzi virtuali mentre alla memoria si accede mediante indirizzi fisici.

## Indirizzamento della Memoria



Indirizzamento della MM: indirizzo base (indirizzo della pagina) + offset di pagina

#### Virtual address



#### Physical address

Altro esempio di base (numero di pagina) + offset

- Il numero di pagina fisico è determinato dalla quantità di memoria fisica.
- Il numero di pagine virtuali è virtualmente infinito: dipende dal numero di bit degli
  indirizzi virtuali. In questo caso 30 bit di indirizzamento della memoria fisica -> 1 Gbyte
  di memoria fisica e 32 bit di indirizzamento della memoria virtuale -> 4 Gbyte di memoria
  logica (vituale)

ıi.it\



## Criteri di progettazione della memoria principale



Strategie diverse da quelle utilizzate nelle cache. Obbiettivo principale è nascondere la penalità di page fault.

| Memory technology          | Typical access time     | \$ per GiB in 2012 |
|----------------------------|-------------------------|--------------------|
| SRAM semiconductor memory  | 0.5–2.5 ns              | \$500-\$1000       |
| DRAM semiconductor memory  | 50-70 ns                | \$10-\$20          |
| Flash semiconductor memory | 5,000-50,000 ns         | \$0.75-\$1.00      |
| Magnetic disk              | 5,000,000-20,000,000 ns | \$0.05-\$0.10      |

L'accesso a disco (magnetico) può essere quasi un milione di volte più lento della MM. 100 volte più lento nel caso ottimale di disco (a stato solido).

NB Questa penalità è dovuta largamente al tempo per accedere alla prima parola della pagina (latenza). Con il trasferimento a burst il resto dei dati viene trasferito più velocemente.

Occorre nascondere questa latenza! E minimizzare i page fault.

A.A. 2023-2024 19/53 http:\\borghese.di.unimi.it\



# Criteri di organizzazione della memoria principale



Le pagine devono essere sufficientemente ampie per ammortizzare i tempi di accesso (anche a seguito di una hit). Pagine di 4 KByte sono tipiche.

- Server -> 32/64 Kbyte
- Sistemi embedded -> 1 Kbyte

La mappatura delle pagine virtuali dalla memoria virtuale sulla memoria principale è completamente associativa per massimizzare il riempimento della MM fisica ed evitare i page fault => Non c'è necessariamente contiguità tra le diverse pagine fisiche di uno stesso processo.



La gestione dei page fault può essere software (SO) visto il lungo tempo a disposizione per gestirli.

Ottimizzazione del posizionamento delle pagine (scelta oculata di quale pagine scaricare su disco per fare posto a una nuova pagina).

Lo scaricamento su disco **di una pagina** (scrittura) viene gestita in modalità *write-back* (con write buffer).

it∖



## Posizionamento delle pagine



Si utilizza la **Tabella delle pagine**, a sua volta residente nella memoria principale, indirizzata dal *registro della tabella delle pagine*.

Non si può cercare una pagina virtuale, controllando tutte le pagine contenute nella memoria fisica => non si può utilizzare una tabella delle pagine associativa.

La tabella delle pagine è **indicizzata** con il numero della pagina virtuale (è una memoria ad accesso diretto).

La tabella delle pagine contiene la traduzione del numero di pagina virtuale in numero di pagina fisica. Controlla anche se la pagina fisica sia già presente nella memoria fisica (hit o miss).

#### Tabella delle traduzioni o mappatura. Ogni processo ha la sua PT.

E.g. Catalogo di una libreria (mappatura tra numero sequenziale del libro – indirizzo virtuale; e posizione nella libreria – indirizzo fisico). Alcuni libri possono non essere contenuti nella libreria locale ma in una libreria più grande (il disco).

A.A. 2023-2024 21/53 http:\\borghese.di.unimi.it\



## Tabella delle pagine





Physical address

L'altezza della memoria è teoricamente pari al numero di pagine virtuali. Per ogni pagina virtuale è riportata la traduzione. Bit di validità come nelle cache.

A.A. 2023-2024 22/53 http:\\borghese.di.unimi.it\



## Gestione di un page fault - I



All'avviamento di un processo il SO crea tutte le pagine del processo su disco (**swap space**). La pagina richiesta all'inizio non sarà contenuta in memoria, ma sarà contenuta su disco nello **swap space** di ogni processo (page fault da cold-start). Anche successivamente la pagina potrebbe non essere presente in memoria principale.

La posizione in MM e su disco può essere data dalla stessa tabella delle pagine.



## Gestione di un page fault - II



Se la MMU cercando nella tabella delle pagine identifica che la pagina cercata ha il bit di validità = 0 (pagina non ancora caricata), genera un page fault.

Un page fault genera un'eccezione che deve essere gestita via hardware/software (dal SO). Come?

LRU approssimato. **Use bit** (**Reference bit**). Quando la MMU accede a quella pagina imposta lo use bit a 1. Periodicamente tutti gli use bit vengono azzerati.

In caso di page fault, la pagina virtuale viene trasferita in una pagina il cui Use bit  $\grave{e}=0$ .

NB Lo use bit è differente dal bit di validità.



A.A. 2023-2024

24/5



## Dimensione di una tabella delle pagine



#### Indirizzi virtuali e fisici su 32 bit

Dimensione della pagina di memoria di 64 Kbyte (2<sup>16</sup> Byte)

Numero di elementi *massimo* della tabella delle pagine (numero di linee massimo):

 $2^{32}/2^{16} = 2^{16}$  linee (numero di pagina fisica su 2 Byte – 16 bit -> 2 Byte)

Tabella di ampiezza 2 Byte e altezza massima 64 K linee => 128 Kbyte (upper bound con numero di pagina fisica su 2 Byte)

Abbiamo bisogno di 128 kByte per ogni processo attivo.

#### Indirizzi virtuali su 40 bit e fisici su 32 bit

Dimensione della pagina di memoria di 4 Kbyte (2<sup>12</sup> Byte)

Numero di elementi *massimo* della tabella delle pagine (numero di linee massimo):

 $2^{40} / 2^{12} = 2^{28}$  linee (numero di pagina fisica su 4 Byte -32 - 12 = 20 bit -> 4 Byte)

Tabella di ampiezza 4 Byte e altezza massima 256 M linee => 1 Gbyte!

Cosa succede se abbiamo centinaia di processi?

Cosa succeede per indirizzi a 64 bit?

 $2^{64}$  /  $2^{16}$  =  $2^{48}$  linee (ciascuna di 4 Byte) => 1 000 000 000 000 000 di Byte!

A.A. 2023-2024 25/53 http:\\borghese.di.unimi.it\



## Limitazione della tabella delle pagine



- Limitazione monodirezionale dell'altezza. Tabella virtuale di altezza limitata (numero max di linee cioe' di pagine virtuali). Possibilità di espandere in senso crescente.
- Limitazione bidirezionale dell'altezza. Memoria dati suddivisa in stack e heap. Crescono in direzioni opposte => 2 tabelle delle pagine, una che ha indirizzi che crescono verso il basso e una che ha indirizzi che crescono verso l'alto. Entrambe con numero di linee limitato (segmenti).
- Accesso indiretto. Altezza pari all'altezza della memoria fisica. Funzione di hashing per mappare l'indirizzo virtuale in indirizzo fisico. L'indirizzo virtuale non è più un indice ma diventa una chiave di accesso alla tabella.
- · Tabella delle pagine gerarchica.
  - Primo livello. Indicizza segmenti costituiti da un certo numero di pagine virtuali contigue (segment table).
    - A) Il segmento contiene almeno una pagina caricata in MM.
    - B) Il segmento non contiene pagine caricate in MM
  - Nel caso A) la linea della segment table punta alla sotto-tabella delle pagine per quel segmento.
- Virtualizzazione della tabella delle pagine che viene inserita in memoria virtuale (la pagina A.A. del la memoria conterrà traduzioni adiacent 1953 http://borghese.di.unimi.it/



## IL TLB - Translation Lookaside buffer



http:\\borghese.di.unimi.it\

Con le PT (Page Table - Tabelle delle pagine) ogni accesso alla memoria principale richiede in realtà **2 accessi** (1 accesso alla PT + 1 accesso alla pagina).

Si sfrutta il principio di località: quando si accede al dato di una certa pagina, facilmente si avrà bisogno di un altro dato della stessa pagina. Si può evitare di dovere ritradurre una seconda volta l'indirizzo virtuale. Come?

Si introduce un buffer HW: **Translation Lookaside Buffer** (TLB) che memorizza le traduzioni (cache delle traduzioni):

- Dimensioni: 16-512 elementi (linee)
- Dimensione della linea (1-2 pagine, 4-8 byte ciascuna)
- Tempo di hit: 0,5-1 ciclo di clock
- Penalità di miss: 10-100 cicli di clock (per caricare la traduzione)
- Frequenza di miss: 0,01%-1%

A. 2023-2024

E.g. Nella libreria è come mantenere su un fogliettino la corrispondenza tra il numero d'ordine dei libri appena consultati e la loro posizione sugli scaffali della libreria.

A.A. 2023-2024 27/53 http:\\borghese.di.unimi.it\



28/53







## Accesso alla memoria principale (miss in cache)



1) Invio al TLB l'indirizzo virtuale

Ho due situazioni:

1a) Indirizzo della pagina fisica è presente nel TLB (**hit del TLB** - TAG = #pagina e valid = 1) Reference bit = 0/1

Dirty bit = 1 (se accesso in scrittura).

1b) Miss -> Indirizzo della pagina fisica non è presente (miss del TLB).

Se ho una hit -> indirizzo fisico della (pagina della) memoria principale Lettura del micro-blocco e trasferimento in cache.

A.A. 2023-2024 31/53 http:\\borghese.di.unimi.it\



## Accesso alla memoria principale (miss in cache, ma hit in MM)



- 1) Invio al TLB dell'indirizzo virtuale
- 1b) Miss -> Indirizzo della pagina fisica non è presente (miss del TLB).
- Leggo la linea della tabella delle pagine usando come indice l'indirizzo virtuale e controllo il bit di validità.
- 2a) La traduzione è nella PT -> indirizzo fisico.
- 2b) La traduzione non è nella PT -> (page fault) -> indirizzo su disco.
- 2a) La traduzione è in MM

Carico nel TLB la traduzione dell'indirizzo virtuale se miss nel TLB Trasferisco da MM a cache la linea richiesta.

A.A. 2023-2024 32/53 http://borghese.di.unimi.it/



## Accesso alla memoria principale (miss in cache e page fault)



- 1) Invio al TLB dell'indirizzo virtuale
- 1b) Miss -> Indirizzo della pagina fisica non è presente (miss del TLB).
- 2b) La traduzione non è nella PT -> (page fault).

#### Nel caso di page fault:

- Trasferisco da disco a MM la pagina richiesta
- · Carico nella TB la traduzione dell'indirizzo della pagina virtuale.

Le miss del TLB sono più frequenti dei page fault.

A.A. 2023-2024 33/53



### Gestione dei fallimenti



http:\\borghese.di.unimi.it

Miss nel TLB. Il TLB è una cache associativa. Sostituzione random. I bit di stato (valid, dirty, reference) vengono utilizzati per la politica di sostituzione delle pagine => quando scarico una linea del TLB nella PT devo aggiornare lo stato della pagina fisica. Se ho utilizzato di recente i dati di quella pagina quando erano in cache o li ho modificati deve risultare.

Page fault. Cercare la pagina virtuale nella tabella delle pagine e localizzare la pagina fisica corrispondente (su disco).

Scegliere una pagina fisica da sostituire; se la pagina fisica identificata ha il bit dirty = 1 (ci sono delle parole modificate), deve essere scritta su disco prima di caricare la nuova pagina nella memoria principale.

Iniziare il trasferimento della pagina da disco a memoria principale.

Aggiornare la traduzione della pagina virtuale nella pagina fisica all'interno dalla PT e reset del bit diry, set del bit di validità e di reference.

A.A. 2023-2024 34/53 http:\\borghese.di.unimi.it\





## Possibili situazioni in Cache, PT e TLB



| TLB  | Page<br>table | Cache | Possible? If so, under what circumstance?                                         |
|------|---------------|-------|-----------------------------------------------------------------------------------|
| Hit  | Hit           | Miss  | Possible, although the page table is never really checked if TLB hits.            |
| Miss | Hit           | Hit   | TLB misses, but entry found in page table; after retry, data is found in cache.   |
| Miss | Hit           | Miss  | TLB misses, but entry found in page table; after retry, data misses in cache.     |
| Miss | Miss          | Miss  | TLB misses and is followed by a page fault; after retry, data must miss in cache. |
| Hit  | Miss          | Miss  | Impossible: cannot have a translation in TLB if page is not present in memory.    |
| Hit  | Miss          | Hit   | Impossible: cannot have a translation in TLB if page is not present in memory.    |
| Miss | Miss          | Hit   | Impossible: data cannot be allowed in cache if the page is not in memory.         |

A.A. 2023-2024 36/53 http:\\borghese.di.unimi.it\



## Implementazione della protezione della MM



Page Table page pointers are stored inside the OS space. They can be accessed only if OS is in Kernel mode.

We have to avoid that a user process (a virus) changes its own PT, mapping one of its virtual pages into a physical page of a different process. When accessing a physical page, a program should own that page.

This can be obtained by a personalized PT that can be addressed and modified by writing only by the OS. Only reading the PT is granted to any user process.

The write access bit can be used to protect the page from writing.

A process cannot read a page of another process because the mapping is contained inside its PT that has been written and is modified by the OS.

If a process wants to share a page with another process, the two virtual pages should point to the same physical page.

All these mechanisms are mediated by the OS in kernel mode.

http:\\borghese.di.unimi.it\ A.A. 2023-2024



## **Changing process**



SO changes running process from P1 to P2 (context switch)

- Save the state of the CPU (registers, PC)
- Change the address of the Page Table from that of P1 to that of P2 (kernel mode operation)
- **Invalidate the TLB** (that is HW, to avoid to work on the physical pages of P1).

Upon restart of P1, we will have a lot of cold-start misses in the TLB.

NB We have 1 TLB but many PTs.

Per evitare lo svuotamento del TLB inutilmente:

- Process identifier or task identifier (field on 8 bits Intrinsity FASTMath MMU) added to the TAG field.
- Check for a hit is carried out on both the TAG and the process identifier fields (both in caches and in TLB).

Elemento di debolezza per gli attacchi informatici: rimane traccia dell'esecuzione nelle pagine fisiche (che vengono invalidate e non cancellate) e nelle line di cache (che vengono invalidate ma non cancellate)

38/53 2023-2024 http:\\borghese.di.unimi.it\



## Sommario



Le virtual machine

La memoria virtuale

La traduzione degli indirizzi

A.A. 2023-2024 39/53 http:\\borghese.di.unimi.it\



## Le istruzioni in linguaggio macchina



- Linguaggio di programmazione direttamente comprensibile dalla macchina
  - Le parole di memoria sono interpretate come *istruzioni*
  - Vocabolario è l'insieme delle istruzioni (instruction set)

Programma in linguaggio ad alto livello (C)

Programma in linguaggio macchina



011100010101010 000110101000111 000010000010000 001000100010000

A. 2023-2024 40/53

http:\\borghese.di.unimi.it\







## Dal codice sorgente al codice Assembler



Compilatore: dal codice sorgente al codice Assembler.

Assemblatore: adatta il codice Assembler all'ISA (adattamento al «dialetto») dell'Architettura.

Assmblatore: codigica in linguaggio macchina (creazione del file oggetto), codifica binaria del codice.

Compilatore ed assemblatore possono essere uniti in un un'unica fase.

A.A. 2023-2024 43/53



## L'assemblatore: i file oggetto



http:\\borghese.di.unimi.it

#### L'assemblaggio produce:

- · L'insieme delle istruzioni in linguaggio macchina
- I dati statici
- Le informazioni necessarie per inserire le istruzioni in memoria correttamente.
- Le informazioni necessarie per inserire I dati in memoria

#### Un file oggetto è così costituito:

- Header. Posizione e dimensione dei vari pezzi che costituiscono il file oggetto.
- Segmento testo. Contiene le istruzioni.
- Segmento dati statici. Contiene i dati relativi al file oggetto.
- Informazione di rilocazione. Identifica istruzioni, etichette e dati che dipendono dalla posizione del programma in memoria.
- La **tabella dei simboli.** Contiene le etichette che non sono definite (ad esempio riferimenti esterni, di altri moduli oggetto o librerie).
- Informazioni di debug. Consente di associare ai costrutti Assembler ai costrutti del linguaggio ad alto livello (la traduzione non è uno a uno).

A.A. 2023-2024 44/53 http:\\borghese.di.unimi.it\



## Il linker (link editor)



Consente di fare ricompilare ed assemblare solo i moduli che vengono modificati (Rebuild).

Il linker è costituito da 3 step:

- Disporre in memoria i moduli di codice ed i dati (statici).
- Identificare gli indirizzi dei dati e delle etichette delle istruzioni di salto.
- 3. Risolvere le etichette interne ai moduli ed esterne (trovare la corrispondenza). Questo passo è equivalente a compilare una tabella di rilocazione.

Nei passi 2 e 3, il linker utilizza le informazioni di rilocazione degli oggetti e le tabelle dei simboli.

Quali sono i simboli da risolvere (da trasformare in indirizzi di memoria)?

- Etichette di salto (branch o jump)
- Indirizzo dei dati (e.g. A[0]).

Dopo avere risolto tutte le etichette (sostituito le corrispondenze), occorre trovare gli indirizzi assoluti associati alle etichette. Vengono cioè rilocati (riposizionati) gli oggetti al loro indirizzo finale.

Viene creato il file eseguibile. Ha lo stesso formato del file oggetto ma non ha riferimenti non risolti e gli indirizzi sono assoluti (virtuali -> rilocazione).

http:\\borghese.di.unimi.it\ A.A. 2023-2024



## **Esempio**



Analizziamo due procedure:

Procedure A Procedure B

lw \$a0, **8000(\$gp)** sw \$a1, 8000(\$gp) jal Proc B jal Proc A add \$t2, \$t1, \$t0

NB In questo caso \$gp punta a metà del primo segmento di 64Kbyte dell'area dati (256 Mbyte + 32 Kbyte)

La tabella dei simboli contiene le etichette in grassetto.

**Header Procedure A Header Procedure B** Text Size  $100_{\text{bex}}$  (=256byte) Text Size 200<sub>bex</sub> (=512byte) Data Size  $20_{hex}$  (=32 byte) Data Size  $30_{hex}$  (=48byte) 46/53 2023-2024 http:\\borghese.di.unimi.it\

| 1000 m                |           |                                       |        |                   | 2000        |
|-----------------------|-----------|---------------------------------------|--------|-------------------|-------------|
| Object file<br>header |           |                                       |        | Oggetto proc A    | - Ab        |
| nouder                |           |                                       |        | 88 1              |             |
|                       | Name      | Procedure A                           |        |                   |             |
|                       | Text Size | $100_{\text{hex}} (=256 \text{byte})$ |        |                   |             |
|                       | Data Size | 20 <sub>hex</sub> (=32 byte)          |        |                   |             |
| Text Segment          | Address   | Instruction                           |        |                   |             |
|                       | 0         | lw \$a0, <b>X</b> ∧                   |        |                   |             |
|                       | 4         | jal <b>Proc_B</b> A                   |        |                   |             |
|                       |           | add \$t2, \$t1, \$t0                  |        |                   |             |
|                       |           | / /                                   |        |                   |             |
| Data Segment          | 0         | (Xy)                                  |        |                   |             |
|                       |           | / / \ \                               |        |                   |             |
| Relocation            | Address   | / Instruction type                    | Depend |                   |             |
| info                  | /         | ′ /                                   | ency   |                   |             |
|                       | 0 /       | / lw                                  | \      |                   |             |
|                       | 4         | jal                                   | Proc_B |                   |             |
| Symbol table          | Label /   | / Address                             |        |                   |             |
|                       | x 🗸       |                                       |        |                   |             |
|                       | Proc_B    |                                       |        |                   |             |
| A.A. 2023-2024        |           | 4                                     | 47/53  | http:\\borghese.d | i.unimi.it\ |





## Il funzionamento del linker



Per prima cosa vengono posizionate nella posizione desiderata le 2 procedure (A sotto e B sopra): copia delle istruzioni e dei dati. Vengono considerate in modo assoluto -> indirizzi virtuali.



A.A. 2023-2024 49/53 http:\\borghese.di.unimi.it\



## Calcoli degli indirizzi testo



#### Segmento testo:

Inizia dopo il segmento riservato al S.O., indirizzo  $0x400\ 000 = 0100\ 0000\ 0000\ 0000\ 0000\ 0000\ binario = 1x\ 2^{22} = 4$  Mbyte.

Procedura A. Inizia subito dopo. Indirizzo 0 della procedura è l'indirizzo 0x400 000.

Procedura B. Inizia dopo la procedura A. Indirizzo 0 della procedura B è:  $0x400\ 000 + 0x100$  (dimensione della procedura A) =  $0x400\ 100$ .

Queste osservazioni consentono di sostituire le etichette di salto a procedura (jal).

NB  $8000_{\rm esa}$  in complemento a  $2 = -32768_{\rm dec}$   $\Rightarrow$  rimanda all'inizio del segmento dati. Analizziamo due procedure:

```
        Procedure A
        Procedure B

        0: Proc_A:
        lw $a0, 8000($gp)
        0: Proc_B:
        sw $a1, 8000($gp)

        4:
        jal Proc_B
        4: jal Proc_A

        8:
        add $t2, $t1, $t0
        ...
```

A.A. 2023-2024 50/53 http:\\borghese.di.unimi.it\



## Risoluzione delle etichette sul codice



$$Text\ size = 100_{hex} + 200_{hex} = 300_{hex}$$

$$Data\ size = 20_{hex} + 30_{hex} = 50_{hex}$$

| Executable file header |           |                               |
|------------------------|-----------|-------------------------------|
|                        | Text Size | 300 <sub>hex</sub> (=768byte) |
|                        | Data Size | 50 <sub>hex</sub> (=82 byte)  |
| Text Segment           | Address   | Instruction                   |
| Proc A                 | 400,000   | lw \$a0, 8000(\$gp)           |
|                        | 400,004   | jal 400,100                   |
|                        | 400,008   | add \$t2, \$t1, \$t0          |
|                        | ***       |                               |
| Proc B                 | 400,100   | sw \$a1, 8000(\$gp)           |
|                        | 400,104   | jal 400,000                   |
|                        |           |                               |

| Proc B         |
|----------------|
| Proc A         |
|                |
| Proc B         |
| Proc A         |
| Riservata S.O. |
|                |

10,000,050<sub>16</sub> 10,000,020<sub>16</sub> 10,000,000<sub>16</sub> 400,300<sub>16</sub>

400,300<sub>16</sub> 400,100<sub>16</sub> 400,000<sub>16</sub>

A.A. 2023-2024

A.A. 2023-2024

51/53

http:\\borghese.di.unimi.it\



| $p = 10,008,000_{hex} = 256Mbyte + 32Kbyte$          |
|------------------------------------------------------|
| $p = 0001\ 0000\ 0000\ 0000\ 0100\ 0000\ 0000\ 0000$ |
| Il valore di \$gp è comune a tutti i moduli.         |

| Executable file header |             |                               |
|------------------------|-------------|-------------------------------|
|                        | Text Size   | 300 <sub>hex</sub> (=768byte) |
|                        | Data Size   | 50 <sub>hex</sub> (=80 byte)  |
| Text Segment           | Address     | Instruction                   |
| Proc A                 | 400,000H    | lw \$a0, 8000( <b>\$gp</b> )  |
|                        | 400,004H    | jal 400,100                   |
|                        | 400,008H    | add \$t2, \$t1, \$t0          |
|                        |             |                               |
| Proc B                 | 400,100H    | sw \$a1, 8020( <b>\$gp</b> )  |
|                        | 400,104H    | jal 400,000                   |
|                        |             |                               |
| Data Segment           | Address     |                               |
|                        | 10,000,000H | (X)                           |
|                        | 10,000,020H | (Y)                           |

| Proc B Proc A                | 10,000,050 <sub>16</sub> 10,000,020 <sub>16</sub> 10,000,000 <sub>16</sub> |
|------------------------------|----------------------------------------------------------------------------|
| Proc B Proc A Riservata S.O. | $400,300_{16}  400,100_{16}  400,000_{16}$                                 |

52/53



## Sommario



Le virtual machine

La memoria virtuale

La traduzione degli indirizzi

A.A. 2023-2024 53/53 http:\\borghese.di.unimi.it\