



## ISA e linguaggio assembler

Prof. Alberto Borghese Dipartimento di Informatica

borghese@di.unimi.it

Università degli Studi di Milano Riferimento sul Patterson: capitolo 4.2, 4.4, D1, D2.

A.A. 2023-2024

1/58

http:\\borghese.di.unimi.it\



#### Sommario



- ISA
- Istruzioni aritmetico-logiche
- Istruzioni di accesso alla memoria
- Istruzioni di salto

A.A. 2023-2024

2/58







## Definizione di un'ISA (Instruction Set Architecture)



ISA: definisce le istruzioni messe a disposizione dalla macchina (in linguaggio macchina).

IS = Instruction Set = Insieme delle istruzioni. Non solo elenco ma anche:

Definizione del funzionamento: ISA è interfaccia verso i linguaggi ad alto livello.

- Tipologia di istruzioni.
- Meccanismo di funzionamento delle istruzioni.

Definizione del **formato**: codifica delle istruzioni (ISA è interfaccia verso l'HW).

- Formato delle istruzioni.
- Suddivisione in gruppi omogenei dei bit che costituiscono l'istruzione.
- Formato dei dati.



Le istruzioni devono contenere tutte le informazioni necessarie ad eseguire il ciclo di esecuzione dell'istruzione: registri, comandi, ....

A.A. 2023-2024

5/58

http:\\borghese.di.unimi.it\



#### ISA - IPR



**ARM** (**Advanced RISC Machine** and originally **Acorn RISC Machine**) è una famiglia di architetture di istruzioni.

Acorn, poi diventata RISC Limited, vende le licenze sull' ISA a società che poi realizzano i loro processori RISC. Tra i più diffusi i processori Cortex, alcuni realizzati come SoC – Systems on Chip), FPGA che comprendono memorie, interfacce, radio, ecc..

IPR – Intellectual Property Rights (proprietà intellettuale).

Nel 2019. RISC concede la licenza per lo sviluppo con pagamento delle royalities solo a partire dal primo prototipo delle CPU.

Non solo insieme di istruzioni elementari messe a disposizione dalla macchina (in linguaggio macchina).

L'architettura delle istruzioni, specifica come devono essere strutturate le istruzioni in modo tale che siano comprensibili alla macchina (in linguaggio macchina).

A.A. 2023-2024

6/58





## Tipi di istruzioni



Il linguaggio macchina (di una calcolatore) è costituito da un insieme di istruzioni che possono essere eseguite dalla macchina.

Le istruzioni comprese nel linguaggio macchina di ogni calcolatore possono essere classificate nelle seguenti quattro categorie:

- Istruzioni aritmetico-logiche;
- Istruzioni di trasferimento da/verso la memoria (load/store);
- Istruzioni di salto condizionato e non condizionato per il controllo del flusso di programma;
- Istruzioni di trasferimento in ingresso/uscita (I/O).
- Le istruzioni e la loro codifica costituiscono l'ISA di un calcolatore.

A.A. 2023-2024 8/58 http:\\borghese.di.unimi.it\



## Tipi di istruzioni





A.A. 2023-2024

## Le istruzioni in linguaggio macchina

9/58



http:\\borghese.di.unimi.it\

- · Linguaggio di programmazione direttamente comprensibile dalla macchina
  - Le parole di memoria sono interpretate come istruzioni
    - Vocabolario è l'insieme delle istruzioni (instruction set)

Codice in linguaggio ad alto livello (C)

Codice in linguaggio macchina



A.A. 2023-2024 10/58 http:\\borghese.di.unimi.it\



#### Linguaggio Assembler



- Le istruzioni assembler sono una rappresentazione simbolica del linguaggio macchina comprensibile dall'HW.
- · Rappresentazione simbolica del linguaggio macchina
  - Più comprensibile del linguaggio macchina in quanto utilizza simboli invece che sequenze di bit
- Rispetto ai linguaggi ad alto livello, l'assembler fornisce limitate forme di controllo del flusso e non prevede articolate strutture dati

Codice in linguaggio ad alto livello (C)

Linguaggio usato come linguaggio target nella fase di compilazione di un programma scritto in un linguaggio ad alto livello (es: C, Pascal,ecc.)

Codice Assembler

 Vero e proprio linguaggio di programmazione che fornisce la visibilità diretta sull'hardware. add \$t0,\$s0,\$s1 add \$s2,\$s2,\$t0 muli \$t1,\$s4,4 add \$t2,\$s5,\$t1 lw \$s3,0(\$t2)

= m[a]

Codice in linguaggio macchina

A.A. 2023-2024

11/58



# Assembler come linguaggio di programmazione



- Principali *svantaggi* della programmazione in linguaggio assembler:
  - Mancanza di portabilità dei programmi su macchine diverse
  - Maggiore lunghezza, difficoltà di comprensione, facilità d'errore rispetto ai programmi scritti in un linguaggio ad alto livello
- Principali vantaggi della programmazione in linguaggio assembler:
  - Ottimizzazione delle prestazioni.
  - Massimo sfruttamento delle potenzialità dell'hardware sottostante.
- Le strutture di controllo hanno forme limitate
- Non esistono tipi di dati all'infuori di interi, virgola mobile e caratteri.
- La gestione delle strutture dati e delle chiamate a procedura deve essere fatta in modo esplicito dal programmatore.

A.A. 2023-2024

12/58

 $http: \hspace{-0.05cm} \ \ | borghese.di.unimi.it \rangle$ 



## Assembler come linguaggio di programmazione



Alcune applicazioni richiedono un approccio ibrido nel quale le parti più critiche
del programma sono scritte in assembly (per massimizzare le prestazioni) e le altre
parti sono scritte in un linguaggio ad alto livello (le prestazioni dipendono dalle
capacità di ottimizzazione del compilatore).

Esempio: Sistemi embedded o dedicati

Sistemi "automatici" di traduzione da linguaggio ad alto livello (linguaggio C) ad Assembly e codice binario ed implementazione circuitale (e.g. sistemi di sviluppo per FPGA).

A.A. 2023-2024 13/58 http:\\borghese.di.unimi.it\



## I registri



- Un registro è un insieme di celle di memora che vengono lette / scritte in parallelo.
- I registri sono associati alle variabili di un programma dal compilatore. Contengono i dati.
- Un processore possiede un numero limitato di registri: ad esempio il processore MIPS possiede 32 registri composti da 32-bit (word), register file.
- I registri possono essere direttamente indirizzati mediante il loro numero progressivo (0, ..., 31) preceduto da \$: ad es.
   \$0, \$1, ..., \$31
- Per convenzione di utilizzo, sono stati introdotti nomi simbolici significativi. Sono preceduti da \$, ad esempio:

\$s0,\$s1,...,\$s7(\$s8) Per indicare variabili in C

\$t0, \$t1, ... \$t9 Per indicare variabili temporanee

A 2023-2024 14/58 http://borghese.di.unimi.it



A.A. 2023-2024

## I registri del register file



http:\\borghese.di.unimi.it\

| Nome                                | Numero | Utilizzo                           |
|-------------------------------------|--------|------------------------------------|
| \$zero                              | 0      | costante zero                      |
| \$at                                | 1      | riservato per l'assemblatore       |
| \$v0-\$v1                           | 2-3    | valori di ritorno di una procedura |
| \$a0-\$a3                           | 4-7    | argomenti di una procedura         |
| \$ <del>1</del> 0-\$ <del>1</del> 7 | 8-15   | registri temporanei (non salvati)  |
| \$s0-\$s7                           | 16-23  | registri salvati                   |
| \$†8-\$†9                           | 24-25  | registri temporanei (non salvati)  |
| \$k0-\$k1                           | 26-27  | gestione delle eccezioni           |
| \$gp                                | 28     | puntatore alla global area (dati)  |
| \$sp                                | 29     | stack pointer                      |
| \$s8                                | 30     | registro salvato (fp)              |
| \$ra                                | 31     | indirizzo di ritorno               |

15/58

I registri per le operazioni floating point

• Esistono 32 registri utilizzati per l'esecuzione delle istruzioni.

• Esistono 32 registri per le operazioni floating point (virgola mobile) indicati come

\$\( \frac{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmathrm{\pmath



# Linguaggio C: somma dei primi 100 numeri al quadrato



```
main()
{
    int i;
    int sum = 0;
    for (i = 0; i <= 100; i = i + 1)
        sum = sum + i*i;
    printf("La somma da 0 a 100 è
%d\n", sum);
}</pre>
```

# Linguaggio Assembler: somma dei primi 100 numeri al quadrato main ()



```
int i:
                                                                 int sum = 0;
                                                                 for (i = 0: i \le 100: i = i + 1)
.text
                                                                          sum = sum + i*i;
.align 2
                                                                 printf("La somma da 0 a 100 è
.globl main
main:
           add $t6, $zero, $zero
                                          // $t6 = 0 ind ciclo
           add $s0, $zero, $zero
                                          // $s0 variabile da aggiornare
           add $s1, $a0, $zero
                                          // $s1 Indice di fine ciclo, $sa proviene dall'esterno
                                          // termine ciclo quando $t6 = $s1
loop:
           beq $t6, $s1, exit
           mult $t4, $t6, $t6
                                          // $t4 = indice*indice
           addu $s0, $s0, $t4
                                          // sommo $t4 a $s0 – $s0 è risultato parziale
           addu $t6, $t6, 1
                                          // incremento ind ciclo
                                          // vai all'inizio del ciclo
           j loop
exit:
                                                18/58
                                                                                    http:\\borghese.di.unimi.it\
A.A. 2023-2024
```



#### **Sommario**



- ISA
- Istruzioni aritmetico-logiche
- Istruzioni di accesso alla memoria
- Istruzioni di salto

A.A. 2023-2024 19/58 http://borghese.di.unimi.it/



## Tipi di istruzioni



- Le istruzioni comprese nel linguaggio macchina di ogni calcolatore possono essere classificate nelle seguenti quattro categorie:
  - Istruzioni aritmetico-logiche;
  - Istruzioni di trasferimento da/verso la memoria (load/store);
  - Istruzioni di salto condizionato e non condizionato per il controllo del flusso di programma;
  - Istruzioni di trasferimento in ingresso/uscita (I/O).

A 2023-2024 20/58 http://borghese.di.unimi.it/



#### Istruzioni aritmetico-logiche



- In MIPS, un'istruzione aritmetico-logica possiede in generale tre operandi: i due registri contenenti i valori da elaborare (registri sorgente) e il registro contenente il risultato (registro destinazione).
- L'ordine degli operandi è fisso: prima il registro contenente il risultato dell'operazione e poi i due operandi.

OPCODE DEST, SORG1, SORG2

```
OPCODE rd, rs, rt
rd = registro destinazione (DEST)
rs = registro source (SORG1)
rt = registro target (SORG2)
```

• La codifica prevede il codice operativo e tre campi relativi ai tre operandi:

Le operazioni vengono eseguite esclusivamente su dati presenti nella CPU, non su dati residenti nella memoria.

A.A. 2023-2024 21/58 http:\\borghese.di.unimi.it\



#### Esempi: istruzioni add e sub



Codice C:

Codice assembler MIPS:

add \$s6, \$s7, \$s8

mette la somma del contenuto di rs e rt in rd:

add rd, rs, rt # rd  $\leftarrow$  rs + rt add \$s6, \$s7, \$s8 # \$s6  $\leftarrow$  \$s7 + \$s8

Nella traduzione da linguaggio ad alto livello a linguaggio assembler, le variabili sono associate ai registri dal compilatore

sub serve per sottrarre il contenuto di due registri sorgente rs e rt:

sub rd rs rt

e mettere la differenza del contenuto di rs e rt in rd

sub rd, rs, rt # rd  $\leftarrow$  rs - rt sub \$s6, \$s7, \$s8 # \$s6  $\leftarrow$  \$s7 - \$s8

A.A. 2023-2024 22/58 http:\\borghese.di.unimi.it\



#### Istruzioni aritmetico-logiche in sequenza



Il fatto che ogni istruzione aritmetica ha tre operandi sempre nella stessa posizione consente di semplificare l'hw, ma complica alcune cose...

Codice C: 
$$Z = A - (B + C + D); =>$$
  
 $E = B + C + D; Z = A - E;$ 

Suppongo che le variabili siano contenute nei seguenti registri:

$$A -> \$s0$$
  $B -> \$s1$   $C -> \$s2$   $D -> \$s3$   $Z -> \$s5$ 

Occcorre spezzare la catena di operazioni in tante operazioni su 2 operandi. Codice MIPS:

```
add $t0, $s1, $s2
add $t1, $t0, $s3
sub $s5, $s0, $t1
```

A.A. 2023-2024

23/58

http:\\borghese.di.unimi.it\



## Istruzioni aritmetico-logiche



- Operazioni con un numero di operandi maggiore di tre possono essere effettuate scomponendole in operazioni più semplici.
- Ad esempio, per eseguire la somma e sottrazione delle variabili A... D nella variabile Z servono tre istruzioni che eseguono le operazioni in sequenza da sinistra a destra:

Codice C: Z = A + B - C + D;

Suppongo che le variabili siano contenute nei seguenti registri:

$$A \rightarrow \$s0$$
  $B \rightarrow \$s1$   $C \rightarrow \$s2$   $D \rightarrow \$s3$   $Z \rightarrow \$s5$ 

A A 2023 2024

24/58



#### Implementazione alternativa



- Operazioni con un numero di operandi maggiore di tre possono essere effettuate scomponendole in operazioni più semplici.
- Ad esempio, per eseguire la somma e sottrazione delle variabili A.. D nella variabile Z servono tre istruzioni:

Codice C:  $\mathbf{Z} = \mathbf{A} + \mathbf{B} - \mathbf{C} + \mathbf{D}$ ;

Può essere riscritta con il seguente codice C:  $\mathbf{Z} = (\mathbf{A} + \mathbf{B}) - (\mathbf{C} - \mathbf{D})$ ; Suppongo che le variabili siano contenute nei seguenti registri:

A -> \$s0 B -> \$s1 C -> \$s2 D -> \$s3 Z -> \$s5

Codice MIPS: add \$t0, \$s0, \$s1 add \$t0, \$s0, \$s1

sub \$t1, \$s2, \$s3 sub \$t1, \$t0, \$s2

sub \$s5, \$t0, \$t1 add \$s5, \$t1, \$s3

Sono implementazioni equivalenti. Quale implementazione è la migliore? Sceglierà il compilatore il quale cerca di massimizzare la parallelizzazione del codice.

A.A. 2023-2024 25/58 http:\\borghese.di.unimi.it\



#### add: varianti



- add \$s0, \$s1, \$s2 #add: \$s0 = \$s1+\$s2
- addi \$s1, \$s2, 100 #add immediate: \$s1 = \$s2+100
  - Somma una costante: il valore del secondo operando è presente nell'istruzione come costante e sommata estesa in segno.

rt ← rs + costante

- - Somma una costante ed evita overflow.
- addu \$s0, \$s1, \$s2 #add unsigned: \$s0 = \$s1+\$s2
  - Evita overflow: la somma viene eseguita considerando gli addendi sempre positivi. Il bit più significativo è parte del numero e non è bit di segno.

Non esiste un'istruzione di subi. Perchè?

A.A. 2023-2024 26/58 http:\\borghese.di.unimi.it\



#### Sottrazione immediata



$$B = A - 100$$
  
 $B = A - (-100)$ 

Come si possono implementare utilizzando solo la somma?

$$B = A + (-100)$$
  
 $B = A + 100$ 

Diventano la somma del reciproco.

addi \$s1, \$s2, -20 #add immediate: \$s1 = \$s2 - 20

A.A. 2023-2024 27/58 http:\\borghese.di.unimi.it\



## Moltiplicazione



- · Due istruzioni:
  - mult rs rt

mult \$s0, \$s1

- multu rs rt

multu \$s0, \$s1

# unsigned

- Il registro destinazione è implicito. Il risultato della moltiplicazione viene posto sempre in due registri dedicati di una parola (special purpose) denominati Hi (High order word) e Lo (Low order word)
- La moltiplicazione di due numeri rappresentabili con 32 bit può dare come risultato un numero non rappresentabile in 32 bit.



A A 2023 202/

28/5

 $http: \hspace{-0.05cm} \backslash borghese.di.unimi.it \backslash$ 









## Indirizzi nella memoria principale



- La memoria è organizzata in parole di memoria composte da n-bit che possono essere indirizzate come un unicum (tipicamente 1 Byte)
- Ogni parola di memoria è associata ad un indirizzo composto da k-bit.
- I 2<sup>k</sup> indirizzi costituiscono lo *spazio di indirizzamento* del calcolatore. Ad esempio un indirizzo di memoria composto da *32-bit* genera uno spazio di indirizzamento di 2<sup>32</sup> Byte o *4Gbyte*.

A.A. 2023-2024 32/58 http:\\borghese.di.unimi.it\



#### Memoria Principale e parole



- In genere, la dimensione della parola di memoria (1 Byte) non coincide con la dimensione della parola della CPU e dei registri contenuti all'interno della CPU (1 word)
- Supponiamo che a ogni trasferimento tra Memoria Principale e Registri, venga trasferito
  contemporaneamente in parallelo un numero di Byte pari alla dimensione dei registri
  dell'architettura (1 word).
  - ⇒ l'operazione di *load/store* di una parola avviene in un singolo ciclo di clock del bus.
  - => Vengono trasferiti in parallelo 4 Byte
- Le parole hanno quindi generalmente indirizzo in memoria che è multiplo del numero di byte di una parola (32 bit => indirizzi spaziati di 4, 64 bit => indirizzi spaziati di 8).
- Alcuni dati possono essere rappresentati su singolo Byte (e.g. caratteri) o su coppie di Byte (e.g. audio). Può nascere un problema di allineamento dei dati.























#### Indirizzamento della memoria dati



Base + spiazzamento

- Come base può essere utilizzato il registro \$gp
- Offeset positivo / negativo

#### Address\_final = Base\_address + Offset

| Nome                        | Numero | Utilizzo                           |
|-----------------------------|--------|------------------------------------|
| \$zero                      | 0      | costante zero                      |
| \$at                        | 1      | riservato per l'assemblatore       |
| \$v0-\$v1                   | 2-3    | valori di ritorno di una procedura |
| \$a0-\$a3                   | 4-7    | argomenti di una procedura         |
| \$t0-\$t7                   | 8-15   | registri temporanei (non salvati)  |
| \$ <i>s</i> 0-\$ <i>s</i> 7 | 16-23  | registri salvati                   |
| \$†8-\$†9                   | 24-25  | registri temporanei (non salvati)  |
| \$k0-\$k1                   | 26-27  | gestione delle eccezioni           |
| \$gp                        | 28     | puntatore alla global area (dati)  |
| \$sp                        | 29     | stack pointer                      |
| \$ <i>s</i> 8               | 30     | registro salvato (fp)              |
| \$ra                        | 31     | indirizzo di ritorno               |



A volte come base address si considera il registro \$gp (Global Pointer)

http:\\borghese.di.unimi.it\



#### **Istruzione** *load*



 L'istruzione di load trasferisce una copia di un dato/istruzione, contenuto in una specifica locazione di memoria, a un registro della CPU, lasciando inalterata la parola di memoria:

load LOC, reg

# reg ← [LOC]

- La CPU invia l'indirizzo della locazione desiderata alla memoria e richiede un'operazione di lettura del suo contenuto.
- La memoria effettua la lettura del dato memorizzato all'indirizzo specificato e lo invia alla CPU.

A.A. 2023-2024

44/58



#### Implementazione MIPS



Nel MIPS l'istruzione di caricamento di un dato dalla memoria è: "load word" (lw):

- Nel MIPS, l'istruzione lw ha tre argomenti:
  - un registro base (base register) che contiene il valore dell'indirizzo base (base address) da sommare all'offset.
  - una costante o spiazzamento (offset)
  - il registro destinazione in cui caricare la parola letta dalla memoria

```
lw rt, costante(rs) # rt \leftarrow M[ [rs] + costante ]
lw $s1, 100($s2) # $s1 \leftarrow M[ [$s2] + 100 ]
```

Al registro destinazione \$\$1 \, \text{\end{assegnato}} il valore contenuto all'indirizzo della memoria principale: (\$\$\s2 + 100\$). L'indirizzo \, \text{\end{essegnato}} espresso \, \text{in byte}.

Questo spiega la semantica di «registro target» per il registro SORG2

A.A. 2023-2024

45/58

http:\\borghese.di.unimi.it\



#### Istruzione di sw



 L'istruzione di store trasferisce una parola di dato/istruzione da un registro della CPU in una specifica locazione di memoria, sovrascrivendo il contenuto precedente di quella locazione:

store reg, LOC

# [LOC] ← req

- La CPU invia l'indirizzo della locazione di memoria, assieme con i dati che vi devono essere scritti e richiede un'operazione di scrittura.
- La memoria effettua la scrittura dei dati all'indirizzo specificato.

L'istruzione MIPS per la scrittura di un registro in memoria è la sw (store word). Essa possiede argomenti analoghi alla lw

#### Esempio:

```
sw rt, costante(rs) # M[ [rs] + costante ] \leftarrow rt
sw $s1, 100($s2) # M[ [$s2] + 100 ] \leftarrow $s1
```

Alla locazione di memoria di indirizzo (\$s2 + 100) è caricato il contenuto del registro \$s1



## lw & sw: esempio



Elaborazione di dati di un vettore A.

Codice C: 
$$A[12] = h + A[8];$$

- · Si suppone che:
  - la variabile h sia associata al registro \$s2
  - l'indirizzo del primo elemento dell'array (base address) sia contenuto nel registro \$s3 (A[0])

#### Codice MIPS:

```
lw $t0, 32($s3)  # $t0 \leftarrow M[ [$s3] + 32]
add $t0, $s2, $t0  # $t0 \leftarrow $s2 + $t0
sw $t0, 48($s3)  # M[ [$s3] + 48] \leftarrow $t0
```

A.A. 2023-2024 47/58 http:\\borghese.di.unimi.it\



#### Memorizzazione di un vettore



- L'elemento i-esimo di un array di N elementi, si troverà nella locazione
   br + 4 \* i dove:
  - br è il registro base;
  - i è l'indice del vettore (e.g. codice C);
  - il fattore 4 dipende dall'indirizzamento al byte della memoria nel MIPS e si riferisce ad architetture a 32 bit

| Assembler (puntatori) | С    |
|-----------------------|------|
| s3                    | A[0] |
| s3 + 4                | A[1] |
| s3 + 8                | A[2] |
|                       |      |

| A[1] 7 6 5 4<br>A[2] 11 10 9 8 | A[0]   | 3                   | 2                   | 1                   | 0                    |
|--------------------------------|--------|---------------------|---------------------|---------------------|----------------------|
|                                | A[1]   | 7                   | 6                   | 5                   | 4                    |
|                                | A[2]   | 11                  | 10                  | 9                   | 8                    |
|                                |        |                     |                     |                     |                      |
| -NW4NW4AL1                     |        |                     |                     |                     |                      |
| -379437943794(37.4)            |        |                     |                     |                     |                      |
|                                | A[N-1] | 2 <sup>N*4</sup> -1 | 2 <sup>N*4</sup> -2 | 2 <sup>N*4</sup> -3 | 2 <sup>(N-1)*4</sup> |

0x40000 0x40004 0x40008

....

A.A. 2023-2024

48/58



## Frammento di gestione di un vettore



- Sia A un array di N word. Realizziamo l'istruzione C: g = h + A[i]
- · Si suppone che:
  - le variabili g, h, i siano associate rispettivamente ai registri \$s1, \$s2, ed \$s4
  - l'indirizzo del primo elemento dell'array (base address) sia contenuto nel registro \$s3
- · L'elemento i-esimo dell'array si trova nella locazione di memoria di indirizzo (\$s3+ 4\*i)
- Caricamento dell'indirizzo di A[i] nel registro temporaneo \$t1:

```
muli $t1, $s4, 4  # $t1 \leftarrow 4 * i add $t1, $t1, $s3  # $t1 \leftarrow address of A[i]  # that is ($s3 + 4 * i)
```

• Per trasferire A[i] nel registro temporaneo \$t0:

```
lw $t0, 0($t1) # $t0 ← A[i]
```

Per sommare h e A[i] e mettere il risultato in g:

```
add $s1, $s2, $t0 # g = h + A[i]
```

A.A. 2023-2024

49/58

http:\\borghese.di.unimi.it\



#### Vettori: aritmetica dei puntatori



#### Codice C:

Supponiamo che l'indirizzo del primo elemento dell'array A (base address) sia contenuto nel registro \$s3

#### Codice Assembler:

First iteration:

```
lw $t0, 0($s3)  # Carico l'indirizzo dell'elemento 0
# di A (base address) = &A
```

All the other iterations:

Increment of the address of the location of A[i], inside \$s3, by adding the proper offset (here 4 Byte \* 2 elements = 8 Byte, as we supposed a 32 bit architecture)

A.A. 2023-2024 50/58 http:\\borghese.di.unimi.it\



#### Istruzioni aritmetiche vs. load/store



- Le istruzioni aritmetiche leggono il contenuto di due registri (operandi), eseguono una computazione e scrivono il risultato in un terzo registro (destinazione o risultato)
- Zero
  Risultato
  Overflow
- Le operazioni di trasferimento dati leggono e scrivono un solo operando senza effettuare nessuna computazione. Tuttavia utilizzano 2 registri, di cui uno viene utilizzato per costruire l'indirizzo.



 Le operazioni di trasferimento dati sono necessarie per eseguire le istruzioni aritmetiche!! (cf. Roof model)

A.A. 2023-2024

51/58

1 byte

http:\\borghese.di.unimi.it\



#### Sommario



- ISA
- · Istruzioni artmetico-logiche
- · Istruzioni di accesso alla memoria
- Istruzioni di salto

A.A. 2023-2024

52/58



#### Istruzioni di salto in ciclo for



```
Ciclo a condizione iniziale di uscita (può essere eseguito 0 volte)
```

```
// Istruzioni di controllo (i != N \rightarrow (i-N) !=0)
for (i=0; i<N; i++)
{ elem = i*N + j;
                               // Istruzioni aritmetico-logiche
   s = v[elem];
                               // Istruzioni di accesso a memoria
   z[elem] = s;
                               // Istruzioni di accesso a memoria
          0x40000 beq $t0, $s0, esci
                                                   // $s0 conteggio fine ciclo
inizia:
          0x40004 ..
          0x40068 j inizia
                                                    ; torna in ciclo
          0x4006C ...
esci:
```

A.A. 2023-2024 53/58 http:\\borghese.di.unimi.it\





#### Condizioni di minoranza



```
blt $s1, $s0, esci # if (s1 < s0) esci
```

#### blt è una pseudo-istruzione:

- Non fa parte dell'ISA
- E' un'istruzione molto utilizzata
- Una psudo-istruzione equivale a due o più istruzioni dell'ISA

```
slt $t0, $s1, $s0  # if (s1 < s0) t0 = 1 bne $t0, $zero, esci  # if (t0 \neq 0) esci
```

A.A. 2023-2024 55/58 http:\\borghese.di.unimi.it\





