



# Carry look-ahead Adder & Firmware Multiplier

Prof. Alberto Borghese Dipartimento di Scienze dell'Informazione

borghese@dsi.unimi.it

Università degli Studi di Milano

A.A. 2004-2005

1/40

http:\\homes.dsi.unimi.it\~borghese



### **Sommario**



#### Problemi dei sommatori

Sommatori ad anticipazione di riporto

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005

2/40

 $http: \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} \hspace{-0.05cm} http: \hspace{-0.05cm} \hspace{-0.05c$ 













## I problemi del full-adder



Il full adder con propagazione del riporto è lento:

- Il riporto si propaga sequenzialmente caratteristica dell'algoritmo di calcolo
- la commutazione dei circuiti non è istantanea (tempo di commutazione)

caratteristica fisica dei dispositvi

 Soluzioni modificare l'algortimo modificare i dispositivi

A.A. 2004-2005

8/40





Problemi dei sommatori

Sommatori ad anticipazione di riporto

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005

9/40

http:\\homes.dsi.unimi.it\~borghese



### Prima possibilità: forma tabellare



Riscrivo le equazioni del riporto in modo non sequenziale. Come?

$$\mathbf{r_0} = \mathbf{a_0} \mathbf{b_0} + (\mathbf{a_0} + \mathbf{b_0}) \mathbf{r_0} = \mathbf{a_0} \mathbf{b_0} + \mathbf{a_0} \mathbf{r_0} + \mathbf{b_0} \mathbf{r_0}$$

$$\begin{split} \textbf{r}_1 &= a_1 b_1 + (a_1 + b_1) \textbf{r}_0 = \\ &a_1 b_1 + a_1 (a_0 b_0 + a_0 r_0 + b_0 r_0) + \\ &+ b_1 (a_0 b_0 + a_0 r_0 + b_0 r_0) = \\ & \dots \end{split}$$

$$\begin{aligned} & \textbf{r}_2 = a_2 b_2 + (a_2 \textbf{r}_1 + b_2) \textbf{r}_1 = \\ & a_2 b_2 + a_2 (a_1 b_1 + a_1 \textbf{r}_1 + ..... \end{aligned}$$

Molto complesso per n grande.

$$s = (a \oplus b) \oplus r_{in}$$
$$r_{out} = ab + (a \oplus b) r_{in}$$



Riporto indipendente da  $r_{in}$  Riporto funzione di  $r_{in}$ 

$$r_{out} = f(a_0, b_0, a_1, b_1, a_2, b_2, a_3, b_3,...)$$

Funzione a 2 \* N ingressi ed 1 uscita.

In questo caso posso sfruttare l'uguaglianza:  $\frac{r_{out}}{a} = ab + (a \oplus b) r_{in} = ab + (a + b) r_{in}$ 

A.A. 2004-2005

10/40



## Carry look-ahead (anticipazione di riporto)



Approccio strutturato per diminuire la latenza della somma.

$$\mathbf{r}_{out} = a\mathbf{b} + (a \oplus \mathbf{b}) \mathbf{r}_{in}$$

#### Analisi del singolo stadio.

Quando si genera un riporto in uscita?

Quando ho almeno due 1, in ingresso; cioè tra r<sub>in</sub>, a e b.



#### 11000 riporto

$$1101 +$$

10001

http:\\homes.dsi.unimi.it\~borghese



A.A. 2004-2005

## Propagazione e generazione



Ho riporto quando ho almeno due 1, in ingresso; cioè tra  $r_{in}$ , a e b.

#### Osservazioni:

- Viene generato un riporto dallo stadio i, qualsiasi sia il riporto in ingresso se  $a = b = 1 \Rightarrow g_i = a_i b_i$ .
- Viene generato un riporto allo stadio i, se il riporto in ingresso è = 1 ed una delle due variabili in ingresso è = 1  $=> p_i = (a_i \oplus b_i)r_i^{in}$ .(pi propaga il segnale di riporto  $r_i^{in}$ ).



Quando sia la condizione 1) che la condizione 2) è verificata? Cosa succede se entrambe le condizioni sono verificate?

A.A. 2004-2005



### **Esempio**



Sono interessato ad  $r_4^{\text{out}}$ . Supponiamo  $r_0^{\text{in}} = 0$ .

$$r_5^{\text{in}} = r_4^{\text{out}} = 0$$
  $r_5^{\text{in}} = r_4^{\text{out}} = 1$   $r_5^{\text{in}} = r_4^{\text{out}} = 1$ 

Per propagazione Per generazione

$$p_4 = (a_4 \oplus b_4) r_4^{\text{in}}.$$
  $g_4 = a_4 b_4$ 

A.A. 2004-2005 13/40 http:\\nomes.dsi.unimi.it\~borghesc



 $\mathbf{r}_{i}^{\text{out}} = a\mathbf{b} + (a \oplus \mathbf{b}) \mathbf{r}_{i}^{\text{in}}$ 

## Sviluppo della funzione logica riporto



$$\begin{split} & \mathbf{r_i^{out}} = g_i + p_i \ \mathbf{r_i^{in}} \\ & \mathbf{r_0} = g_0 + p_0 \mathbf{r_0} \\ & \mathbf{r_1} = g_1 + p_1 \mathbf{r_0} = g_1 + p_1 g_0 + p_1 p_0 \mathbf{r_0} \\ & \mathbf{r_2} = g_2 + p_2 \mathbf{r_1} = g_2 + p_2 (g_1 + p_1 g_0 + p_1 p_0 \mathbf{r_0}) = g_2 + p_2 g_1 + p_2 p_1 g_0 + \\ & \qquad \qquad p_2 p_1 p_0 \mathbf{r_0}. \\ & \mathbf{r_3} = g_3 + p_3 \mathbf{r_2} = g_3 + p_3 (g_2 + p_2 g_1 + p_2 p_1 g_0 + p_2 p_1 p_0 \mathbf{r_0}) = \end{split}$$

 $g_3 + p_3g_2 + p_3p_2g_1 + p_3p_2p_1g_0 + p_3p_2p_1p_0r_0$ .

A.A. 2004-2005

14/40









Problemi dei sommatori

Sommatori ad anticipazione di riporto

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005

17/40

 $http: \\ \ homes.dsi.unimi.it \\ \ \sim borghese$ 



## Approcci tecnologici alla ALU.



Tre approcci tecnologici alla costruzione di una ALU (e di una CPU):

- Approccio hardware programmabile (e.g. PAL). Ad ogni operazione corrisponde un circuito combinatorio specifico.
- Approccio ROM. E' un approccio esaustivo (tabellare). Per ogni funzione, per ogni ingresso viene memorizzata l'uscita. E' utilizzabili per funzioni molto particolari (ad esempio di una variabile). Non molto utilizzato.
- Approccio firmware (firm = stabile), o microprogrammato. Si dispone di circuiti specifici solamente per alcune operazioni elementari (tipicamente addizione e sottrazione). Le operazioni più complesse vengono sintetizzate a partire dall'algoritmo che le implementa.

A.A. 2004-2005

18/40



## Approccio ROM alla ALU



**Input:** 

A n bit
B n bit
SEL k bit
InvertiB: 1 bit
Totale: 2\*n + k + 1 bit

**Output:** 

S n bit
 zero 1 bit
 overflow 1 bit
 Totale: n + 2 bit

Per dati su 32 bit, 5 operazioni:



Capacità della ROM:  $2^{68} = 2.95.. \times 10^{20}$  parole di 34 bit!

A.A. 200 (Capacità della ROM per dati su 4 bit, 5 operazioni:  $2^{12} = 4,098$  parole di 6 bit) iiit\~borghese



## L'approccio firmware



Nell'approccio firmware, viene inserita nella ALU una unità di controllo e dei registri. L'unità di controllo attiva opportunamente le unità aritmetiche ed il trasferimento da/verso i registri. Approccio "controllore-datapath".

Viene inserito un microcalcolatore dentro la ALU.

Il primo microprogramma era presente nell'IBM 360 (1964).



## L'approccio firmware vs hardware



La soluzione HW è più veloce ma più costosa per numero di porte e complessità dei circuiti.

La soluzione firmware risolve l'operazione complessa mediante una sequenza di operazioni semplici. E' meno veloce, ma più flessibile e, potenzialmente, adatta ad inserire nuove procedure.

La soluzione HW è percorsa per le operazioni frequenti: la velocizzazione di operazioni complesse che vengono utilizzate raramente non aumenta significativamente le prestazioni (legge di Amdahl).

A.A. 2004-2005

21/40

 $http: \hspace{-0.05cm} \hspace{-$ 



#### **Sommario**



Problemi dei sommatori

Sommatori ad anticipazione di riporto

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005

22/40



## Shift (scalamento)



Dato A su 32 bit:  $a_j = a_{j-k}$  k shift amount (>, =, < 0).

Effettuato al di fuori delle operazioni selezionate dal Mux della ALU, da un circuito denominato *Barrel shifter*.

Tempo comparabile con quello della somma.

Operazioni codificate in modo specifico nell'ISA.



Il bit  $a_0$  si "perde". Il bit  $a_n = 0$ .

A.A. 2004-2005 23/40 http:\\homes.dsi.unimi.it\~borghese



## La moltiplicazione ed il firmware



Il razionale degli algoritmi firmware della moltiplicazione è il seguente.

Si analizzano sequenzialmente i bit del moltiplicatore e:

- 1) Si mette 0 nella posizione opportuna (se il bit analizzato del moltiplicatore = 0).
- Si mette una copia del moltiplicando nella posizione opportuna (se il bit analizzato del moltiplicatore è = 1).

Moltiplicatore

1 1 0 1 1 x 1 0 1 =

1 1 0 1 1 + 0 0 0 0 0 -

11011--

Prodotto 1 0 0 0 0 1 1 1

A.A. 2004-2005

24/40















## Esempio



| Iterazione | Passo                             | Moltiplicatore | Moltiplicando | Prodotto  |
|------------|-----------------------------------|----------------|---------------|-----------|
| 0          | Valori iniziali                   | 0010           | 0000 0010     | 0000 0000 |
| 1          | 1a: 1 ⇒ Prod = Prod + Mcando      | 0011           | 0000 0010     | 0000 0010 |
|            | 2: Scala a sinistra Moltiplicando | 0011           | 0000 0100     | 0000 0010 |
|            | 3: Scala a destra Moltiplicatore  | 0000           | 0000 0100     | 0000 0110 |
| 2          | 1a: 1 ⇒ Prod = Prod + Mcando      | 0001           | 0000 1000     | 0000 0110 |
|            | 2: Scala a sinistra Moltiplicando | 0001           | 0000 1000     | 0000 0110 |
|            | 3: Scala a destra Moltiplicatore  | 0000           | 0000 1000     | 0000 0110 |
| 3          | 1: 0 ⇒ Nessuna operazione         | 0000           | 0000 1000     | 0000 0110 |
|            | 2: Scala a sinistra Moltiplicando | 0000           | 0001 0000     | 0000 0110 |
|            | 3: Scala a destra Moltiplicatore  | 0000           | 0001 0000     | 0000 0110 |
| 4          | 1: 0 ⇒ Nessuna operazione         | 0000           | 0001 0000     | 0000 0110 |
|            | 2: Scala a sinistra Moltiplicando | 0000           | 0010 0000     | 0000 0110 |
|            | 3: Scala a destra Moltiplicatore  | 0000           | 0010 0000     | 0000 0110 |
|            |                                   |                |               |           |

A.A. 2004-2005 31/40 http:\\homes.dsi.unimi.it\~borghese











Problemi dei sommatori

Sommatori ad anticipazione di riporto

Addizionatori modulari

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005 35/40 http:\\homes.dsi.unimi.it\\~borghese





#### Esempio di esecuzione dell'algoritmo ottimizzato Valori iniziali 0010 0000 0011 1 1a: 1 ⇒ Prod = Prod + Mcando 0010 0010 0011 2: Scala a destra Prodotto 0010 0001 0000 2 1a: 1 ⇒ Prod = Prod + Mcando 0010 0011 0001 2: Scala a destra Prodotto 0010 0001 1000 1: 0 ⇒ Nessuna operazione 0010 0001 1000 2: Scala a destra Prodotto 0010 0000 1100 4 1: 0 ⇒ Nessuna operazione 0010 0000 1100 2: Scala a destra Prodotto 0010 0000 0110 Il moltiplicando è allineato (e sommato) ai bit più significativi del prodotto.

A.A. 2004-2005







Problemi dei sommatori

Sommatori ad anticipazione di riporto

Addizionatori modulari

Il firmware

Moltiplicatori firmware

Ottimizzazione dei moltiplicatori firmware

A.A. 2004-2005

40/40

 $http: \hspace{-0.05cm} \hspace{-$