BFi numero 09 anno 3 file 19 di 21

Published in
· 5 years ago
  

============================================================================== 
-------------[ BFi numero 9, anno 3 - 03/11/2000 - file 19 di 21 ]------------ 
============================================================================== 

 
-[ MiSCELLANE0US ]------------------------------------------------------------ 
---[ MEMORY MANAGEMENT NEI PROCESSORI i386 IN PROTECTED MODE 
-----[ Ritz <ritz@freemail.it> 

 
-= LETTERATURA =- 

Molte delle info che trovate in questo tutorial sono state prese dai seguenti 
libri. 

"Volume 3: System Programming Guide", dell'"Intel Architecture Software  
Developer's Manual", scaricabile dal sito della Intel nella sezione developer, 
Order Number 243192. 

Anche i volumi 1 ("Basic Architecture", Order Number 243190) e 2 ("Instruction 
Set Reference Manual", Order Number 243191) di tale manuale possono tornare 
utili. 

Per quanto riguarda le tabelle, invece, esse sono state spudoratamente copiate 
dai testi sopra citati :) . 

-= INTRODUZIONE =- 

Salve a tutti. 

Come penso avrete gia' capito questo tutorial non avra', come sono solito 
fare, uno scopo pratico, bensi' il suo unico proposito e' quello di spiegare 
il funzionamento in protected mode dei processori i386. 

Parlero' delle tavole di descrittori, dei meccanismi di paginazione e 
segmentazione, di exception handling, and so on. Ad ogni modo, in alcuni 
ambiti queste informazioni possono cmq risultare utili, come ad esempio nel 
caso si desideri scendere a ring0 da win9x. 
Nonostante questo, non daro' esempi pratici di come ottenere cio', sia perche' 
cosi' vi divertire un po' a farlo da soli (evabbe' sono bastardo lo so ;) ), 
ma soprattutto perche', visto che questo tutorial e' soprattutto per il RACL 
(http://racl.immagika.org) non mi pare il caso di soffermarmi su sistemi 
della M$. 
Ecco quindi che cerchero' di essere il piu' generale possibile. 

Tanto per fare un esempio per chiarire come alcuni aspetti siano applicabili 
solo in ambienti specifici, se sotto win potete scendere a ring0 semplicemente 
utilizzando metodi quali call gate, int gate e cosi' via perche' gdt, ldt e 
idt (spieghero' tutto sotto) sono modificabili a ring3 (se volete 
sull'asj 1 trovate il relativo tute), in Linux cio' non e' possibile perche' 
essendo quest'ultimo un SO serio e sicuro non mette tali strutture in pagine a 
ring3, ma le protegge da eventuali modifiche. 

Detto questo, iniziamo. 

-= MEMORY MANAGEMENT NELLE ARCHITETTURE i386 =- 

Come tutti probabilmente saprete, lo stato nativo di un i386 e' il protected 
mode. Le principali caratteristiche di tale tipo di memory management sono 2: 
segmentazione e paging. 

PAGING 
^^^^^^ 
Tramite il paging si ha la possiblilta' di eseguire un dato processo 
utilizzando un sistema di "memoria virtuale" in cui le varie parti in cui 
viene diviso il programma (chiamate pagine, che solitamente sono di 4KB) 
vegnono mappate nella memoria fisica solo quando ce n'e' effettivamente 
bisogno. Tale meccanismo puo' essere cmq disattivato. 

Il paging e' controllato da 3 flag nei registri di controllo: 

1- Il bit 31 di CR0 (flag PG). Questo flag e' responsabile dell'utilizzo 
della paginazione e viene settato solitamente dal SO durante 
l'inizializzazione. 
2- Il bit 4 di CR4 (flag PSE, page flag extension). Questo flag serve a 
specificare l'utilizzo di pagine di 4MB o 2 MB (se il flag PAE e' settato). 
Se tale flag e' spento, viene utilizzata per le pagine la classica grandezza 
di 4KB. 
3- Il bit 5 di CR4 (flag PAE, physical address extension). Questo bit permette 
di utilizzare indirizzi fisici di 36bit al posto dei comuni 32bit. Ne parlero' 
piu' avanti. 

Se e' attivata la paginazione, il processore per poter ricavare l'indirizzo 
fisico di memoria partendo da quello lineare deve utilizzare alcune strutture, 
ovvero: 

. Page directory: un array di PDE (page-directory entries) contenute in una  
pagina di 4KB. Una page dir puo' contenere fino a 1024 entry. 
. Page table: un array di PTE (page-table entries) contenute in una pagina di 
4KB. Una page table puo' contenere fino a 1024 entry. NOTA: le page table non 
sono usate per pagine di 4 o 2 MB. 
. Page: la pagina fisica :) . 
. Page-Directory-Pointer Table: un array di entry a 64-bit ognuna delle quali  
punta a una page dir. Questa struttura non e' usata se si sta utilizzando il 
phys. addr. extension. 

Senza spiegare tutte le situazioni in cui si puo' capitare faccio di seguito 
uno schemino che sicuramente sara' piu' esplicativo delle parole. 

 +---------+----------+----------+---------+------+---------------+ 
 | Flag PG | PAE Flag | PSE Flag | PS Flag | Page |   Physical    | 
 |   CR0   |   CR4    |   PDE    |   PDE   | Size | Address Space | 
 +---------+----------+----------+---------+------+---------------+ 
 |    0    |     x    |     x    |    x    |   /  |Paging Disabled| 
 +---------+----------+----------+---------+------+---------------+ 
 |    1    |     0    |     0    |    x    | 4 KB |     32 bit    | 
 +---------+----------+----------+---------+------+---------------+ 
 |    1    |     0    |     1    |    0    | 4 KB |     32 bit    | 
 +---------+----------+----------+---------+------+---------------+ 
 |    1    |     0    |     1    |    1    | 4 MB |     32 bit    | 
 +---------+----------+----------+---------+------+---------------+ 
 |    1    |     1    |     x    |    0    | 4 KB |     36 bit    | 
 +---------+----------+----------+---------+------+---------------+ 
 |    1    |     1    |     x    |    1    | 2 MB |     36 bit    | 
 +---------+----------+----------+---------+------+---------------+ 

Ma cosa accade una volta che, attivato il paging, si vuole ricavare un 
indirizzo fisico da uno lineare? Se le pagine utilizzate sono di 4KB, il 
linear address si presenta cosi': 

  31      22 21      12 11         0  
 +----------+----------+------------+ 
 | Directory|  Table   |   Offset   | 
 +----------+----------+------------+ 

L'entry "Directory" offre un offset ad un'entry nella page dir. Tale entry 
dara' poi il base physical address della page table. 
Tramite l'entry Table viene fornito un offset a un'entry nella page table 
selezionata: tale entry a sua volta dara' il base physical address di una 
pagina nella memoria fisica. 
Il campo Offset, a sua volta, dara' un'offset all'indirizzo fisico nella 
pagina. 

In altri termini, tramite i bit 22 -> 31 viene ricavata un'entry nella page 
dir che servira' a trovare il base phys. address della page table. Tramite i 
bit 12 -> 21 verra' poi selezionata un'entry di tale page table, da cui sara' 
ricavato il base phys address della pagina in questione. Tramite il campo 
"offset" (relativo al base phys address della pagina) verra' poi ricavato 
l'indirizzo fisico corrispondente a quello lineare di partenza. 

Se la pagina invece che di 4KB e' di 4MB, allora il linear address conterra' 
solo un campo "offset" (bit 0 -> 21) e un campo "Directory" (bit 22 -> 31). 
Il 2o dara' un offset a un'entry nella pagedir, da cui verra' ricavato il 
base phys address della pagina, mentre il 1o offrira' un offset all'interno 
di tale pagina. 

Ecco di seguito come si presenta un'entry nella Page Dir quando si utilizzano 
pagine di 4KB (naturalmente disegno non in scala;) ). 

  31                     12 11  9  8   7   6   5   4   3   2   1   0   
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 
 |                         |     |   |   |   |   | P | P | U | R |   | 
 | Page-Table Base Address |Avail| G | PS| 0 | A | C | W | / | / | P | 
 |                         |     |   |   |   |   | D | T | S | W |   | 
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 

Ora un disegnino pure delle Page Table entry con pagine a 4KB. 

  31                     12 11 9   8   7   6   5   4   3   2   1   0   
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 
 |                         |     |   |   |   |   | P | P | U | R |   | 
 | Page-Table Base Address |Avail| G | 0 | D | A | C | W | / | / | P | 
 |                         |     |   |   |   |   | D | T | S | W |   | 
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 

Ora un altro disegnino di una Page Dir entry con pagine a 4MB. 

  31          22 21      12 11  9  8   7   6   5   4   3   2   1   0   
 +--------------+----------+-----+---+---+---+---+---+---+---+---+---+ 
 |      Page    |          |     |   |   |   |   | P | P | U | R |   | 
 |      Base    | Reserved |Avail| G | PS| D | A | C | W | / | / | P | 
 |    Address   |          |     |   |   |   |   | D | T | S | W |   | 
 +--------------+----------+-----+---+---+---+---+---+---+---+---+---+ 

E ora la spiegazione dei relativi campi e flag piu' importanti (non li metto 
proprio tutti). 

* Page base address, bit 12 --> 32 (o 22 --> 32, a seconda della grandezza 
della pagina) 
	E' l'indirizzo fisico del 1o byte di una pagina o di una page table. 

* P (present) flag, bit 0 
	Indica se la pagina e' caricata in memoria (settato) o meno (non 
settato). Se si vuole acccedere a una pagina non in memoria, accade il solito 
e comune #PF (page-fault exception). 

* R/W (Read/Write) flag, bit 1 
	Indica se la pagina e' solamente readable (non settato) o anche 
writeable (settato). Questo flag interagisce coi flag U/S e WP nel CR0. 

* U/S (User/Supervisor) flag, bit 2 
	Indica il privilegio user/supervisor. Se non e' settato la pagina (o 
il gruppo di pagine) e' assegnata al livello supervisor, altrimenti al 
livello user. Tale flag interaisce con i flag R/W e WP in CR0. 

* A (Accessed) flag, bit 5 
	Indica se vi e' stato un accesso alla pagina o alla page table. 

* D (Dirty) flag, bit 6 
	Indica, se settato, che la pagina e' stata scritta. 

* PS (Page Size) flag, bit 7 
	Determina la grandezza della pagina (usato solo nelle entry della 
page-dir). Se e' spento, la size e' 4KB e la page dir entry punta a una page 
table. Se e' acceso, la size e' 4MB per l'indirizzamento a 32bit (e 2MB se e' 
attivato l'indirizzamento esteso) e la page dir entry punta a una pagina. Se 
tale entry punta a una page table, tutte le pagine associate con quella table 
saranno di 4KB. 

* G (Global) flag, bit 8 
	[Dai Pentium Pro] Indica una global page. Questo flag viene usato  
specialmente per evitare che le pagine piu' usate siano cancellate dai TLB. 

Cosa sono questi TLB? Il TLB (Translation Lookaside Buffer) sono delle cache 
on-chip dove il processore conserva le pagine utilizzate piu' recentemente. 
La famiglia P6 e Pentium ha separati TLB per cache di dati e istruzioni. 
Inoltre, i P6 hanno TLB separati per pagine a 4KB e 4MB. 

La maggior parte del meccanismo di paging, in effetti, e' svolta utilizzando i 
TLB, per risparmiare cicli di bus alla page dir e page table, che vengono  
effettivamente eseguiti solo se i TLB non contengono i dati di traduzione  
richiesti per una pagina. 
I TLB sono naturalmente modificabili solo a ring0. 

Per il resto non mi dilungo oltre sull'argomento, puo' bastare sapere questo 
sui TLB. 

Physical Address Extension 
^^^^^^^^^^^^^^^^^^^^^^^^^^ 
Quando il physical address extension viene attivato, vengono apportati questi 
cambiamenti nelle strutture inerenti al paging: 

- Le entry della paging table sono portate a 64bit. 
- Viene aggiunta un campo "page directory pointer" all'indirizzo lineare da 
  tradurre. 
- Il field di 20bit "page-directory base address" nel CR3 e' cambiato con un 
  "page-directory-pointer-table base address". 
- Viene modificato il processo di traduzione degli indirizzi. 

  31 30 29     21 20      12 11         0  
 +-----+---------+----------+------------+ 
 |     |Directory|  Table   |   Offset   | 
 +-----+---------+----------+------------+ 
    ^ 
    | 
    +---------- Directory Pointer 

Per tradurre un indirizzo lineare in uno fisico con pagine da 4 KB, vengono  
utilizzati i bit 30 e 31 della entry Page-dir-pointer-table per ricavare una  
delle 4 entry nella page-dir-pointer table. Tale entry dara' il base address 
fisico di una page dir. A questo verra' aggiunto l'offset specificato nel 
campo "Page directory entry" (bit 21 -> 29) dell'indirrizzo lineare, in modo 
da ricavare un'entry nella page dir selezionata. Da qui verra' ottenuto il 
base address fisico di una page table. 
A tale indirizzo si aggiungera' ancora l'offset specificato nel campo 
"Page-entry table" (bit 12 -> 20) sempre del linear address. In tal modo si 
ottiene il base physical address di una pagina nella memoria fisica. Bastera' 
aggiungere a tale valore l'offset specificato nel campo "Page offset" 
(bit 0 -> 11) per formare finalmente l'indirizzo fisico corrispondente a 
quello lineare di partenza. Effettivamente e' un po' un casino. 

Se invece la pagina e' di 2MB, viene ricavato il base address della page dir, 
si aggiunge un offset per ricavare il base address di una pagina e a questo 
viene ancora aggiunto un offset per ricavare l'indirizzo tradotto. 

Vi metto di seguito gli schemi di alcune entry (nel caso di indirizzamenti a 
36bit), che diligentemente NON commentero' visto che ne ho gia' spiegato la 
funzione. 

                  Page-Directory-Pointer-Table Entry 

  63                                               36 35           32  
 +---------------------------------------------------+---------------+ 
 |                                                   |               | 
 |                Reserved (set to 0)                |  Base Address | 
 |                                                   |               | 
 +---------------------------------------------------+---------------+ 

  31                     12 11  9 8             5  4   3  2     1  0   
 +-------------------------+-----+---------------+---+---+-------+---+ 
 |                         |     |               | P | P |       |   | 
 |Page-Directory Basse Addr|Avail|   Reserved    | C | W |  Res  | 1 | 
 |                         |     |               | D | T |       |   | 
 +-------------------------+-----+---------------+---+---+-------+---+ 

 
                 Page-Directory Entry (4KB Page Table) 

  63                                               36 35           32  
 +---------------------------------------------------+---------------+ 
 |                                                   |               | 
 |                Reserved (set to 0)                |  Base Address | 
 |                                                   |               | 
 +---------------------------------------------------+---------------+ 

  31                     12 11  9  8   7   6   5   4   3   2   1   0   
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 
 |                         |     |   |   |   |   | P | P | U | R |   | 
 |Page-Directory Basse Addr|Avail| 0 | 0 | 0 | A | C | W | / | / | P | 
 |                         |     |   |   |   |   | D | T | S | W |   | 
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 

 
                   Page-Table Entry (4KB Page Table) 

  63                                               36 35           32  
 +---------------------------------------------------+---------------+ 
 |                                                   |               | 
 |                Reserved (set to 0)                |  Base Address | 
 |                                                   |               | 
 +---------------------------------------------------+---------------+ 

  31                     12 11  9  8   7   6   5   4   3   2   1   0   
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 
 |                         |     |   |   |   |   | P | P | U | R |   | 
 |Page-Directory Basse Addr|Avail| G | 0 | D | A | C | W | / | / | P | 
 |                         |     |   |   |   |   | D | T | S | W |   | 
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+ 

 
                  Page-Directory-Pointer-Table Entry 

  63                                               36 35           32  
 +---------------------------------------------------+---------------+ 
 |                                                   |               | 
 |                Reserved (set to 0)                |  Base Address | 
 |                                                   |               | 
 +---------------------------------------------------+---------------+ 

  31                     12 11  9 8             5  4   3  2     1  0   
 +-------------------------+-----+---------------+---+---+-------+---+ 
 |                         |     |               | P | P |       |   | 
 |Page-Directory Basse Addr|Avail|   Reserved    | C | W |  Res  | 1 | 
 |                         |     |               | D | T |       |   | 
 +-------------------------+-----+---------------+---+---+-------+---+ 

 
                 Page-Directory Entry (2MB Page Table) 

  63                                               36 35           32  
 +---------------------------------------------------+---------------+ 
 |                                                   |               | 
 |                Reserved (set to 0)                |  Base Address | 
 |                                                   |               | 
 +---------------------------------------------------+---------------+ 

  31       21 20         12 11  9  8   7   6   5   4   3   2   1   0   
 +-----------+-------------+-----+---+---+---+---+---+---+---+---+---+ 
 |    Page   |             |     |   |   |   |   | P | P | U | R |   | 
 |    Base   | Reserved (0)|Avail| G | 1 | D | A | C | W | / | / | P | 
 |   Address |             |     |   |   |   |   | D | T | S | W |   | 
 +-----------+-------------+-----+---+---+---+---+---+---+---+---+---+ 

Nel caso di pagine a 2MB la page dir pointer table entry e' identica a quella 
per pagine a 4KB. 

SEGMENTATION 
^^^^^^^^^^^^ 
Il meccanismo della segmentazione, invece, consente di dividere lo spazio di  
memoria indirizzabile, ovvero quello lineare, in spazi di indirizzamento piu'  
piccoli, chiamati segmenti. Ogni segmento puo' esser usato per contenere codice,  
dati o stack di un programma o per contenere strutture quali LDT. La 
segmentazione, al contrario del paging, *non* puo' essere disattivata. 

Di conseguenza, affinche' un dato processo possa accedere a un byte in un dato 
spazio di memoria (contenuto nel linear address space) deve fornire al 
processore un indirizzo logico, composto a un segment selector (un selettore 
di 16 bit) e un offset di 32 bit. 
Il selettore e' un identificatore *unico* per ogni segmento, che oltre ad 
altre cose consiste in un offset che punta ad un dato descrittore (sempre 
caratteristico di quel segmento) all'interno della GDT (Global Descriptor 
Table, Tavola dei Descrittori Globale). Il compito del processore e' quello, 
dato un selettore, di individuare il corrispondente descrittore nella GDT e da 
esso ricavare il base address del segmento corrispondente. Aggiungendo al base 
address del segmento l'offset indicato nell'indirizzo logico si ricavera'  
l'indirizzo lineare a cui si vuole accedere. 
Schematicamente: 

 +INDIRIZZO LOGICO+---->(del tipo 1234:12345678, ad ex CS:EIP o DS:ESI) 
 +---------+------+ 
  SELETTORE OFFSET 
      |        |                      +-----+ 
      |        +--------------------->|  +  |-------> INDIRIZZO LINEARE 
      |                               +-----+         ^^^^^^^^^^^^^^^^^ 
      |                                  ^         nel Linear Address Space 
      |                                  |  
      |     +-------+                    | 
      +---->|  GDT  |----- BASE ADDRESS -+ 
            +-------+      ^^^^^^^^^^^^ 

Lo schemino e' molto semplice (a dire il vero pensavo mi venisse peggio;P ) e 
non fa alcun riferimento a meccanismi quali paging che dall'indirizzo lineare 
ricavano quello fisico in cui la pagina e' stata mappata, btw a noi cio' non 
interessa visto che ne abbiamo gia' parlato :) . 

La segmentazione cmq e' un meccanismo generale e ogni sistema la puo'  
implementare nel modo che piu' piace agli sviluppatori, a seconda del numero 
di segmenti che si desiderano utilizzare. Alcuni tipi di modelli utilizzati 
sono il Basic Flat Model, Protected Flat Model e Multisegment Model. 

Nel primo caso lo spazio indirizzabile e' continuo e non segmentato, ad ogni 
modo almeno due descrittori (un code e un data) devono essere creati, anche se 
essi vengono cmq mappati all'interno del linear address space con lo stesso 
base address (0) e lo stesso limite (4GB). 
Il secondo caso, invece, il Protected Flat Model, e' molto simile al Basic 
Flat ma con la differenza che e' garantita un minimo di protezione (ad ex se 
si cerca di accedere a della memoria inesistente superandone il limite viene 
generata una general-protection fault) e i limiti dei segmenti vengono 
settati; la maggior parte dei sistemi operativi multitasking utilizza proprio 
questo modello. 
Nel terzo caso, invece, ogni programma ha la propria tabella di descrittori e 
i propri segmenti a seconda che si abbia a che fare con codice, dati, stack o 
altro. Tale modello offre naturalmente la maggior protezione possibilie. 

Analizziamo ora le strutture quali selettori e descrittori. 

Un segment selector si presenta cosi' (scusate la pessima grafica ASCII, ma 
l'ho dovuta fare sempre io;) ). 

  15                                               3   2  1     0 
 +--------------------------------------------------+----+-------+ 
 |                                                  |    |       | 
 |                      Index                       | TI | R P L | 
 |                                                  |    |       | 
 +--------------------------------------------------+----+-------+ 

* Index, bit 3 --> 15 
    Seleziona uno degli 8192 descriptor nella GDT o LDT. Il processore 
moltiplica tale valore per 8 (il numero di byte di un descriptor) e lo aggiunge 
al base address della GDT / LDT (ricavato dai registri GDTR o LDTR). 

* TI (Table Indicator) flag, bit 2 
    Specifica quale descriptor table usare: 1 = LDT, 0 = GDT 

* RPL (Requested Privilege Level), bit 0 --> 1 
    Bit che specificano il livello di privlegio del selettore, che puo' 
variare da 0 a 3 come ben sappiamo ;) . 

Per poter risparmiare tempo e cicli di clock nel calcolo degli indirizzi il 
processore offre 6 registri di segmento addetti appunto a contenere un segment 
selector (ogni registro cmq supporta un solo specifico tipo di selettore, per 
codice, dati, stack etc). In realta' i registri di segmento sono costituiti, 
oltre al selettore di 16 bit, da un'altra porzione che serve a risparmiare 
cicli di clock sempre nella traduzione di indirizzi, che cmq a noi non 
interessa. 

Un segment descriptor, invece, e' una strutura nella GDT o LDT che serve al 
processore per determinare posizione e grandezza di un segmento. Eccone una 
rappresentazione. 

  31            24 23 22 21 20 19   16 15 1413 12 11     8 7             0 
 +----------------+--+--+--+--+-------+--+----+--+--------+---------------+ 
 |                |  | D|  | A|  Seg  |  | D  |  |        |               | 
 |   Base 31:24   | G| /| 0| L| Limit | P|  P | S|  Type  |   Base 23:16  | 
 |                |  | B|  | V| 19:16 |  |   L|  |        |               | 
 +----------------+--+--+--+--+-------+--+----+--+--------+---------------+ 

  31                                16 15                                 0 
 +------------------------------------+------------------------------------+ 
 |                                    |                                    | 
 |         Base Address 15:00         |         Segment Limit 15:00        | 
 |                                    |                                    | 
 +------------------------------------+------------------------------------+ 

* Segment Limit field, bit 0 --> 15 (1a dw) + 16 --> 19 (2a dw) 
    Indica la grandezza del segmento (il processore mette insieme i 2 campi 
per formare un valore di 20 bit). Se il flag G di granularita' non e' settato, 
la grandezza puo' variare a 1 byte a 1MB, se e' settato puo' variare da 4 KB 
a 4GB con incrementi di 4KB alla volta. 

* Base Address field, bit 16 --> 31 (1a dw) + 0 --> 7 (2a dw) + 24 --> 31 (2a  
dw) 
    Indica la posizione del byte 0 del segmento all'interno del linear address 
space di 4GB (il processore mette insieme i 3 campi per formare un valore a 
32bit). 

* Type field, bit 8 --> 11 (2a dw) 
    Indica il tipo di segmento, i tipi di accesso su di esso e il suo "verso" 
di sviluppo. 

* S (descriptor type) flag, bit 12 (2a dw) 
    Indica se abbiamo a che fare con un system segment (S non e' acceso) e un 
code / data segment (S e' acceso) 

* DPL (descriptor privilege level) field, bit 13 --> 14 (2a dw) 
    Altro campo interessante: indica il livello di privilegio del segmento (4 
valori da 0 a 3). 

* P (segment present) flag, bit 15 (2a dw) 
    Indica se il segmento e' presente (acceso) o no (spento) in memoria. Se, da  
spento, si carica un segment register con un selettore che punta ad esso, 
viene generata un'exception segment-not-present (#NP). Inoltre, se tale flag 
non e' settato, il formato del descrittore stesso cambia. 

* D/B (default operation size/default stack pointer size and/or upper bound)  
flag, bit 22 (2a dw) 
    Tale flag ha differenti funzioni (che non analizzeremo) a seconda che il 
segmento sia un code segment, expand-down data segment e stack segment. 

* G (granularity) flag, bit 23 (2a dw) 
    Determina la scala di aumento del segment limit. Se non e' settato il 
limite e' interpretato in unita' di byte, in caso contrario in unita' di 4KB. 

Il bit 20 della seconda dw e' disponibile per il software, il bit 21 e' 
riservato e dovrebbe esser sempre lasciato a 0. 

Nel caso in cui il flag S sia settato, il descriptor puo' riferirsi a segmento 
di codice o dati. E' il bit 11 della seconda dw del descriptor (il bit piu' 
significativo del type field) a determinare quando il descriptor stesso sia 
per segmenti di codice o dati. 
Per i data segment, i 3 bit meno significativi indicano quando il segmento sia 
accessed (A), se si puo' scrivere su di esso (W) e la direzione di espansione 
(E). 
Per i code segment, tali 3 bit stanno ad indicare quando il segmento e' 
accessed (A), se lo si puo' leggere (R) e se e' conforming (C). Sul 
significato di "conforming" parlero' in seguito. 

 +-----------------+----------------+-----------------------------------------+ 
 |   Type Field    |                |                                         | 
 +----+----+---+---+   Descriptor   |                                         | 
 | 11 | 10 | 9 | 8 |      Type      |               Description               | 
 |    |  E | W | A |                |                                         | 
 +----+----+---+---+----------------+-----------------------------------------+ 
 |  0 |  0 | 0 | 0 |      Data      | Read-Only                               | 
 |  0 |  0 | 0 | 1 |      Data      | Read-Only, accessed                     | 
 |  0 |  0 | 1 | 0 |      Data      | Read/Write                              | 
 |  0 |  0 | 1 | 1 |      Data      | Read/Write, accessed                    | 
 |  0 |  1 | 0 | 0 |      Data      | Read-Only, expand-down                  | 
 |  0 |  1 | 0 | 1 |      Data      | Read-Only, expand down, accessed        | 
 |  0 |  1 | 1 | 0 |      Data      | Read/Write, expand-down                 | 
 |  0 |  1 | 1 | 1 |      Data      | Read/Write, expand-down, accessed       | 
 +----+----+---+---+----------------+-----------------------------------------+ 
 |    |  C | R | A |                |                                         | 
 +----+----+---+---+----------------+-----------------------------------------+ 
 |  1 |  0 | 0 | 0 |      Code      | Execute-Only                            | 
 |  1 |  0 | 0 | 1 |      Code      | Execute-Only, accessed                  | 
 |  1 |  0 | 1 | 0 |      Code      | Execute/Read                            | 
 |  1 |  0 | 1 | 1 |      Code      | Execute/Read, accessed                  | 
 |  1 |  1 | 0 | 0 |      Code      | Execute-Only, conforming                | 
 |  1 |  1 | 0 | 1 |      Code      | Execute-Only, conforming, accessed      | 
 |  1 |  1 | 1 | 0 |      Code      | Execute/Read-Only, conforming           | 
 |  1 |  1 | 1 | 1 |      Code      | Execute/Read-Only, conforming, accessed | 
 +----+----+---+---+----------------+-----------------------------------------+ 

Quando invece l'S flag non e' settato,  il descrittore e' di tipo system. Ecco 
di seguito alcuni tipi di descrittori di sistema. 

# LDT segment descriptor 
# TSS descriptor 
# Call-gate descriptor 
# Interrupt-gate descriptor 
# Trap-gate descriptor 
# Task-gate descriptor 

Questi tipi di descrittori sono raggruppati inoltre in system-segment 
descriptor e gate descriptor. I primi puntano a segmenti di sistema quali LDT 
e TSS, mentre i secondi sono dei gate che contengono puntatori a procedure nei 
segmenti di codice (in altri termini call, interrupt etc) o che contengono 
selettori per la TSS. Ecco di seguito la tabella precedente che pero' si 
riferisce ai system descriptor. 

 +-----------------+-----------------------+ 
 |   Type field    |                       | 
 +----+----+---+---+      Description      | 
 | 11 | 10 | 9 | 8 |                       | 
 +----+----+---+---+-----------------------+ 
 |  0 |  0 | 0 | 0 | Reserved              | 
 |  0 |  0 | 0 | 1 | 16-bit TSS (Avaiable) | 
 |  0 |  0 | 1 | 0 | LDT                   | 
 |  0 |  0 | 1 | 1 | 16-bit TSS (Busy)     | 
 |  0 |  1 | 0 | 0 | 16-bit Call Gate      | 
 |  0 |  1 | 0 | 1 | Task Gate             | 
 |  0 |  1 | 1 | 0 | 16-Bit Interrupt Gate | 
 |  0 |  1 | 1 | 1 | 16-bit Trap Gate      | 
 |  1 |  0 | 0 | 0 | Reserved              | 
 |  1 |  0 | 0 | 1 | 32-bit TSS (Avaiable) | 
 |  1 |  0 | 1 | 0 | Reserved              | 
 |  1 |  0 | 1 | 1 | 32-bit TSS (Busy)     | 
 |  1 |  1 | 0 | 0 | 32-bit Call Gate      | 
 |  1 |  1 | 0 | 1 | Reserved              | 
 |  1 |  1 | 1 | 0 | 32-bit Interrupt Gate | 
 |  1 |  1 | 1 | 1 | 32-bit Trap Gate      | 
 +----+----+---+---+-----------------------+ 

-= MECCANISMI DI PROTEZIONE IN PROTECTED MODE =- 

Ogni volta che in una qualsiasi situazione avviene un riferimento alla memoria 
i processori i386 eseguono svariati check di vario tipo in parallelo con la 
traduzione degli indirizzi (senza quindi che ci sia perdita di cicli). Tali 
check si dividono in: 

# Limit check 
# Type check 
# Privilege Level check 
# Restriction of addressable domain 
# Restriction of procedure entry-point 
# Restriction of instruction set 

Ogni violazione a una protezione da' come risultato un'exception. 

Qui mi soffermero' sul 3o tipo di check. 

Non penso sia il caso di dirlo, btw il meccanismo di protezione dei segmenti 
riconosce 4 diversi livelli di privilegio, numerati da 0 a 3; tali livelli 
possono essere interpretati come "anelli" di protezione (da qui il nome ring 
level), dove nel ring0 c'e' il kernel del SO, nei ring1 e ring2 ci sono i  
servizi di sistema, nel ring3 ci sono le comuni applicazioni. A ring0 si puo' 
fare tutto cio' che si vuole sul processore e utilizzare *tutto* il set di  
istruzioni disponibili. Se si tenta di eseguire a ring3 istruzioni eseguibili 
solo a ring0 si incorrera' in una general-protection exception (#GP). 

Affinche' il Privilege Level check sia eseguito, il processore deve esaminare 
tutti i seguenti tipi di livelli di privilegio: 

# Current Privilege Level (CPL) Il CPL, il cui valore e' contenuto nei bit 0 
e 1 nei registri di segmento CS e SS, indica il livello di privilegio del 
programma/task attualmente in esecuzione. Di solito (ma non sempre, come 
vedremo dopo) il CPL e' uguale al livello di privilegio del code segment da 
cui sono prese le istruzioni. Il processore cambia il CPL quanto il controllo 
e' trasferito a un segmento con differente livello di privilegio. 

# Descriptor Privilege Level (DPL) Il DPL e' il livello di privilegio di un  
segmento (o un gate). Il suo valore e' contenuto nel campo DPL del descrittore 
del segmento (o del gate). 

# Requested Privilege Level (RPL) L'RPL e' un livello di privilegio assegnato 
ai selettori di segmento. Il suo valore e' contenuto nei bit 0 e 1 del 
selettore stesso. 

Privilege Level Checking in riferimento ai data segment 
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 
Per accedere ai dati di un data segment, e' necessario spostare in un registro 
di segmento per dati (DS, ES, FS e GS) un selettore per il segmento a cui si 
desidera accedere. 
Prima che il processore carichi tale valore nei registri di segmento, pero', 
attua un privilege level check che consiste in questo: vengono confrontati il 
CPL, l'RPL del selettore e il DPL del descrittore del segmento. Affinche' il 
processore carichi nel registri di segmento il selettore, il DPL deve essere 
maggiore o uguale sia al CPL che all'RPL; in caso contrario, #GP rulez ;) . 

Per quanto riguarda gli stack segment, invece, affinche' il registro SS venga 
caricato con il selettore indicato sia l'RPL dello stack segment selector che 
il DPL dello stack segment descriptor devono essere uguali al CPL. Lascio a 
voi indovinare cosa accade in caso contrario ;) . 

 
Privilege Level Checking nel trasferimento del controllo del programma tra 
code segment 
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 
Quando il controllo del prg in esecuzione viene passato da un segmento a un 
altro, il selettore per il codice di destinazione deve esser caricato nel 
registro CS. Il processore pero' carica tale selettore solo dopo aver fatto 
sul descrittore a cui esso si riferisce check di tipo, di limite e di 
privilegio. 
Se tali check hanno successo, l'esecuzione sara' passata al nuovo segmento, 
precisamente all'indirizzo CS:EIP. 
Per poter trasferire il controllo a un segmento differente da quello attuale 
si utilizzano le classiche istruzioni del tipo JMP/CALL, ma le strade che si 
possono seguire sono piu' di una: 

Caso #1 - Trasferimento diretto al segmento a cui si vuole accedere. 
Caso #2 - Utilizzo di un gate descriptor che contiene il selettore per il code 
          segment a cui si desidera accedere. 
Caso #3 - Trasferimento al TSS, che contiene il selettore per il segmento  
          target. 

Caso #1 
^^^^^^^ 
Se si desidera trasferire il controllo del programma a un segmento diverso da 
quello attuale una strada e' quella di esegure un far JMP/CALL alla procedura 
desiderata. Naturalmente, *prima* di eseguire tale salto o tale call si 
eseguono dei controlli di privilegio. In questo caso, vengono controllati: 

- Il CPL. 
- Il DPL per il segmento target. 
- L'RPL. 
- Il C flag nel descrittore del target code segment, che determina se il 
  segmento e' conforming o non-conforming. 

Se il segmento e' nonconforming (e la maggioranza lo sono), il CPL 
(naturalmente sempre della procedura chiamante) deve essere uguale alla DPL 
del segmento di destinazione. In caso contrario, #GP. 

Se il segmento e' conforming, il CPL deve essre uguale o maggiore (ovvero aver 
minori privilegi) del DPL del segmento target, e l'RPL del selettore del  
segmento target non e' controllato. Se il check ha esito positivo, in CS viene 
caricato il selettore, altrimenti solito #GP. 
In altre parole, per i conforming code segment il DPL rappresenta il livello 
di privilegio piu' basso a cui puo' essere la procedura chiamante affinche' 
possa essere eseguita con successo una call al code segment target. 

[ INIZIO NOTA PER GLI AMANTI DI WINBOIA ] 

A questo punto sembrerebbe che utilizzando segmenti conforming e settanto il 
DPL del descrittore che si riferisce al segmento target a 0 si possa scendere 
molto facilmente a ring0... ma c'e' un problema, infatti quei simpaticoni 
della Intel hanno fatto in modo che, anche se in questo tipo di procedura il 
DPL e' 0 o cmq < CPL, quando il selettore e' caricato in CS il CPL rimanga 
invariato e non scenda al valore della DPL, questo per questioni di protezione 
tra segmenti conforming e nonconforming (che solitamente sono utilizzati da 
moduli quali math library)... bella sfiga per chi aveva gia' fatto pensierini 
malvagi ;), visto anche che questo e' l'unico caso, come accennato sopra, in 
cui CPL != DPL del code segment corrente. 

In definitiva, se in WinBoia volete scendere a ring0 potete sognarvi di fare 
un JMP/CALL diretto al codice che vi interessa. 

[ FINE NOTA PER GLI AMANTI DI WINBOIA] 

Caso #2 
^^^^^^^ 
Per permettere a un programma di avere accesso a segmenti con livelli di 
privilegio tra loro differenti le Architetture i386 mettono a disposizione un 
set particolare di descrittori, chiamati gate descriptor. Ne esistono 4 tipi: 

- Call gate. 
- Trap gate. 
- Interrupt Gate. 
- Task Gate. 

I Call Gate sono stati progettati proprio per permettere lo switching tra 
segmenti dal livello di privilegio diverso o tra segmenti a 16 e 32 bit. 
Essi possono essere installati nella GDT o nella LDT, *non* nella IDT, e il 
loro compito e' quello di: 

1- Specificare il segmento a cui accedere. 
2- Definire un entrypoint per la procedura nel segmento target. 
3- Specificare il livello di privilegio che la procedura chiamante deve avere 
   per poter accedere alla nuova procedura. 
4- Specificare il numero di parametri da copiare tra gli stack se accade uno 
   stack-switch. 
5- Definire la grandezza dei valori da pushare nello stack target (16 bit 
   segment = push a 16 bit, 32 bit segment = push a 32 bit). 
6- Specificare in quali casi il call gate e' valido. 

Ecco come si presenta un call gate. 

  31                                 16 15 1413 12 11     8 7 6 5 4        0  
 +-------------------------------------+--+----+--+--------+-----+----------+ 
 |                                     |  | D  |  |  Type  |     |          | 
 |       Offset in Segment 31:16       | P|  P | 0|        |0 0 0| Parameter| 
 |                                     |  |   L|  |1|1|0|0 |     |  Count   | 
 +-------------------------------------+--+----+--+-+-+-+--+-----+----------+ 

  31                                16 15                                  0  
 +------------------------------------+-------------------------------------+ 
 |                                    |                                     | 
 |          Segment Selector          |       Offset in Segment 15:00       | 
 |                                    |                                     | 
 +------------------------------------+-------------------------------------+ 

Il campo "Segment Selector" specifica il segmento a cui accedere. Il campo 
"Offset" specifica l'entrypoint nel segmento. Il DPL specifica il livello di 
privilegio del call gate, ovvero il livello di privilegio necessario per 
accedere al segmento attraverso il call gate. Il P flag indica se il 
descrittore e' valido (ovvero e' il flag P che indica se il segmento 
effettivamente esiste). 
Il campo "Parameter Count" indica il numero di parametri da copiare dallo 
stack della procedura chiamante a quello della nuova procedura se avviene uno 
stack-switch (ovvero il numero di word per il call gate a 16 bit o il numero 
di dw per il call gate a 32 bit). 

Per accedere al call gate si dovra' utilizzare un far operand in un JMP o una 
CALL: il selettore identifica il call gate, mentre come offset si puo' mettere 
cio' che si preferisce, tanto non viene ne' controllato ne' usato. 
Una volta che il processore ha avuto accesso al call gate, utilizza il 
selettore per trovare il descrittore per il segmento target, che puo' trovarsi 
nella GDT o nella LDT. Quindi somma al base address del segmento (ricavato dal 
descrittore) all'offset nella call gate per formare l'indirizzo lineare 
dell'entrypoint della procedura nel segmento. Per controllare la validita' del 
trasferimento del controllo all'interno del prg attraverso un call gate 
vengono controllati: 

- Il CPL. 
- L' RPL del selettore al call gate. 
- Il DPL del decrittore a cui il call gate si riferisce. 
- Il DPL del descrittore del segmento target. 
- Il C flag nel descrittore per il segmento target. 

Le regole che determinano la validita' o meno del trasferimento variano a  
seconda che esso avvenga tramite una CALL o un JMP. 

Se abbiamo a che fare con una CALL, 
a- Il CPL deve essere minore o uguale al DPL del call gate. 
b- L'RPL del selettore al call gate deve essere minore o uguale al DPL del 
   call gate. 
c- Il DPL del descrittore per il segmento target deve essere minore o uguale 
   al CPL, sia che il segmento sia conforming che nonconforming. 

Per i JMP valgono le stesse regole con l'eccezione che, al punto c, se il 
segmento target e' conforming il suo DPL deve essere minore o uguale al CPL, 
mentre se e' nonconforming deve essere uguale al CPL. 

Tutte tali regole sono btw piu' facili da capire che da spiegare ;) . 

Stack Switching 
^^^^^^^^^^^^^^^ 
Quando un programma utilizza un call gate per traserire il controllo da un 
segmento meno privilegiato a uno piu' priviligiato il processore 
automaticamente cambia (switcha, appunto ;) ) il task utilizzato. Cosa 
significa tutto cio? 
Nelle architetture Intel per ogni task in esecuzione esistono 4 stack: 1 per 
l'attuale livello di privilegio (ring3) e altri 3 per i rimanenti livelli 
ring2, ring1 e ring0 (naturalmente per i sistemi che utilizzano sono 2 livelli 
ring3 e ring0 quali WinCesso esistono solo 2 stack), ognuno naturalmente 
presente in un proprio segmento separato. Quando da un livello meno 
privilegiato si scende a uno piu' privilegiato (anche se usando questi termini 
sarebbe piu' opportuno dire "si sale" a dire il vero ;) ) viene effettuato 
proprio un cambiamento del task utilizzato (task switching) che in primo luogo 
permette alle procedure piu' privilegiate di avere un minor rischio di crash a 
causa di uno stack troppo piccolo e in secondo luogo impedisce che le 
procedure a ring piu' alto (meno privilegiate) interferiscano con quelle a 
ring piu' basso a causa di uno stack condiviso (shared stack). 
Come noto per puntare allo stack servono un selettore e uno stack pointer. 
Quando siamo a ring3, il selettore e' localizzato in SS e il suo stack pointer 
in ESP, mentre i puntatori agli stack a ring piu' bassi sono localizzati nel 
TSS (Task-State Segment) del task attualmente in esecuzione: quando si 
accedera' a un livello di privilegio diverso da ring3, essi saranno utilizzati 
proprio per creare il nuovo stack, che dovra' essere sufficientemente grande 
per contenere: 

- Il contenuto di SS, ESP, CS ed EIP della procedura chiamante. 
- I parametri indicati nella chiamata alla nuova procedura. 
- Il registro di EFLAG e gli error code (per le exception e gli interrupt). 

Riassumendo, quando viene chiamato un call gate per passare a un livello di 
privilegio piu' basso (ricordo infatti che *non* e' possibile passare a CPL 3 
da CPL 0, 1 o 2 se non attraverso un RET) ecco cosa fa il processore per 
switchare lo stack: 

1- Utilizza il DPL del segmento di destinazione per selezionare un puntatore 
   al nuovo stack dal TSS. 
2- Legge il selettore e lo stack pointer per il nuovo stack dal TSS. Eventuali 
   violazioni del limite durante la lettura generano una invalid TSS exception 
   (#TS). 
3- Controlla i giusti privilegi del descrittore (sempre dello stack-segment). 
   Se sono errati altra #TS. 
4- Salva i valori di SS ed ESP. 
5- Carica selettore e stack pointer rispettivamente in SS ed ESP. 
6- Pusha i valori salvati di SS ed ESP nel nuovo stack. 
7- Copia dal vecchio stack il numero di parametri specificati nel count field 
   del call gate nel nuovo stack. 
8- Pusha il contenuto di CS ed EIP nel nuovo stack. 
9- Carica il selettore per il nuovo code segment e il nuovo instruction 
   pointer dal call gate rispettivamente in CS:EIP e inizia l'esecuzione della 
   nuova procedura. 

 Calling Procedure's Stack           Called Procedure's Stack 

   |                   |                |                 | 
   +-------------------+                +-----------------+ 
   |    Parameter 1    |                |    Calling SS   | 
   +-------------------+                +-----------------+ 
   |    Parameter 2    |                |    Calling ESP  | 
   +-------------------+                +-----------------+ 
   |    Parameter 3    |                |   Parameter 1   | 
   +-------------------+                +-----------------+ 
   |                   |                |   Parameter 2   | 
                                        +-----------------+ 
                                        |   Parameter 3   | 
                                        +-----------------+ 
                                        |    Calling CS   | 
                                        +-----------------+ 
                                        |    Calling EIP  | 
                                        +-----------------+ 
                                        |                 | 

Per tornare dalla chiamata piu' privilegiata a quella meno privilegia bastera' 
utilizzare un semplice RET, naturalmente se non si e' usato un JMP per 
chiamare la procedura a ring piu' basso. 
Senza dover scrivere una ad una le operazioni che il processore compie durante 
un ritorno, basta dire che, dopo aver controllato il campo RPL del CS salvato, 
carica CS:EIP coi valori salvati nel nuovo stack, controlla se ci sono 
parametri da salvare e in caso affermativo aggiunge il param count a ESP che 
quindi ora punta nello stack (della proc a ring basso) a SS ed ESP salvati, 
tali valori vengono caricati in SS:ESP, e in tal modo si ri-switcha allo stack 
precedente (avvengono anche soliti check vari), quindi aggiunge il param count 
al nuovo ESP e si controllano i contenuti dei data segment register per 
assicurarsi che il DPL dei segmenti corrispondenti sia maggiore della nuova 
CPL, in caso contraro il registro di segmento e' caricato con un selettore 
nullo. 

Per la pallosissima parte dello stack penso sia tutto :) . 

Trap Gate & Interrupt Gate 
^^^^^^^^^^^^^^^^^^^^^^^^^^ 
Premetto che questi 2 metodi sono molto simili tra loro, i gate da installare 
sono identici, spieghero' la differenza alla fine della descrizione. 

Prima di iniziare a (s)parlare della IDT, di interrupt e di exception, btw, 
avviso che cerchero' di essere piu' conciso che in precedenza ;) anche perche' 
questi 2 metodi, oltre ad essere quasi uguali tra loro, sono simili a loro 
volta ai call-gate. 

Un interrupt, come saprete, puo' essere generato dall'hardware del picci' 
(attraverso l'APIC serial bus) o da un software che gira su di esso (la 
classica istruzione int n). Un'exception, invece, puo' esser generata da un 
software (istruzioni INTO, INT 3 e BOUND), ma anche dal processore (che vede 
un errore durante l'esecuzione di un programma, ad ex durante un privilege 
level check) e da un machine-check (sia esterni che interni, servono per 
controllare le operazioni dell'hardware chip interno e le comunicazioni del 
bus). 

Per ogni exception o interrupt il processore definisce un vettore (che in 
pratica corrisponde al numero di int o exception, ad ex il vettore del page 
faulte e' il 14) e le exception sono classificate e suddivise in fault, trap e 
abort (no non vi preoccupate non sto qui a spiegarne la differenza ;) ). 

La IDT (Interrupt Descriptor Table) associa a ogni exception o interrupt un 
gate descriptor (int gate o trap gate) per la procedura da eseguire (chiamata 
handler) quando tale int o tale exception si verifica. Come la GDT e l' LDT, 
l'IDT e' un'array di descrittori di 8 byte. 

Il base address della IDT e' contenuto nei bit 47 --> 16 del registro IDTR, il 
suo limite nei bit 15 --> 0 dello stesso registro. 

Ecco come si presenta un int gate o un trap gate descriptor installato 
nell'IDT. 

  31                            16 15 1413 12      8 7   5 4      0  
 +--------------------------------+--+----+---------+-----+--------+ 
 |                                |  | D  |         |     |        | 
 |          Offset 31..16         | P|  P |0 D 1 1 1|0 0 0|Reserved| 
 |                                |  |   L|         |     |        | 
 +--------------------------------+--+----+---------+-----+--------+ 

  31                            16 15                             0  
 +--------------------------------+--------------------------------+ 
 |                                |                                | 
 |        Segment Selector        |          Offset 15..0          | 
 |                                |                                | 
 +--------------------------------+--------------------------------+ 

Non penso servano troppe spiegazioni sulla struttura di questi gate: il 
selettore punta al descrittore nella GDT / LDT, l'offset e' la "distanza", in 
positivo naturalmente, dal base address, ovvero il punto in cui dovra' 
iniziare l'esecuzione dell'handler. 
I bit 4 ---> 0 sono riservati. 

Procedure di Exception e Interrupt Handling 
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ 
Quando il processore effettua una chiamata a un handler di un'exception /  
interrupt, salva lo stato del registro di EFALG, CS e EIP nello stack. Se il 
livello di privilegio dell'handler e' lo stesso, si utilizza lo stesso stack, 
altrimenti avviene uno stack-switching. 
Per ritornare dall'int / exc procedure, l'handler utilizza l'istruzione IRET 
(che rimette a posto i flag in EFLAG)... naturalmente durante tale processo di 
ritorno se era avvenuto uno stack swithing ora si torna allo stack di 
partenza. 

          IDT                                Dest Code Segment   
 +-------------------+                     +-------------------+ 
 |                   |                     |                   | 
 +-------------------+                     |                   | 
 |                   |                     +-------------------+ 
 +-------------------+                     |                   | 
 |                   |                     |Interrupt Procedure| 
 +-------------------+Offset +---+         |                   | 
 |   Int/Trap Gate   +-----> | + | ------> +-------------------+ 
 +-------------------+---+   +---+         |                   | 
 |                   |   |     ^           |                   | 
 +-------------------+   |     |           |                   | 
 |                   |   |     |           |                   | 
 +-------------------+   |     |           |                   | 
 |                   |   |     |           |                   | 
 +-------------------+   |     |           |                   | 
 |                   |   |     |           |                   | 
 +-------------------+   |     +---------> +-------------------+ 
                         |     | 
     Segmente Selector   |     | 
 +-----------------------+     | 
 |                             | 
 |                             | 
 |          GDT / LDT          | Base 
 |    +-------------------+    | Address 
 |    |                   |    | 
 |    +-------------------+    | 
 |    |                   |    | 
 |    +-------------------+    | 
 |    |                   |    | 
 |    +-------------------+    | 
 +--> | Segment Descriptor+----+ 
      +-------------------+ 
      |                   | 
      +-------------------+ 
      |                   | 
      +-------------------+ 
      |                   | 
      +-------------------+ 
      |                   | 
      +-------------------+ 

Come detto all'inzio, Trap e Int Gates (sebbene abbiano gate identici) sono 
leggermente diversi: infatti, quando si accede a un int/exc handler attraverso 
un int gate il processore pulisce il flag IF per impedire ad altri int di 
interferire con il corrente handler. Fare lo stesso tramite un trap gate non 
modifica tale flag. 

Per quanto riguarda i controlli cui privilege level, essi sono simili a quelli 
dei call gate: il processore non permette passaggi da livelli piu' 
privilegiati a livelli meno privilegiati. Il meccaniscmo cmq e' diverso in 
tali aspetti: 

- L'RPL dei vettori non e' controllata visto che i vettori non hanno un'RPL;). 
- Il processore controlla la DPL del gate solo se l'exc o l'int e' generato 
  con un INT n, INT 3 o INTO. In tal caso, il CPL deve esser minore o uguale 
  al DPL del gate per evitare che il software a ring3 possa accedere a handler 
  a ring0 semplicemente tramite un interrupt. 

Apparentemente questa seconda regola potrebbe sembrare un'ignobile bastardata 
della Intel:) ma in realta' non e' cosi' visto che, poiche' tali restrizioni 
sono troppo strette ed eventi quali int o exc accadono in modo molto 
irregolare, per evitare una violazione delle regole si possono usare un paio 
di tecniche, una delle quali dice esplicitamente che un handler puo' cmq 
essere messo in un nonconforming code segment con livello di privilegio 0, e 
funzionera' indipendentemente dal CPL a cui stava viaggiando la proc 
chiamante. 

Ed anche per i trap e int gate e' tutto. 

Task Gate 
^^^^^^^^^ 
Un altro metodo utilizzabile per passare l'esecuzione a una procedura con un 
privilegio maggiore e' utilizzare un cosiddetto "task gate". Prima di spiegare 
cos'e' un task gate, pero', tentero' di introdurre al funzionamento dei task 
in architetture i386. Per definizione, un task e' un'unita' di lavoro che un 
processore puo' terminare, eseguire e sospendere. Esso puo' essere utilizzato 
per eseguire un programma, un altro task o processo, un'utility di servizio 
del SO, un interrupt o exception handler, un'utility del kernel stesso. 

Ogni task e' formato da 2 parti: uno spazio di esecuzione e un task-state 
segment, TSS. Lo spazio di esecuzione consiste in un segmento addetto 
all'esecuzione di codice, a uno stack segment (o, meglio, a tanti stack 
segment quanti sono i livelli di privilegio) e uno o piu' data segment; il 
TSS, invece, specifica i segmenti del task e offre uno spazio in cui 
memorizzare le informazioni del task stesso. 

Un task e' identificato da un selettore alla sua TSS. Quando un task e' 
caricato per l'esecuzione, tale selettore, i limite e un segment descriptor 
della TSS sono messi nel task register. 

        TSS               +---+ 
 +---------------+ <------| + | <-------------+ 
 |               |        +---+               | 
 |               |          ^                 | 
 |               |          |                 | 
 |               |          |                 | 
 |               |          |                 | 
 |               |          |                 | 
 +---------------+ <--------+                 | 
                            |                 | 
                            |                 | 
                            |                 | 
    Visible Part            |  Invisible Part | 
 +----------------+---------+--------+--------+------+ 
 |    Selector    |   Base Address   | Segment Limit | 
 +-------+--------+------------------+--------+------+ 
         |                  ^                 | 
         |                  |                 | 
         |                  +-----------+     | 
         |                              |     | 
         |                              |     | 
         |                              |     | 
         |                              |     | 
         |                              |     | 
         |                GDT           |     | 
         |         +---------------+    |     | 
         |         |               |    |     | 
         |         +---------------+    |     | 
         |         |               |    |     | 
         |         +---------------+    |     | 
         +-------> | TSS Descriptor|----+-----+ 
                   +---------------+ 
                   |               | 
                   +---------------+ 
                   |               | 
                   +---------------+ 

Sfruttando proprio il funzionamento dei task e' possibile switchare tra 2 task 
con differenti livelli di privilegio in 2 modi: e' possibile optare per un 
trasferimento diretto a un descrittore TSS installato nella GDT che fara' poi 
riferimento al TSS corrispondente o utilizzare un task gate installato nella 
GDT, LDT o IDT. Tale task gate puntera' a sua volta a un TSS descriptor nella 
GDT che portera' ancora una volta al TSS del nuovo task. 

Il primo caso verra' trattato sotto; per quanto riguarda il secondo, abbiamo 
detto che ci vuole un task gate installato nella GDT, LDT o IDT che faccia 
riferimento a un TSS descriptor nella GDT (questi ultimi si possono mettere 
solo li'). Ecco di seguito lo schema di un TSS descriptor. 

  31           24 23 22 21 20 19    16 15 1413 12 11     8 7              0  
 +---------------+--+--+--+--+--------+--+----+--+--------+----------------+ 
 |               |  |  |  | A|  Limit |  | D  |  |  Type  |                | 
 |   Base 31:24  | G| 0| 0| V|  19:16 | P|  P | 0|        |   Base 23:16   | 
 |               |  |  |  | L|        |  |   L|  |1|0|B|1 |                | 
 +---------------+--+--+--+--+--------+--+----+--+-+-+-+--+----------------+ 

  31                                16 15                                 0  
 +------------------------------------+------------------------------------+ 
 |                                    |                                    | 
 |         Base Address 15:00         |         Segment Limit 15:00        | 
 |                                    |                                    | 
 +------------------------------------+------------------------------------+ 

I campi base, limit, DPL, i flag G e P hanno funzioni simili a quelli dei data 
descriptor. Il campo "limit" deve avere una grandezza minima di 0x67 per un 
TSS a 32bit, un byte meno della grandezza minima di un TSS. 

Ecco invece come si presenta un Task-Gate Descriptor. 

  31                                 16 15 1413 12 11     8 7              0  
 +-------------------------------------+--+----+--+--------+----------------+ 
 |                                     |  | D  |  |  Type  |                | 
 |               Reserved              | P|  P | 0|        |    Reserved    | 
 |                                     |  |   L|  |1|1|0|0 |                | 
 +-------------------------------------+--+----+--+-+-+-+--+----------------+ 

  31                                16 15                                  0  
 +------------------------------------+-------------------------------------+ 
 |                                    |                                     | 
 |        TSS Segment Selector        |               Reserved              | 
 |                                    |                                     | 
 +------------------------------------+-------------------------------------+ 

Il DPL e' come sempre il livello di privilegio del descrittore, che deve 
essere maggiore o uguale al CPL e all'RPL del gate selector. 

Caso #3 
^^^^^^^ 
Il caso #3 consiste semplicemente nel trasferimento diretto al TSS tramite 
un'istro tipo JMP/CALL che contenta come operando il TSS segment selector 
desiderato. In questo caso non vengono utilizzati alcun tipo di gate. 

In ogni caso, indipendentemente dal metodo utlizzato (uso di gate o 
trasferimento diretto) prima di effettuare un task switch il processore 
effettua le seguenti operazioni: 

1- Ricava il TSS segment selector (dal task gate o dall'operando dell'istro in 
   caso di switch diretto). 
2- Controlla che il CPL del task vecchio e l'RPL del segment selector siano 
   minori o uguali al DPL del TSS descriptor o del task gate. Le exception e 
   int (a parte gli int n) possono permettere di switchare task senza questi 
   check. 
3- Controlla che il TSS descriptor sia segnato come presente e abbia un limite 
   >= 0x67 
4- Controlla se il nuovo task e' disponibile o occupato. 
5- Controlla che i TSS vecchi e nuovi e i vari descrittori siano mappati in 
   memoria. 
6- Se e' stato utilizzato un JMP o IRET, viene cancellato il falg B, se si e' 
   utilizzata una CALL, exception o int il flag B viene lasciato attivo. 
7- Se si e' usato un IRET per lo switch viene cancellato il flag NT in 
   un'immagine temporanea degli EFLAGS che viene salvata; in caso contrario 
   non viene modificato nulla. 
8- Salva il corrente (vecchio) task nel suo TSS. 

 ...ORA AVVIENE LO SWITCH VERO E PROPRIO... 

9- Se lo switch e' stato eseguito tramite una CALL, exc o int il processore 
   setta il flag NT in un'immagine nel nuovo TSS. Se e' stato eseguito un 
   IRET, il processore rimette a posto il flag NT. Se e' stato usato un JMP 
   viene lasciato tutto cosi' com'e'. 
10- Se il task switch e' stato eseguito tramite un IRET viene mantenuto acceso 
    il flag B del nuovo TSS descriptor; in caso contrario, il flag viene 
    acceso. 
11- Viene settato il flag TS nell'immagine del CR0 nel nuovo TSS. 
12- Viene caricato il task register col selettore e descrittore del nuovo TSS. 
13- Viene caricato il nuovo stato dello stack dal proprio TSS. 
14- Si inizia con l'esecuzione del nuovo task. 

-= CONSIDERAZIONI FINALI E SALUTI =- 

Bene direi proprio che per stavolta possa bastare, abbiamo fatto una 
carrellata niente male su segmentazione, paging e meccanismi di protezione 
nel trasferimento tra data segment e code segment diversi... quindi termino 
qui, anche perche' effettivamente il tute penso sia stato abbastanza palloso 
da leggere, anche se queste info (che, ripeto, sono state prese soprattutto 
dai manuali Intel detti all'inizio) ritengo che siano sempre molto 
interessanti da conoscere. 

Detto questo, i saluti finali. 

Prima di tutto un salutone va a syscalo, col quale ho iniziato questa 
"avventura" del racl che speriamo possa risultare positiva per molti 
programmatori e reverse engineer, e a LittleJohn, senza il quale sarebbe 
tutto molto piu' difficile e che si sta dando non poco da fare pure lui. 
Saluto anche tutti gli iscritti alla ml del racl, che speriamo inizi a 
pullulare di mail (no spam pero';) ) dopo le vacanze estive. 
Un grazie va a \sPIRIT\ che ci ha concesso l'host per il sito e un salutone 
anche a tutti quelli del s0ftpj e BFi per averci offerto uno spazio in questa 
e-zine. 
Saluti anche ai vari frequentatori di #crack-it e della uic, in particolare 
AndreaGeddon (che ha letto per primo questo tute ;) ), +MaLa, BlackDruid, 
[aLT255], TiN_MaN, Byte, xOA, Byte, phobos, Genius, Kill3xx, Sinoid, insomma 
tutti quelli con cui parlo piu' di frequente, tutti quelli che conosco e non 
conosco ma vorrei conoscere, tutti quelli che conoscero', tutti quelli che mi 
hanno dato e mi daranno consigli, tutti quelli a cui do e daro' consigli, e 
cosi' via. 
Byz, 

Ritz for * 

http://racl.immagika.org 
ritz@freemail.it 
racl@alfatechnologies.it 

"E alzando la testa vedrai 
 che gli avvoltoi non ti mollano mai..." (from Fegato e Cuore, Punkreas) 

 
============================================================================== 
---------------------------------[ EOF 19/21 ]-------------------------------- 
==============================================================================
BFi numero 09 anno 3 file 19 di 21

Share this article

Let's discover also

BFi numero 04 anno 1

BFi numero 10 anno 4 file 01 di 18

BFi numero 06 anno 2

BFi numero 11 anno 6 file 01 di 15

BFi numero 08 anno 3 file 07 di 28

BFi numero 08 anno 3 file 28 di 28

BFi numero 05 anno 2

BFi numero 09 anno 3 file 09 di 21

BFi numero 07 anno 2 file 01 di 22

BFi numero 03 anno 1

Recent Articles

Classic Christmas Cartoons from the '30s and '40s

Berlin :)

The First Earth's Circumnavigation by Antonio Pigafetta

Yak Facts Issue #10: It's Flavorific!

Yak Facts Issue #9: Now with Ginseng

Yak Facts Issue #8: As Seen On TV

Yak Facts Issue #7: Caution: Live Animals

Yak Facts Issue #6: Repeat as necessary

The Esoteric Origin of the Universal Weekly Sequence

Yak Facts Issue #5: Repeat as necessary

Recent Comments