cours/content/systemes_exploitation/3-synchronisation/index.md

15 KiB
Raw Permalink Blame History

title date tags categories
Systèmes d'exploitation : Les outils de synchronisation 2021-09-24
système
sémaphore
synchronisation
thread
Systèmes d'exploitation
Cours

Dans ce chapitre, nous allons étudier différents problèmes (et solutions) relatives à la synchronisation :

  • l'exclusion mutuelle des sections critiques
  • le problème des lecteurs - écrivains
  • le problème des producteurs consommateurs
  • le problème des points de rendez-vous

L'exclusion mutuelle

Les processeurs savent juste faire des opérations de lecture / écriture de façon atomique. Mais dans le cadre de l'incrémentation d'une variable comme nous l'avions vu dans le chapitre traitant des processus légers [en lpro]({{< ref"../../progsys/3-processus/index.md">}} "Les thread") ce n'est pas suffisant. Il nous faut donc utiliser l'exclusion mutuelle.

L'algorithme de Peterson datant de 1981 utilise l'attente active pour arriver à ses fins. Un problème se pose alors: le temps processeur est gaspillé! De plus, cet algorithme est valable pour deux threads seulement.

//Gary L. Peterson, 1981. Works with two processes : #0 and #1
bool flag [2] = { FALSE, FALSE };
unsigned turn = 0;
void enter_sc ()
{
    flag[me] = TRUE;
    turn = me;
    wait (flag[1  me] == FALSE or turn != me);
}
void exit_sc ()
{
    flag[me] = FALSE;
}

Nous avons donc besoin d'une solution non seulement valable pour un nombre indéfini de fils d'exécutions, mais aussi plus efficace.

Une solution matérielle

Vu du processeur, une opération atomique ne peut être interompue par une autre. Les processeurs modernes en comportent un certain nombre. La solution vient donc des fabricant de processeurs.

Pour forcer l'exclusion mutuelle, nous en avons besoin d'une seule: Test_and_Set. C'est donc une instruction matérielle, voici une pseudo implémentation en C :

int test_and_set (int *verrou){
     // -- Début de la partie atomique --
     // Ceci est du pseudocode, montré ici juste pour illustrer le principe.
     // S'il était utilisé normalement dans un compilateur,
     // les garanties nécessaires d'atomicité, non-usage de cache, 
     // non-réorganisation par l'optimiseur etc.
     // ne seraient pas fournies.
     int old = *verrou;
     
     // positionne le verrou à 1 pour dire qu'on veut occuper la SC (nb: ne 
     // change pas sa valeur si *verrou vaut déjà 1 car un autre processus 
     // est en SC)
     *verrou = 1;
     // -- Fin de la partie atomique --

     // renvoie l'ancienne valeur (c'est-à-dire 1 (vrai) si et seulement si il 
     // y avait déjà un processus en SC à l'entrée dans test_and_set)
     return old; 
}

Ce code source est issu de la page Wikipedia sur Test and Set, voyons maintenant cpmment l'utiliser:

int lock = 0;
void enter_sc ()
{
    while (test_and_set(&lock) == 1)
        while (lock)
        /* wait */ ;
}
void exit_sc ()
{
    lock = 0;
}

Le problème d'accès à la section critique est réglé. Nous avons tout de même toujours un problème d'attente active... Car le noyau ne peut savoir qui a poser le verrou. Les threads attendant la libération de la section critique seront toujours "promus" sur le processeurs et consomerons du temps. Il faut donc trouver une solutions pour endormir les threads attendant d'entrée en section critique.

La solution est donc un appel système permettant d'endormir (et réveiller) les threads en attente. Car seul le noyau peut endormir les processus.

Les sémaphores

On en a déjà parlé en lpro. Ce sont des outils de haut-niveau, implémentés dans le noyau. Il se compose d'une structures contenant un entier positif, d'une liste de processus en attente et de deux méthodes P() et V(). Il ont été inventés en 1962 par E. Dijsktra.

Les méthodes permettent :

  • P(): attendre un jeton, le prendre lorqu'il devient disponible et continuer son exécution.
  • V(): remettre un jeton

Lorqu'un thread appelle V(), le sémaphore va reveiller les threads référencés dans la liste d'attente.

Comme seul le noyau peut arrêter et reveiller des processus, les sémaphores sont donc implémentés sur le noyau.

Implementer un rendez-vous entre plusieurs processus.

Il faut faire en sorte que plusieurs processus s'attendent avant de continuer leurs exécutions.

Voici le code implementant notre fonction barrière. Celle ci permet à plusieurs processus de se donner un rendez-vous. On utilise des sémaphore pour implementer une sorte de mutex.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 // point 1 Semaphore wait[2](0), mutex[2](1); int count[2] = { 0, 0 }; void barrier (int i) { // point 2 P(mutex[i]); count[i]++; if (count[i] < N) { V(mutex[i]); P(wait[i]); } else { count[i] = 0; V(mutex[i]); // point 2 for (int k=0; k < N-1; k++) V(wait[i]); } }

Explication de code :

  • point 1: Utiliser des tableaux de 2 éléments permet de réutiliser notre fonction barrier() pour fixer plusieurs rendez-vous. Il suffit alors d'apeller à tous de rôle barrier(0); et barrier(1);. Sans ça un processus un peu trop rapide pourrait prendre le sémaphore de la seconde barrière et bloquer alors pa première.
  • point 2: l'incrementation de notre compteur doit se faire dans un "mutex" afin d'éviter que plusieurs processus y accèdent en même temps. On relache notre sémaphore "mutex" ligne 11.

Dans la vraie vie, on n'utilise pas de barrière, on utilisera plutôt signal() et wait(). Mais nous verrons ça plus tard.

Le problème des producteurs / consommateurs avec des sémaphore

Le principe ici est d'implémenter une une structure de type FIFO partagée entre plusiers processus. Cette structure a une capacité de MAX élements. Nous allons utiliser deux sémaphores: un pour le producteur et un pour le consommateurs.

Un producteur appelle la fonction put(element) et un consommateurs element get().

#define MAX 8
semaphore conso(0), prod(MAX)

// Pour le consommateur
P(conso);
elemet = get();
V(prod);

// Pour le producteur
P(prod);
put(element);
V(conso);

Le fonctionnement est ici assez simple :

  • Pour le consomateur:
    1. il prend un jeton sur le sémaphore conso s'il est disponible (ou attend qu'il le soit)
    2. consomme l'élement
    3. on relache celui sur prod. Cette dernière action permet de relancer la production si la file était pleine (prod en attente).
  • pour le producteur:
    1. on décrémente la sur la production (prod). Cette action permet d'arrêter la production s'il n'y a plus de jeton disponible.
    2. On produit ensuite l'élément
    3. puis on relache le sémaphore conso. On réveille ansi notre consommateur s'il dormait en attendant la disponibilité d'un élement

Multiple producteurs et consomateur

Dans la vraie vie, il y souvent plusieurs consomateurs / producteurs. Le problème devient alors plus complexe...

Le code ressemble à celui ci-dessus, saut qu'il faut faire attention à ce qu'il y ai un seul consomateur à la fois sur get() et un seul producteur sur put(element). nous allons donc rajouter deux "mutex" :

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 #define MAX 8 semaphore conso(0), prod(MAX), mutex_c(1), mutex_p(1); // Pour le consommateur P(conso) P(mutex_v); element = get(); V(mutex_v); V(prod) // Pour le producteur P(prod); P(mutex_c); put(element); V(mutex_p); V(conso)

Problème des lecteurs rédacteurs

Ce problème ressemble à celui des producteurs / consommateurs.

  • lecteur: processus qui lit des données sans les modifier. Il n'y a pas de problème d'exclusion mutuelle : plusieurs lecteur peuvent lire la même donnée.
  • rédacteur: processus qui modifie des données. Exclusion avec non seulement les autres rédacteurs mais aussi les lecteurs.

Voici le code pour les lecteurs:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Semaphore write_token(1); int n_reader = 0; Semaphore mutex_r(1); //Waiting Room help us to make our implememtatoion Fair Semaphore wait_room(1); // Reader P(wait_room); P(mutex_r); // Pathfinder // Equivalent to nbr++; if nbr == 1 if (++nbr == 1) { P(write_token); } V(mutex_r); V(wait_room); read(); P(mutex_r) if(--nbr == 0) // last to leave V(write_token); V(mutex_r);

Pour les lecteurs, il faut envoyer un éclaireur afin de savoir si un lecteur est actif. Le problème est similaire à celui des producteur consommateurs sauf qu'il faut savoir si notre lecteur est le premier (ligne 12)

De plus, afin que notre algorithme ne privilegie pas les lecteurs au détriment des rédacteur; ils pourraient même ne jamais rendre la main aux rédacteurs, nous devons mettre en place une salle d'attente (ligne 8).

Voici le code pour les rédacteurs:

1 2 3 4 5 P(wait_room); P(write_token); V(wait_room); write(); V(write_token);

Ce code est plutôt clair et ne comporte rien de particulier.

Les moniteurs d'Hoare

Les moniteurs sont des primitives de synchronisation initialement proposées dans les langages objet. Il est utilisé actuellemt dans des langages tel que ADA ou Java et implementé au sein de systèmes d'exploitation.

Le moniteur se positionne sur une classe et les mutexes sur ses methodes et sont basés sur des variables condition. elle sont forcement privée et inaccessible à l'exterieur de la classe.

Monitor class m {
private int i = 1;
private condition c;
public method f() { // cette accolade signifie P(mutex)
    code_before();
    wait(c);
    code_after();
} // et celle-ci V(mutex)

public method g() {
    signal(c);
}

Il sont différents des sémaphores, il n'y a pas de jeton à prendre. Leur implémentation dans les systèmes d'exploitation est différente, elle se fait par les les types mutex_t et cond_t:

mutex_t m;
mutex_lock(mutex_t *m);
mutex_unlock(mutex_t *m);

cond_t c;
cond_wait(cond_t *c, mutex_t *m);
cond_signal(cond_t *c);
cond_bcast(cond_t *c);

Et voici un exemple d'utilisation:

mutex_t m;
cond_t c;

void c(){
    mutex_lock(&m)
    if (...){
        cond_wait(&c, &m);
    }
    mutex_unlock(&m);
}

void g(){
    mutex_lock(&m);
    ...
    cond_signal(&c);
    ...
    mutex_unlock(&m);
}

bonne pratiques

  • Pas de variable condition à l'extérieur d'un moniteur, c'est aussi conseillé pour les cont_signal et cond_bcast.
  • Les mutex ont un propriétaire.

Retour sur le problème du rendez-vous

L'idée est de bloquer les N-1 processus, le dernier (N) reveillera tous les autres.

mutex_t m;
cond_t wait;
int nb = 0;

void barrier ()
{
    // notre variable condition et bien "protégée" par un mutex
    mutex_lock(&m);
    nb++;

    // on stoppe les n-1 processus
    If (nb < N)
        cond_wait (&wait, &m);
    else {
        // le dernier réveille tous les autrespar un Bcast
        cond_bcast (&wait);
        // et on positionne nb à 0 permettant ainsi de réutiliser cette fonction
        // barrière.
        nb = 0;
    }
    mutex_unlock(&m);
}

En plus d'être plus simple, cette fonction est réutilisable de multiples fois sans le petit "hack des tableaux utilisé pour les sémaphore.

Producteur / consomateurs avec un moniteur

tout comme les barrières, le code est ici bien plus simple. Et bien entendu il n'y a pas d'attente active...

Dans les codes ci-dessous, il est préféfable d'utiliser while (nbe ...) plutôt qu'un if (nbe ...). Si le processus se reveille, il faut s'arrurer que les autres n'on pas déjà pris toutes les places disponibles.

Voici les variables nécessaires aux producteurs et au consommateurs.

#define MAX 8
mutex_t m;
cond_t cons, prod;
int nbe = 0;

pour le producteur

mutex_lock (&m);

/* si notre file est pleine, alors le thread passe en sommeil
   et attend le reveil par un cond_signal                      */
while (nbe == MAX) {
    cond_wait(&prod);
}
put(element);
nbe++;
cond_signal(&cons)
mutex_unlock (&m);

pour les consomateurs

mutex_lock (&m);

/* Et inversement si notre file est vide, rien à consommer, on 
   attend un reveil par un cond_signal dès qu'il y a production */ 
while (nbe == 0) {
    cond_wait(&cons)
}
element = get();
nbe--;
cond_signal(&prod);
mutex_unlock (&m);

Les lecteurs / rédateurs

Nous commençons ici par créer une structure et l'affecter à une variable my_lock:

typedef struct{
    mutex_t m;
    cond_t c_read, c_write;
    unsigned nb_reader = 0;
    unsigned nb_writer = 0;
} rwlock_t;

rwlock_t mylock;

Du côté des lecteur

void rwl_readlock(rwlock_t *l)
{
    mutex_lock(&l->m);

    /* tout comme le problème des produteurs / consomateurs, un 
       while est préférable ici                                 */
    while(l->nbw > 0) {
        cond_wait(&l->cr, &l->m);
    }
    l->nbr++;
    mutex_unlock(&l->m);
}

void rwl_readunlock(rwlock_t *l)
{
    mutex_lock(&l->m);
    l->nbr--;
    if(l->nbr == 0) {
        cond_signal(&l->cw);
    }
    mutex_unlock(&l->m);
}

Et voici son l'utilisation  :

```c
rwl_readlock(mylock);
read();
rwl_readunlock(mylock);

du côté des rédacteurs

void rwl_writelock(rwlock_t *l)
{
    mutex_lock (l->m);
    /* Comme ces deux nombres sont des entiers strictement positifs 
       on peut utiliser l'adition afin d'attendre en cas de présence
       de lecteurs ou de rédacteur.
       On évite ainsi une double condition :
       while ( l->nb_reader > 0 || l->nb_writer > 0)                  */
       
    while( l->nb_reader + l->nb_writer > 0 ) {
        cond_wait (&l->cw, &l->m);
    }
    l->nbw++;
    mutex_unlock (&l->m);
}

void rwl_writeunlock(rwlock_t *l)
{
    mutex_lock (l->m);
    l->nbw--;
    cond_signal (&l->cw);
    rwl_writeunlock (&cool_lock);

    /* On utilise le bcast pour les lecteur car on peut *tous* 
    les réveiller (+ieurs lecteurs possibles en même temps           */
    cond_bcast(&l->c_read);
    /* mais on ne reveille qu'un seul écrivain                       */
    cond_signal(&l->c_write);
    mutex_unlock (&l->m);
}

Et voici son utilisation:

rwl_writelock(mylock);
write();
rwl_writeunlock(mylock);

conclusion

Les sémaphores et moniteurs sont implémentés au niveau du système d'exploitation et utilient le matériel sous-jacent (test_and_set). Ces appels sont coûteux, nécessitent des changements de contexte. Dans les systèmes modernes, on leur préfèrera un mix de primitive de synchronisation et de polling (attente de variable). Ainsi un thread attendra une valeur / variable pendant quelques cycles et se bloquera si elle n'est pas disponible.

Les moniteurs de Hoare sont en général préférés par les programmeurs cas comme on l'a vu, ils sont plus simple à implémenter.

Il est intéressant aussi de parler des FUTEX, apparus en 2003 sur Linux et plus tard sous Windows 8 (sous l'appelation wait_on_address et breveté en 2013).

Ils utilisent des opérations atomiques sur des variables entières de 32bits en espace utilisateur et deux operation bloquante si nécessaires:

sys_futex(&var, FUTEX_WAIT);
sys_futex (&var, FUTEX_WAKE);