L'authentification par smartcard et Infrastructure par clé publique
-------------------------------------------------------------------

## Introduction

Depuis toujours, l'authentification sur des systèmes informatique est
principalement régie par l'utilisation du couple identifiant / mot de passe.
C'est pourtant un facteur d'identification peu fiable : utilisation du même mot
de passe pour plusieurs - voir tous les - service(s), faible, progrès techniques
rendant leur cassage plus efficaces etc. Dans un communiqué de presse du W3C et
de l'Alliance FIDO :

> Les mots de passe volés, faibles ou par défaut
> sont à l'origine de 81% des atteintes à la protection des données.

Il existe des solutions pour pallier ces faiblesses, avec notamment
l'introduction d'un ou plusieurs autres facteurs d'authentification (TOTP, SMS
etc.), ou les gestionnaires de mots de passe (keepass, LastPass ...).

L'authentification par certificats semble être une alternative intéressante aux
traditionnels mots de passe. Nous allons dans ce mémoire parler de la norme
X.509, des infrastructures à clefs publiques, des smartcards et des attaques
connues.

## La norme X.509

La norme X.509 régissant les formats pour les certificats à clé publique. Elle
est définie par l'Union Internationale des Télécommunications et établie :

 - Le **format de certificat**
 - La **liste de révocation** des certificats
 - leurs **attributs**
 - un **algorithme de validation de chemin de certificats**

Contrairement à OpenPGP qui repose sur une toile de confiance, X.509 repose sur
les autorités de certifications : un tiers de confiance délivre les certificats
et fournit les moyens de les vérifier.

Les certificats X.509 sont donc composé de deux éléments : une partie publique
et une partie privée. Ces certificats peuvent assurer plusieurs rôles

### PKI - Infrastructure à clefs publiques

Une infrastructure à clefs publiques est un ensemble d'éléments, qu'ils soient
humain, matériels ou logiciels, destinés à gérer les clefs publiques des
utilisateurs d'un système.

Cette infrastructure est utilisée pour créer, gérer, distribuer et révoquer des
certificats.

#### La PKI elle va te crypter l'Internet du digital

Sur Internet, les différentes autorités de certifications assurent les rôles de
PKI : Elle fournissent l'infrastructure pour gérer les certificats permettant
le fonctionnement du chiffrement TLS.

## Une SmartCard?

Maintenant que nous avons parlé de la norme X.509, nous allons parler de notre
**startcard**. D'après Wikipédia ([source](l_sc-wiki)) :

> Une carte à puce est une carte en matière plastique, voire en papier ou en
> carton, de quelques centimètres de côté et moins d'un millimètre d'épaisseur,
> portant au moins un circuit intégré capable de contenir de l'information. Le
> circuit intégré (la puce) peut contenir un microprocesseur capable de traiter
> cette information, ou être limité à des circuits de mémoire non volatile et,
> éventuellement, un composant de sécurité (carte mémoire).

Vous utilisez tous les jours une SmartCard : votre carte SIM, votre carte
bancaire...

Les smartcards qui nous intéressent ici contiennent un espace de stockage, un
microprocesseur et un coprocesseur pour accélérer les opérations
cryptographiques.

![Fonctionnement d'une smartcard](./files/smartcard.svg)

Comme vous pouvez le voir, il n'y a pas de connexion directe entre les contacts
et la mémoire. Pour des raisons évidente de sécurité, tout passe par le système
d'exploitation de la carte. Il en existe une multitude (JavaCard Operating
System, MULTOS, OpenPGP Card, Gnuk etc.)

### Création, stockage et utilisation de certificats

Dans le cas qui nous intéresse, la carte à puce permet de stocker le certificat
et de l'utiliser. Lors de son utilisation, un code PIN sera demandé, le
certificat contenu pourra alors être utilisé pour s'authentifier, signer ou
chiffrer.

Certaines smartcards permettent la génération de certificats.

### Les "normes" PKCS

PKCS pour *Public Key Cryptographics Standard* est un ensemble de spécifications
portées au départ par la Société *RSA Security* afin d'implanter les techniques
liées à la cryptographie par clé publique. Par la suite, beaucoup de ces
spécifications sont devenues des standard par le biais de RFC écrites par le
groupe de travail PKIX[^n_pkix] de l'IETF.

Les plus utiles ici sont :

 - **PKCS#7** : standard de syntaxe de message cryptographiques, normalisé par
     les RFC 2315 et 5653.
 - **PKCS#11** : API définissant une interface générique pour les périphériques
     cryptographiques.

[^n_pkix]:Public Key Infrastructure X.509, groupe de travail de l'IETF dédié aux
  infrastructures à clé publiques

### Le Web plus accessible aux authentifications par certificats

Aujourd'hui, l'un des principaux défauts de l'authentification par certificats,
c'est qu'elle n'est pas déployée largement : seul un petit nombre de services
l'utilisent.

Cependant, supporté par le constat que les mots de passe perdent en efficacité,
le standard WebAuthn - pour *Web Authentication* - a récemment été créé et
publiée par le W3C. Ce standard définit une API destinée aux navigateurs, aux
applications web et aux autres plateformes nécessitant une authentification
forte basée sur clés publiques.

Les grands du Web ont déjà ont déjà mit en place le support de WebAuthn sur
leurs outils : Windows 10, Android, Google Chrome, Mozilla Firefox,
Microsoft Edge et Safari. L'apparition de ce standard va sans aucun doute
encourager une adoption plus large de ce type d'authentification.

## Attaque sur les smartcard

### Attaques par canal auxiliaire

Les attaques par canal auxiliaire regroupe les attaques qui tentent
**d'exploiter des failles sur l'implémentation** des procédures de sécurité
plutôt que sur les procédures elles-mêmes. Voici une liste de types d'attaques
par canal auxiliaire sur lesquels on va s'attarder car elles touchent les
smartcard :

#### Attaque par sondage

Particulièrement invasive, elle consiste à détériorer suffisamment une puce pour
avoir un accès physique aux bus et y lire les bits qui y passent. Il est à noter
que cette attaque est très difficile à mettre en place car elle nécessite du
matériel de pointe (oscilloscope très précis,
chronométrage du passage des bits...), de la rigueur et de la précision sur la
détérioration de la puce, etc.

#### Analyse de consommation

En fonction des opérations résolues par un processeur, sa consommation en
énergie diffère. En étudiant les variations d'énergie utilisée par un lecteur de
cartes, il est possible de trouver des indices sur la clé privée, sur un
échantillon suffisant. Aujourd'hui, cette attaque peut être aisément
contrecarrée en apposant du bruit sur le circuit ou en le blindant.

#### Analyse d'émanations électromagnétiques

Semblable à l'analyse de consommation, à ceci prêt qu'on ne s'attache pas, cette
fois ci à, l'énergie consommée mais au rayonnement électromagnétique émis par un
appareil. A l'instar de la consommation en énergie, le rayonnement n'est pas
le même en fonction des opérations exécutées par le terminal. L'étude du
rayonnement thermique peut s'apparenter à une analyse d'émanations
électromagnétiques.

#### Attaque par faute

Le principe ici est de provoquer des erreurs pour que le système réagisse de
manière inhabituelle sur les opérations de chiffrement et laisse des indices
sur la clé de chiffrement.

#### Attaque temporelle

Le temps que met un algorithme à s'exécuter donne parfois des indices sur la
constitution d'une clé entrée en paramètre dans cet algorithme, comme le nombre
de bits à 1. A elle seule, cette attaque ne donne pas beaucoup d'informations,
mais elle peut être combinée avec d'autres attaques pour en augmenter son
efficacité.

### Attaques sur les PKI

Même si elle ne touchent pas directement les smartcards, Il est intéressant de
parler des attaque sur les infrastructures à clé publiques.

#### Collision MD5

Le MD5 pour *Message Digest 5* est un algorithme de hachage cryptographique
permettant d'obtenir l'empreinte d'un fichier / d'une chaine de caractères. Elle
a été inventée par **Ronald Rivets** en 1991 pour succéder à MD4.

Il doit être considéré comme obsolète depuis 1996, années de découverte d'une
faille dans l'algorithme ouvrant la voie à des collisions. En 2004 une équipe de
chercheurs chinois menés par la mathématicienne Wang Xiaoyun [démontre la
faisabilité][l_md5_2005] d'une collision complète. Mais cette attaque n'est pas
encore suffisamment sophistiquée pour être utilisée sur un cas concret. Wang,
Lenstra et de Wegner feront la [démonstration de leur attaque][l_md5_2006] sur
deux certificats X.509 différents ayant la même signature MD5 en 2006.

[l_md5_2005]:https://eprint.iacr.org/2004/199.pdf
[l_md5_2006]:https://www.win.tue.nl/~bdeweger/CollidingCertificates/

##### Attaque par collision

Une attaque par collision est menée sur une fonction de hashage cryptographique
afin trouver **deux entrées différentes donnant lieux au même résultat**. Comme
la plupart des fonctions de signature électronique se font sur le *condensat*
d'un document plutôt que sur le document lui-même. Ainsi s'il est possible de
produire deux documents avec le même *condensat*[^n_hash], leurs signatures
seront strictement identiques. Il suffit alors d'envoyer à l'autorité de
certification le document légitime et **copier la signature obtenue sur le
document frauduleux**.

[^n_hash]:Le mot français pour *hash*

##### Attaque par collision avec préfixe choisi

Dans le cadre de certificats, les choses se compliquent un peu : c'est
**l'autorité de certification qui génère le certificat** en fonction des
informations contenues dans le CSR. L'attaquant doit alors manipuler les données
contenues dans le CSR qu'il envoie et y intégrer des blocs de collision pour
annuler les différences entre les *condensats* du certificats obtenu et celui
forgé.  Il va jouer sur le préfixe du CSR, d'où le nom de l'attaque.

Ce type d'attaque n'est cependant pas aisé, l'attaquant devra **anticiper
certaines informations** qui seront intégrées dans le certificat produit par
l'autorité. Certaines pourront être influencées comme le champ *CN*, d'autres
récupérées sur d'autre certificats signés par la même autorité (le contenu des
champs *issuer* par exemple) et enfin d'autres devront être
"devinées" [^n_devinees]  - numéro de série du certificat et date d'expiration -

[Une telle attaque a été démontrée][l_md5_2008] en décembre 2008 par une équipe
de chercheurs menée par Sotirov et Stevens. Ils ont ainsi pu obtenir un
certificat à même de signer n'importe quel autre certificat et reconnu par les
principaux navigateurs de l'époque.

Une technique similaire a été utilisée par le malware *Flame* découvert en 2012.
Il usurpait une signature de code Microsoft pour se propager au travers de
Windows Update.

[l_md5_2008]:https://www.win.tue.nl/hashclash/rogue-ca/

[^n_devinees]:Prédites serait plus adapté, dans l'attaque menée par Sotirov et
Stevens, l'équipe de chercheurs a réussi prédire ces deux éléments en étudiant le
fonctionnement de l'autorité de certification utilisée.

### Attaque par oracle de padding

Ce type d'attaque a été mené avec succès sur différents périphériques
cryptographiques par un équipe de recherche internationale. Leurs travaux a
donne lieu ã une publication en avril 2012.

Ils on pu ainsi extraire les clefs privées de la plupart des périphériques
disponibles sur le marché quel que soit leurs marques.

La première démonstration pratique de cette attaque a été faite par Daniel
Bleichenbacher alors chercheur en cryptographie chez *Bell Laboratories*

#### Comment fonctionne t-elle?

##### Le chiffrement par bloc

Avant de rentrer plus en détail dans le fonctionnement de l'attaque par oracle
de padding, il est nécessaire d'expliquer le fonctionnement du chiffrement par
bloc. Il existe une multitude de façon de chiffrer par bloc, nous resterons sur
le mode CBC *Cipher Block Chaining*.

![Fonctionnement du chiffrement par bloc en mode CBC](./files/CBC.svg)

Pour éviter l'apparition de motifs dans le bloc chiffré qui pourrait faciliter
la création de "dictionnaire de code", le mode *CBC* utilise le précédent bloc
chiffré pour réaliser une opération booléenne avec le bloc actuel en clair avant
de le chiffrer. Pour le premier bloc à envoyer, *CBC* utilise un vecteur
d'initialisation.

Contrairement au chiffrement de flux, le chiffrement par bloc nécessite une
taille de donnée définie en entrée. Si les données sont trop importante, il faut
les découper, si elle sont plus petite on utilisera la technique du padding.

```
txt_dechiffre[n] = dechiffrer(c_block[n]) ⊕ c_block[n-1]
```

##### Le padding

![Fonctionnement du padding](./files/pagging.svg)

Dans notre exemple, notre bloc doit faire 128 bits mais les données ne
représente que 104 bits [1]. Nous allons donc rajouter trois octets avec pour
valeur hexadécimale `0x03` qui représente le nombre d'octets manquant [2].

##### L'attaque par oracle de padding

Une **oracle de padding** est un mécanisme prenant un bloc chiffré en entrée,
de déchiffre et averti l'utilisateur si le padding est correct ou non.

Le chiffrement par bloc en mode *CBC* a un énorme défaut : l'intégrité des
messages n'est pas vérifiée. Du coup un attaquant peut modifier le résultat
de `txt_dechiffre[n]` en modifiant `c_block[n-1]`, ou tout simplement en le
forgeant à notre convenance.

Prenons `X` comme bloc de chiffrement forgé pour l'occasion, et `c_block[a]`
bloc de chiffrement à attaquer, nous pouvons écrire :

```
t_clair_hack[a] = dechiffrer(c_block[n]) ⊕ X
```

Nous savons aussi que :

```
c_block[a] = chiffrer(txt_clair[a] ⊕ c_block[a-1])
```

Donc on peut écrire :

```
t_clair_hack = dechiffrer(chiffrer(txt_clair[a] ⊕ c_block[a-1])) ⊕ X
# et en simplifiant
t_clair_hack = txt_clair[a] ⊕ c_block[a-1] ⊕ X
```

Cette équation se compose de deux éléments que nous avons en notre possession :
`X` notre bloc forgé et `c_block[a-1]` notre avant-dernier bloc, et deux
éléments inconnus : `t_clair_hack` le résultat en clair de la manipulation de
notre attaque et `txt_clair[a]` le résultat du déchiffrement de `c_block[a]`.

Il n'est plus question ici de chiffrement, mais de simples opérations booléenne.

Comme nous avons accès à une **oracle de padding** nous n'avons qu'a tester
toutes les valeurs du dernier octet de `X` jusqu'à obtenir un padding correct
(`0x01`). Dans le cadre de notre block de 16 octets :

```
0x01 = txt_clair[a][15] ⊕ c_block[a-1][15] ⊕ X[15]
```

Il ne nous reste plus qu'une inconnue, nous pouvons résoudre l'équation.

Il suffit de procéder ainsi pour les 16 octets de notre bloc pour le déchiffrer
en entier, et ainsi de suite...

##### Et son utilisation contre les smartcard

C'est bien entendu une version simplifiée de l'attaque par padding oracle, mais
elle permet de comprendre son fonctionnement. Elle fut au centre des travaux de
recherche menés par Romain Bardou, Riccardo Focardi, Yusuke Kawamoto, Lorenzo
Simionato, Graham Steel, et al. donnant lieu à une publication. Ces travaux
permirent, en 2012, **l'extraction des clés privées** de beaucoup de
périphériques de cryptographie (PKCS#11) de marques différentes. Les chercheurs
ont par ailleurs largement améliorer les algorithmes de Bleichenbacher pour
accélérer sensiblement les performances, surtout sur les appareils peu puissant
comme les smartcards.

## Conclusion

L'authentification par smartcards liée à une PKI est intéressante à bien des
égard, réservée jusque là au monde de l'entreprise de par la complexité de
l'infrastructure à déployer. Mais l'apparition de périphériques comme les
*Yubikey* et la nécessité de pallier aux problèmes des mots de passes pousse les
entreprises touchant le grand public à trouver des solutions; *WebAuth* en est
la preuve (mais sans la partie PKI).

Il est cependant utopique de penser que les smartcards résolvent tous les
problèmes, bien au contraire. Nous avons vu qu'il est possible d'attaquer
directement l'infrastructure de clés[^n_infra]. Mais il est est aussi possible
d'attaquer le périphérique lui même: n'oublions pas que celui-ci est complexe,
équipé de plusieurs processeurs et d'un système d'exploitation, agrandissant la
surface d'attaque[^n_yubikey].

N'oublions pas aussi qu'un périphérique se vole; et si la plupart des smartcards
sont résistante à l'ouverture par la force, une attaque ciblée couplée à de
l'ingénierie sociale bien menée pour retrouver le code PIN reste possible.

[^n_infra]:Google a publié le 23 février 2017 un article annonçant la première
  collision sur du SHA1. https://security.googleblog.com/2017/02/announcing-first-sha1-collision.html)

[^n_yubikey]:La Yubikey 4, et d'autre périphériques cryptographiques sont
  touchés par ROCAT, une faille touchant des librairies utilisées par des puces
  de la marque Infineon Technologies AG et permettant de prédire la clé privée
  grâce à la clé publique - CVE-2017-15361. https://crocs.fi.muni.cz/public/papers/rsa_ccs17

## Bibliographie

Stéphane Bortzmeyer *[RFC 5280: Internet X.509 Public Key Infrastructure
Certificate and Certificate Revocation List (CRL)
Profile](https://www.bortzmeyer.org/5280.html)*

Ivan Ristić *[BulletProof SSL and TLS](https://www.feistyduck.com/books/bulletproof-ssl-and-tls)*

Pixis *[Padding oracle](https://beta.hackndo.com/padding-oracle/)*

Romain Bardou, Riccardo Focardi, Yusuke Kawamoto, Lorenzo Simionato, Graham Steel, et al..
*Efficient Padding Oracle Attacks on Cryptographic Hardware.* [Research Report] RR-7944, 2012,
pp.19. <hal-00691958v2>

Marc Zaffagni *[CNETfrance.fr : Vers la fin des mots de passe ? WebAuthn est
désormais un standard du web](https://www.cnetfrance.fr/news/vers-la-fin-des-mots-de-passe-webauthn-est-desormais-un-standard-du-web-39881531.htm)*

W3C *[Web Authentication: An API for accessing Public Key Credentials](https://www.w3.org/TR/webauthn)*

Wikipedia *[Attaque de collisions](https://fr.wikipedia.org/wiki/Attaque_de_collisions)*,
*[Attaque par canal auxiliaire](https://fr.wikipedia.org/wiki/Attaque_par_canal_auxiliaire)*