First part of TD9

This commit is contained in:
Yorick Barbanneau 2023-04-20 02:08:52 +02:00
parent 553cdc440c
commit 4907f833e2
5 changed files with 537 additions and 0 deletions

View file

@ -0,0 +1,480 @@
---
title: "Sécurité logicielle : TD 9 Hackme"
date: 2023-04-14
tags: ["Assembleur", "x86"]
categories: ["Sécurité logicielle", "TD"]
author:
- Yorick Barbanneau
---
## Level 0
### Première exécution du programme
=
Il nous demande ̀a l'utilisateur une saisir, lorsque je rentre un texte, il
répond `Nope`:
```
./hackme
This is level 0, welcome! What do you have to say?
bonjour
Nope!
```
### Avec strace
Lors de l'exécution du programme ̀a l'aide de `strace`, nous pouvons d'abord voir
-- après les projections mémoire avec `mmap` et d'autres éléments -- ds appels
systèmes `write` pour afficher le message invitant ̀a la saisir, Cet affichage
est découpé en 4 parties (3 de 16 octets et une de 3)
Vient ensuite un appel système `read` pour lire la saisie sur l'entrée standard
puis un write de 6 octets pour écrire `Nope!` sur la sortie standard.
Enfin un appel sytème `exit_group` est lancé avec 1 en param̀etre (terminer tous
les threads du processus). La commande `echo $?` lancé dans le terminal ayant
evécuté notre programme confirme que le processus a quitté avec 1 comme code de
retour.
### avec strings
L'exécution de `strings hackme` montre des choses interessantes. On y voit des
traces des fonctions `wprintf` (qui pourrait être utile pour la suite),
`strlen`. `getline`. On voit aussi `IAmSuperSecure`, comme dirait Bernard dans
*Day of the Tentacle* This is all too easy! :
```
./hackme
This is level 0, welcome! What do you have to say?
IAmSuperSecure
Ok, that was easy!
```
Le ltrace confirme :
```
ltrace ./hackme
__libc_start_main(0x80490a0, 1, 0xffec1274, 0x8049590 <unfinished ...>
wprintf(0x804a064, 0x40000, 7, 0x80495d3This is level 0, welcome! What do you have to say?
) = 51
getline(0xffec1188, 0xffec118c, 0xf7f215c0, 0xf7db2096IAmsuperSecure
) = 15
strcmp("IAmsuperSecure", "IAmSuperSecure") = 1
wprintf(0x804a048, 0xf7fd4950, 0, 0x80492c2Nope!
) = 6
exit(1 <no return ...>
+++ exited (status 1) +++
```
## Level 1
Une fois pframe installé, le point d'arrêt positionné, et remonté dans la
fonction appelante
```
[...]
(gdb) bt
#0 0x08049030 in strcmp@plt ()
#1 0x08049372 in r1 ()
#2 0x080490c8 in main ()
(gdb) frame 1
#1 0x08049372 in r1 ()
(gdb) disass
Dump of assembler code for function r1:
0x08049350 <+0>: push %ebx
0x08049351 <+1>: sub $0x14,%esp
0x08049354 <+4>: push $0x804a184
0x08049359 <+9>: call 0x8049060 <wprintf@plt>
0x0804935e <+14>: call 0x8049220 <r>
0x08049363 <+19>: pop %edx
0x08049364 <+20>: pop %ecx
0x08049365 <+21>: push $0x804d030 <- voici l'adresse de la chaine source
0x0804936a <+26>: push %eax <- voici l'adresse de ma saisie
0x0804936b <+27>: mov %eax,%ebx
0x0804936d <+29>: call 0x8049030 <strcmp@plt>
=> 0x08049372 <+34>: add $0x10,%esp
0x08049375 <+37>: test %eax,%eax
```
nous pouvons voir que les chaines sont positionné sur la pile. Affichons les
avec `gdb`:
```
(gdb) p (char*)($eax)
$1 = 0x804f580 "ThisIsMyTest
(gdb) p (char*)0x804d030
$2 = 0x804d030 <p> "HelloDad"
```
Nous avons notre mot de passe `HelloDad`. Recommçons l'exécution avec un `watch`
sur notre variable:
```
(gdb) wa * (char*)0x804d030
Hardware watchpoint 1: * (char*)0x804d030
[...]
Hardware watchpoint 1: *(char*)0x804d030
Old value = 81 'Q'
New value = 72 'H'
0x08049339 in z ()
(gdb) bt
#0 0x08049339 in z ()
#1 0x080490c3 in main ()
```
La fonction permettant le déchiffrage est `z()`
En observant le contenu de cette variable, on comprend alors que le
déchiffrement du mot de passe du niveau 2 se fait en retirant `0x9` à chaque
caractère de noure chaine
```
(gdb) p (char*)0x804d030
$3 = 0x804d030 <p> "QnuuxMjm"
```
Ce fonctionnement est confirme par le code assembleur de `z()`
```
...
(gdb) disass
Dump of assembler code for function z:
0x08049320 <+0>: mov 0x4(%esp),%edx
0x08049324 <+4>: movzbl (%edx),%eax
0x08049327 <+7>: test %al,%al
0x08049329 <+9>: je 0x8049340 <z+32>
0x0804932b <+11>: lea 0x0(%esi,%eiz,1),%esi
0x0804932f <+15>: nop
0x08049330 <+16>: sub $0x9,%eax ; retire 0x9 à %eax
0x08049333 <+19>: add $0x1,%edx ; incrémente %edx
0x08049336 <+22>: mov %al,-0x1(%edx) ; remets le caractère déchiffré
; dans sa chaine
=> 0x08049339 <+25>: movzbl (%edx),%eax ; copie le caractère courant
; dans %eax (bits 1 à 8)
0x0804933c <+28>: test %al,%al ; boucle tant que le caractère
0x0804933e <+30>: jne 0x8049330 <z+16> ; \0 n'est pas trouvé
```
## Level 2
C'est reparti pour un tour! Nouvelle exécution du programme en plçant un point
d'arrêt sur `srtcmp@plt` et on arrive jusqu'au niveau 2:
```
On to level 2! So what do you want?
ThisIsTest
Breakpoint 1, 0x08049030 in strcmp@plt ()
(gdb) bt
#0 0x08049030 in strcmp@plt ()
#1 0x080493ca in r2 ()
#2 0x080490cd in main ()
```
Voici le code désassemblé de `r2()`
```
(gdb) frame 1
#1 0x080493ca in r2 ()
(gdb) disass
Dump of assembler code for function r2:
0x080493a0 <+0>: push %ebx
0x080493a1 <+1>: sub $0x14,%esp
0x080493a4 <+4>: push $0x804a280
0x080493a9 <+9>: call 0x8049060 <wprintf@plt>
0x080493ae <+14>: call 0x8049220 <r>
0x080493b3 <+19>: mov %eax,%ebx
0x080493b5 <+21>: mov %eax,(%esp)
0x080493b8 <+24>: call 0x80492f0 <x1>
0x080493bd <+29>: pop %eax
0x080493be <+30>: pop %edx
0x080493bf <+31>: push $0x804adec <- adresse de la chaine
0x080493c4 <+36>: push %ebx <- adresse de notre saisie
0x080493c5 <+37>: call 0x8049030 <strcmp@plt>
=> 0x080493ca <+42>: add $0x10,%esp
0x080493cd <+45>: test %eax,%eax
0x080493cf <+47>: jne 0x80493eb <r2+75>
0x080493d1 <+49>: sub $0xc,%esp
0x080493d4 <+52>: push $0x804a318
0x080493d9 <+57>: call 0x8049060 <wprintf@plt>
0x080493de <+62>: mov %ebx,(%esp)
0x080493e1 <+65>: call 0x8049050 <free@plt>
0x080493e6 <+70>: add $0x18,%esp
0x080493e9 <+73>: pop %ebx
0x080493ea <+74>: ret
0x080493eb <+75>: call 0x8049280 <f>
End of assembler dump.
```
Profitons-en pour afficher le contenu de nos deux chaines:
```
(gdb) p (char*)0x804adec
$10 = 0x804adec "R`jw}]nj"
I a Tea
(gdb) p (char*)$ebx
$11 = 0x804f5c0 "]qr|R|]n|}"
```
Code de `x1()` qui "chiffre" la saisie utilisateur du troisième mot de passe.
C'est le chiffrement inverse de celui vu au niveau 1 -> on ajoute `0x9`.
écrire un script python pour faire le job
```python
cyphertext = "R`jw}]nj"
cleartext = ""
for l in range(len(cyphertext)):
c += (chr(ord(cyphertext[l])-0x9))
print(cleartext)
```
ce qui nous donne 'IWantTea'
### Level 3
```
[...]
#5 0x08049248 in r ()
#6 0x08049403 in wut ()
#7 0x080490d2 in main ()
```
`r()` se se charge de la saisie, mais que fait `wut()`, interessons nous
à cette fonction d'abord passant dans sa frame:
```
(gdb) frame 6
#6 0x08049403 in wut ()
```
Puis en désassemblant son code:
```
(gdb) disass
Dump of assembler code for function wut:
0x080493f0 <+0>: push %ebx
0x080493f1 <+1>: sub $0x14,%esp
0x080493f4 <+4>: push $0x804a37c
0x080493f9 <+9>: call 0x8049060 <wprintf@plt>
0x080493fe <+14>: call 0x8049220 <r>
=> 0x08049403 <+19>: add $0x10,%esp
0x08049406 <+22>: cmpl $0x65727545,(%eax) <- intéressant
0x0804940c <+28>: jne 0x8049433 <wut+67>
0x0804940e <+30>: cmpl $0x21614b,0x4(%eax) <- et encore interessant
0x08049415 <+37>: mov %eax,%ebx
0x08049417 <+39>: jne 0x8049433 <wut+67>
0x08049419 <+41>: sub $0xc,%esp
0x0804941c <+44>: push $0x804a424
0x08049421 <+49>: call 0x8049060 <wprintf@plt>
0x08049426 <+54>: mov %ebx,(%esp)
0x08049429 <+57>: call 0x8049050 <free@plt>
0x0804942e <+62>: add $0x18,%esp
0x08049431 <+65>: pop %ebx
0x08049432 <+66>: ret
0x08049433 <+67>: call 0x8049280 <f>
End of assembler dump.
```
Après la saisie effectuée par l'utilisateur pour ce niveau 3, voici deux
comparaisons intéressantes. La première s'effectue sur les 4 octets à l'adresse
contenur dans `%eax`. La suivante sur le contenu à l'adresse de `%eax + 0x4`
Un script Python permet encore une fois de transformer ces deux valeurs en
texte, le voici:
```python
#!/bin/env python3
hextext = "6572754521614b"
finaltext = ""
cleartext = ""
for i in range(0, len(hextext) - 1, 2):
c = '{}{}'.format(hextext[i], hextext[i+1])
cleartext += (chr(int(c, 16)))
cur_size=0
bits_processed=0
for i in range(0, len(cleartext) - 1, 4):
if (len(cleartext) - 4 * bits_processed) > 4:
cur_size = 4
else:
cur_size = len(cleartext) - 4 * bits_processed
for j in range(i+cur_size,i,-1):
finaltext += cleartext[j-1]
bits_processed+=1
print('Level 3 text: {}'.format(finaltext))
```
Le mot de passe est `EureKa!`
## Level 4
Même cheminement que pour le niveau 3:
```
...
#5 0x08049248 in r ()
#6 0x080494e3 in aa ()
#7 0x080490d7 in main ()
```
Interessons nous à cette fonction:
```
(gdb) disass
Dump of assembler code for function aa:
0x080494d0 <+0>: push %ebx
0x080494d1 <+1>: sub $0x14,%esp
0x080494d4 <+4>: push $0x804a474
0x080494d9 <+9>: call 0x8049060 <wprintf@plt>
0x080494de <+14>: call 0x8049220 <r>
=> 0x080494e3 <+19>: mov %eax,(%esp)
0x080494e6 <+22>: mov %eax,%ebx
0x080494e8 <+24>: call 0x8049080 <strlen@plt>
0x080494ed <+29>: add $0x10,%esp
0x080494f0 <+32>: cmp $0x4,%eax
0x080494f3 <+35>: jne 0x8049524 <aa+84>
0x080494f5 <+37>: sub $0x8,%esp
0x080494f8 <+40>: push $0x804adf5
0x080494fd <+45>: push %ebx
0x080494fe <+46>: call 0x8049470 <bb> <- wuat is bb?
0x08049503 <+51>: add $0x10,%esp
0x08049506 <+54>: test %eax,%eax
0x08049508 <+56>: je 0x8049524 <aa+84>
0x0804950a <+58>: sub $0xc,%esp
0x0804950d <+61>: push $0x804a4ec
0x08049512 <+66>: call 0x8049060 <wprintf@plt>
0x08049517 <+71>: mov %ebx,(%esp)
0x0804951a <+74>: call 0x8049050 <free@plt>
0x0804951f <+79>: add $0x18,%esp
0x08049522 <+82>: pop %ebx
0x08049523 <+83>: ret
0x08049524 <+84>: call 0x8049280 <f>
End of assembler dump.
```
Cette fonction appelle une autre foncion : `wut()`. C'est elle qui semble se
charcher de la vérification de la saisie.
Mais avant ça `aa()` met les élements en place:
* mets l'adresse vers la zone mémoire contenant la saisie utilisateur dans
l'adresse contenue dans `%esp`
* puis copie cette adresse dans %ebx, afin de préparer l'appel à `strlen()`
* cet appel positionnera le résultat dans `%eax` à partir de la chaine dans
`%ebx`
* `%esp` est incrémenté de 16 (*0x10*).
* Ensuite le résultat de `strlen()` est comparé à 4, en cas de non égalité, le
procgramme branche sur `f()` qui met fin à l'exécution.. Nous pouvons donc en
déduite que notre saisie doit être de 4 cacactères exactement.
* La pile est ensuite décrémentée de 8
* *0x804adf5* est ensuite positionné sur la pile, Il semble que se soit une
adresse. le contenu de cette espace mémoire est *0x66737a65*.
* `%ebx` est ensuite poussé sur la pile
* `bb()` est appelée, c'est cette fonction qui se chage du 'déchiffrement'
### La fonction `bb`
```
8049470: 56 push %esi
8049471: 53 push %ebx
8049472: 8b 5c 24 10 mov 0x10(%esp),%ebx
8049476: 8b 74 24 0c mov 0xc(%esp),%esi
804947a: 0f b6 13 movzbl (%ebx),%edx
804947d: 84 d2 test %dl,%dl
804947f: /-------- 74 2d je 80494ae <bb+0x3e>
8049481: | 0f b6 06 movzbl (%esi),%eax
8049484: | 83 f0 12 xor $0x12,%eax
8049487: | 38 c2 cmp %al,%dl
8049489: /--|-------- 75 35 jne 80494c0 <bb+0x50>
804948b: | | b8 01 00 00 00 mov $0x1,%eax
8049490: | | /----- eb 14 jmp 80494a6 <bb+0x36>
8049492: | | | 8d b6 00 00 00 00 lea 0x0(%esi),%esi
8049498: | | | /-> 0f b6 14 06 movzbl (%esi,%eax,1),%edx
804949c: | | | | 83 c0 01 add $0x1,%eax
804949f: | | | | 83 f2 12 xor $0x12,%edx
80494a2: | | | | 38 ca cmp %cl,%dl
80494a4: +--|--|--|-- 75 1a jne 80494c0 <bb+0x50>
80494a6: | | \--|-> 0f b6 0c 03 movzbl (%ebx,%eax,1),%ecx
80494aa: | | | 84 c9 test %cl,%cl
80494ac: | | \-- 75 ea jne 8049498 <bb+0x28>
80494ae: | \-------> b8 01 00 00 00 mov $0x1,%eax
80494b3: | 5b pop %ebx
80494b4: | 5e pop %esi
80494b5: | c3 ret
80494b6: | 8d b4 26 00 00 00 00 lea 0x0(%esi,%eiz,1),%esi
80494bd: | 8d 76 00 lea 0x0(%esi),%esi
80494c0: \----------> 31 c0 xor %eax,%eax
80494c2: 5b pop %ebx
```
* `8049472` : on mets en place le contenu de l'adresse contenant notre série de
4 octets mystères *0x66737a65* dans `%ebx`
* `8049476` : l'adresse vers notre saisie est positionnée dans `%esi`
* `804947a` : l'octet de poids faible de `%ebx` est copié dans `%edx`
* `804947d` : et logique de `%dl` sur lui même, si le test est vrai alors le
programme branche sur la fin "normale" de la fonction. Ceci signifirait que
notre chaine mystère est vide (donc pas de mot de passe).
* `8049481` : l'octet de poids faible de notre saisie `%esi` est positionné
dans `%eax`
* `8049484` : un `xor` est ensuite réalisé entre *0x12* et `%eax`
* `8049487` : les bits de poids faible de `%eax` et `%edx` sont comparés
* `8049489` : en cas d'inégalité, la fonction se termine.
* `804948b` : *0x1* est écrit dans `%eax`.
* `8049490` : Branchement vers l'instruction `80494a6`
* `80494a6` : l'octet de poid faible de `(%esi,%eax,1)` correspondant à la
lettre suivante de notre chaine mystère `ecx`
* `80494aa` : si l'opération booleene de `%cl` sur lui même est différente de
zéro alors le probramme branche sur `8049498`. Ce test permet de savoir si on
est en fin de chaine (`\0`) sur notre chaine mystère. sinon le fil de code
continue jusqu'à la fin de la fonction.
* `8049498` : le programme prend le caractère suivant de notre saisir et le
place dans `%edx`
* `804949c` : `%eax` est incrémenté de 1
* `804949f` : un `xor` est ensuite réalisé entre *0x12* et `%edx`
* `80494a2` : les bits de poids faible de `%eax` et `%edx` sont comparés
* `80494a4` : s'il ne sont pas égaux alors fin du programme, sinon nous
revenons à l'instruction `80494a6`.
En clair, notre chaine mystère est bien le **mot de passe "chiffré"**, un simple
*xor* avec *0x12* nous permettra de trouver le mot de passe à saisir.
Là encore un script Python permet de faire le travail pour nous:
```python
#!/bin/env python3
hextext = "66737a65"
finaltext = ""
cleartext = ""
for i in range(0, len(hextext) - 1, 2):
c = '{}{}'.format(hextext[i], hextext[i+1])
cleartext += chr(int(c, 16) ^ 0x12)
cur_size=0
bits_processed=0
for i in range(0, len(cleartext) - 1, 4):
if (len(cleartext) - 4 * bits_processed) > 4:
cur_size = 4
else:
cur_size = len(cleartext) - 4 * bits_processed
for j in range(i+cur_size,i,-1):
finaltext += cleartext[j-1]
bits_processed+=1
print('Level 4 text: {}'.format(finaltext))
```
Ce qui donne:
```bash
./level4.py
Level 4 text: what
```