Linux 编程之获取应用程序的绝对路径
时间:2007-02-17 来源:PHP爱好者
经常看到有人提问在linux中如何获取当前应用程序的绝对路径, 却很少有人能比较好的解答. 现转贴www.linuxforum.net上的一篇文章, 希望能对受这个问题困扰的人有帮助.
13.12 如何获取当前进程对应之静态映像文件的绝对路径
A: hushui110@水木清华
这是一个x86/Linux Kernel 2.4.7-10系统中利用proc获取绝对路径的例子
--------------------------------------------------------------------------
/*
* gcc -Wall -pipe -g -static -o myprog_2 myprog_2.c
*/
#include
#include
#include
#define MAXBUFSIZE 1024
int main ( int argc, char * argv[] )
{
char buf[ MAXBUFSIZE ];
int count;
count = readlink( "/proc/self/exe", buf, MAXBUFSIZE );
if ( count <0 || count >= MAXBUFSIZE )
{
printf( "Failedn" );
return( EXIT_FAILURE );
}
buf[ count ] = '';
printf( "/proc/self/exe -> [%s]n", buf );
return( EXIT_SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /home/scz/src]> ./myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]> ../src/myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]> myprog_2
/proc/self/exe -> [/home/scz/src/myprog_2]
[scz@ /home/scz/src]>
显然这里直接给出了最期待的结果,没有冗余信息。
A: scz & microcat
2000-03-18
下面在x86/Linux Kernel 2.4.7-10上演示、讨论
--------------------------------------------------------------------------
*
* gcc -Wall -pipe -g -static -o myprog myprog.c
*/
#include
#include
int main ( int argc, char * argv[] )
{
return( EXIT_SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
[scz@ /home/scz/src]> gcc -Wall -pipe -g -static -o myprog myprog.c
[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /home/scz/src]> gdb ./myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "SHLVL=1"
0xbfffff08: "_=/bin/bash"
0xbfffff14: "SHELL=/bin/bash"
0xbfffff24: "HOSTTYPE=i386"
0xbfffff32: "OSTYPE=linux-gnu"
0xbfffff43: "HISTSIZE=1000"
0xbfffff51: "TERM=vt100"
0xbfffff5c: "HOME=/home/scz"
0xbfffff6b: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffff9e: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffd2: "LESSCHARSET=latin1"
0xbfffffe5: "/home/scz/src/./myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
0xc0000000:
[scz@ /home/scz/src]> gdb myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "z"
0xbfffff02: "SHLVL=1"
0xbfffff0a: "_=/bin/bash"
0xbfffff16: "SHELL=/bin/bash"
0xbfffff26: "HOSTTYPE=i386"
0xbfffff34: "OSTYPE=linux-gnu"
0xbfffff45: "HISTSIZE=1000"
0xbfffff53: "TERM=vt100"
0xbfffff5e: "HOME=/home/scz"
0xbfffff6d: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffffa0: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffd4: "LESSCHARSET=latin1"
0xbfffffe7: "/home/scz/src/myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
[scz@ /home/scz/src]> gdb ../src/myprog
(gdb) b main
(gdb) r
(gdb) x/17s 0xbfffff00
0xbfffff00: "=1"
0xbfffff03: "_=/bin/bash"
0xbfffff0f: "SHELL=/bin/bash"
0xbfffff1f: "HOSTTYPE=i386"
0xbfffff2d: "OSTYPE=linux-gnu"
0xbfffff3e: "HISTSIZE=1000"
0xbfffff4c: "TERM=vt100"
0xbfffff57: "HOME=/home/scz"
0xbfffff66: "SSH_ASKPASS=/usr/libexec/openssh/gnome-ssh-askpass"
0xbfffff99: "PATH=/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:."
0xbfffffcd: "LESSCHARSET=latin1"
0xbfffffe0: "/home/scz/src/../src/myprog" <-- 注意这个输出
0xbffffffc: ""
0xbffffffd: ""
0xbffffffe: ""
0xbfffffff: ""
0xc0000000:
[scz@ /home/scz/src]>
这是ELF文件在Linux系统中加载进内存之后的布局简图
--------------------------------------------------------------------------
0x08048000 code .text,代码,只读
data .data,包含已经初始化的数据,只读
bss .bss,未初始化数据,初始化成0,读/写
... 堆区,动态分配获取的内存从.bss往内存高端增长
... (heap),读/写
...
stack 栈区,起始地址大于0xBFFF0000
arguments main()的形参
environment 环境变量区域
program name execve()第一形参,不是argv[0]
0xBFFFFFFC null(dword) 最后四个字节固定为零
0xC0000000
--------------------------------------------------------------------------
通常动态链接库被映射到0x40000000往高端的地址。对于Linux,如果打了不可执行
堆栈内核补丁,动态链接库被映射到0x40000000往低端的地址。tt说就是以前的映射
地址减去0x40000000。打了补丁后使得通过字符串拷贝(strcpy)传递shellcode相对
复杂化,需要更多技巧。
program name处不一定是绝对路径,实际对应了execve()第一形参。一般从shell上
启动进程,shell根据PATH环境变量自动搜索匹配出一个路径,未必是绝对路径。假
设PATH环境变量中有当前目录(.),所执行的程序也只在当前目录下有,直接指定程
序名(myprog)执行时,shell会向execve()第一形参传递"./myprog"。注意,execve
第一形参未必是绝对路径。用gdb加载后再执行,情况有所不同。如果gdb命令行上指
定的程序名非绝对路径,gdb在调用execve()之前会调用getcwd()拼接在程序名之前,
此时不依赖PATH环境变量。所以用gdb调试溢出程序时应该在命令行上指定绝对路径,
避免不必要的偏移调整。
现在来看这样一个演示程序
--------------------------------------------------------------------------
/*
* gcc -Wall -pipe -g -static -o myprog_1 myprog_1.c
*/
#include
#include
extern char **environ;
int main ( int argc, char * argv[] )
{
char *path = ( char * )( 0xc0000000 - 5 );
while ( *--path );
++path;
printf( "path --> %08x [%s]n", ( unsigned int )path, path );
printf( "argv --> %08xn", ( unsigned int )argv );
printf( "argv[0] --> %08x [%s]n", ( unsigned int )argv[0],
argv[0] );
printf( "environ --> %08xn", ( unsigned int )environ );
printf( "environ[0] --> %08x [%s]n", ( unsigned int )environ[0],
environ[0] );
return( EXIT_SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
直接执行,然后用gdb加载后执行,对比输出上的不同。
[scz@ /home/scz/src]> myprog_1
path --> bffffff1 [./myprog_1] <-- 注意这里前面多了一个"./"
argv --> bffffb24
argv[0] --> bffffc29 [myprog_1]
environ --> bffffb2c
environ[0] --> bffffc32 [PWD=/home/scz/src]
[scz@ /home/scz/src]> ./myprog_1
path --> bffffff1 [./myprog_1]
argv --> bffffb24
argv[0] --> bffffc27 [./myprog_1]
environ --> bffffb2c
environ[0] --> bffffc32 [PWD=/home/scz/src]
[scz@ /home/scz/src]> ../src/myprog_1
path --> bfffffec [../src/myprog_1]
argv --> bffffb14
argv[0] --> bffffc18 [../src/myprog_1]
environ --> bffffb1c
environ[0] --> bffffc28 [PWD=/home/scz/src]
[scz@ /home/scz/src]>
Linux系统中main()函数里自修改argv[0]欺骗ps有效,而FreeBSD、Solaris则无效。
execve()第二形参可以指定不同于第一形参的argv[0]。argv[0]不可信,但execve()
第一形参相对就可信得多。如果是自己写程序,可以考虑在main()中第一时刻判断
execve()第一形参是否为相对路径,进而决定是否调用getcwd(),最后拼接出一个绝
对路径。就像gdb所做的那样。
需要考虑"/home/scz/src/./myprog"、"/home/scz/src/../src/myprog"这些情况,
消掉"./"、"../"等冗余信息。
A: scz & microcat
2002-09-13 18:00
下面在SARPC/Solaris 8 64-bit kernel mode上演示、讨论
--------------------------------------------------------------------------
/*
* gcc -Wall -pipe -g -static -o myprog_3 myprog_3.c
*/
#include
#include
extern char **environ;
static void outputBinary ( const unsigned char *byteArray, const size_t
byteArrayLen )
{
size_t offset, k, j, i;
fprintf( stderr, "byteArray [ %u bytes ] ----> n", byteArrayLen );
if ( byteArrayLen <= 0 )
{
return;
}
i = 0;
offset = 0;
for ( k = byteArrayLen / 16; k > 0; k--, offset += 16 )
{
fprintf( stderr, "%08X ", offset );
for ( j = 0; j <16; j++, i++ )
{
if ( j == 8 )
{
fprintf( stderr, "-%02X", byteArray[ i ] );
}
else
{
fprintf( stderr, " %02X", byteArray[ i ] );
}
}
fprintf( stderr, " " );
i -= 16;
for ( j = 0; j <16; j++, i++ )
{
/*
* if ( isprint( (int)byteArray[ i ] ) )
*/
if ( ( byteArray[ i ] >= ' ' ) && ( byteArray[ i ]
<= 255 )
&& ( byteArray[ i ] != 0x7f ) )
{
fprintf( stderr, "%c", byteArray[ i ] );
}
else
{
fprintf( stderr, "." );
}
}
fprintf( stderr, "n" );
} /* end of for */
k = byteArrayLen - i;
if ( k <= 0 )
{
return;
}
fprintf( stderr, "%08X ", offset );
for ( j = 0 ; j <k; j++, i++ )
{
if ( j == 8 )
{
fprintf( stderr, "-%02X", byteArray[ i ] );
}
else
{
fprintf( stderr, " %02X", byteArray[ i ] );
}
}
i -= k;
for ( j = 16 - k; j > 0; j-- )
{
fprintf( stderr, " " );
}
fprintf( stderr, " " );
for ( j = 0; j <k; j++, i++ )
{
if ( ( byteArray[ i ] >= ' ' ) && ( byteArray[ i ] <=
255 )
&& ( byteArray[ i ] != 0x7f ) )
{
fprintf( stderr, "%c", byteArray[ i ] );
}
else
{
fprintf( stderr, "." );
}
}
fprintf( stderr, "n" );
return;
} /* end of outputBinary */
int main ( int argc, char * argv[] )
{
char *path = ( char * )( 0xffbf0000 - 5 );
while ( *path == '' )
{
path--;
}
while ( *path )
{
path--;
}
++path;
printf( "path --> %08x [%s]n", ( unsigned int )path, path );
printf( "argv --> %08xn", ( unsigned int )argv );
printf( "argv[0] --> %08x [%s]n", ( unsigned int )argv[0],
argv[0] );
printf( "environ --> %08xn", ( unsigned int )environ );
printf( "environ[0] --> %08x [%s]n", ( unsigned int )environ[0],
environ[0] );
outputBinary( ( const unsigned char * )( 0xffbf0000 - 256 ), 256 );
return( EXIT_SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
直接执行,然后用gdb加载后执行,对比输出上的不同。SPARC/Solaris与x86/Linux
在此问题上有不少区别。
[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /export/home/scz/src]> myprog_3
path --> ffbeffee [myprog_3]
argv --> ffbefcfc
argv[0] --> ffbefd7c [myprog_3]
environ --> ffbefd04
environ[0] --> ffbefd85 [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]> ./myprog_3
path --> ffbefff0 [myprog_3] <-- 注意这里前面反而没有了"./"
argv --> ffbefcfc
argv[0] --> ffbefd7c [./myprog_3]
environ --> ffbefd04
environ[0] --> ffbefd87 [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]> ../src/myprog_3
path --> ffbeffea [../src/myprog_3]
argv --> ffbefcec
argv[0] --> ffbefd6c [../src/myprog_3]
environ --> ffbefcf4
environ[0] --> ffbefd7c [PWD=/export/home/scz/src]
[scz@ /export/home/scz/src]>
如果我们复制myprog_3到/usr/bin下去,再次执行myprog_3,可以看到如下输出
[scz@ /export/home/scz/src]> myprog_3
path --> ffbeffe9 [/usr/bin/myprog_3] <-- 注意这里
argv --> ffbefcf4
argv[0] --> ffbefd74 [myprog_3]
environ --> ffbefcfc
environ[0] --> ffbefd7d [PWD=/export/home/scz/src]
byteArray [ 256 bytes ] ---->
00000000 55 6C 74 72 61 2D 35 5F-31 30 00 53 48 4C 56 4C Ultra-5_10.SHLVL
00000010 3D 31 00 5F 49 4E 49 54-5F 55 54 53 5F 4D 41 43 =1._INIT_UTS_MAC
00000020 48 49 4E 45 3D 73 75 6E-34 75 00 53 48 45 4C 4C HINE=sun4u.SHELL
00000030 3D 2F 62 69 6E 2F 62 61-73 68 00 48 4F 53 54 54 =/bin/bash.HOSTT
00000040 59 50 45 3D 73 70 61 72-63 00 4F 53 54 59 50 45 YPE=sparc.OSTYPE
00000050 3D 73 6F 6C 61 72 69 73-32 2E 38 00 48 4F 4D 45 =solaris2.8.HOME
00000060 3D 2F 65 78 70 6F 72 74-2F 68 6F 6D 65 2F 73 63 =/export/home/sc
00000070 7A 00 54 45 52 4D 3D 76-74 31 30 30 00 50 41 54 z.TERM=vt100.PAT
00000080 48 3D 2F 62 69 6E 3A 2F-75 73 72 2F 62 69 6E 3A H=/bin:/usr/bin:
00000090 2F 73 62 69 6E 3A 2F 75-73 72 2F 73 62 69 6E 3A /sbin:/usr/sbin:
000000A0 2F 75 73 72 2F 6C 6F 63-61 6C 2F 62 69 6E 3A 2E /usr/local/bin:.
000000B0 00 5F 49 4E 49 54 5F 4E-45 54 5F 53 54 52 41 54 ._INIT_NET_STRAT
000000C0 45 47 59 3D 6E 6F 6E 65-00 5F 3D 2F 62 69 6E 2F EGY=none._=/bin/
000000D0 6D 79 70 72 6F 67 5F 33-00 53 55 4E 57 2C 55 6C myprog_3.SUNW,Ul
000000E0 74 72 61 2D 35 5F 31 30-00 2F 75 73 72 2F 62 69 tra-5_10./usr/bi
000000F0 6E 2F 6D 79 70 72 6F 67-5F 33 00 00 00 00 00 00 n/myprog_3......
[scz@ /export/home/scz/src]>
前面说的getcwd()拼接技术同样适用于SPARC/Solaris 8。
与Linux相比,有几处重要变化,一是从0xC0000000变成0xFFBF0000,二是如果程序
在当前目录下,没有了前面的"./",三是SPARC芯片的一些对齐特性导致我们要找的
位置可能比想像的要向内存低端移动一些字节。
后两点容易理解,那我们是如何确定0xC0000000、0xFFBF0000的呢。这个问题实际上
就是<<如何编程获取栈底地址>>所解决的,参看这篇QA。假设堆栈(stac
k)向低地址
方向增长,则所谓栈底指堆栈(stack)最高地址,下面是tt用程序找出来的
x86/Linux 栈底是0xc0000000( 栈底往低地址的4个字节总是零 )
SPARC/Solaris 7/8 栈底是0xffbf0000( 栈底往低地址的4个字节总是零 )
SPARC/Solaris 2.6 栈底是0xf0000000( 栈底往低地址的4个字节总是零 )
x86/FreeBSD 栈底是0xbfc00000( 栈底往低地址的4个字节总是零 )
x86/NetBSD 1.5 栈底是0xbfbfe000
x86/OpenBSD 2.8 栈底是0xdfbfe000
利用ELF文件加载进内存之后的布局获取绝对路径固然可行,但是带有很强的Hacking
味,并不可取,不是万不得已不要使用这种技术。
Linux有"/proc/self/exe",Solaris有"/proc/self/auxv",这些都是可以一用的。
当然在Solaris系统中直接使用getexecname(3C)获取execve()第一形参最好,否则涉
及在用户空间读取U区的问题,也带有很强的Kernel
Hacking味道。参看<<如何在命
令行上访问指定进程P、U两区,如何欺骗Solaris的ps>>、<
e(3C)是怎么
实现的>>两篇QA。
D: law@水木清华
在main()一开始就取execve()第一形参,或者退而求其次取argv[0],然后解析$PATH
环境变量,自己确定哪个目录里含有进程静态文件映像。如果是取execve()第一形参?
?
这个办法可行。如果取argv[0],就面临着argv[0]不可信的问题。而前面的技术取的
都是execve()第一形参。
注意,如果取argv[0],就不能依赖getcwd()拼接,这点与取execve()第一形参不同。
很可能命令行上的"myprog_3"实际根据$PATH产生了"/usr/bin/myprog_3",argv[0]
与getcwd()无论如何也拼不出正确的绝对路径。
A: scz 2002-09-13 20:45
这是一个x86/FreeBSD 4.5-RELEASE系统中利用proc获取绝对路径的例子
--------------------------------------------------------------------------
/*
* gcc -Wall -pipe -g -static -o myprog_4 myprog_4.c
*/
#include
#include
#include
#include
#define MAXBUFSIZE 1024
int main ( int argc, char * argv[] )
{
char proc[64];
char buf[ MAXBUFSIZE ];
int count;
sprintf( proc, "/proc/%d/file", ( unsigned int )getpid() );
count = readlink( proc, buf, MAXBUFSIZE );
if ( count <0 || count >= MAXBUFSIZE )
{
printf( "Failedn" );
return( EXIT_FAILURE );
}
buf[ count ] = '';
printf( "%s -> [%s]n", proc, buf );
return( EXIT_SUCCESS );
} /* end of main */
--------------------------------------------------------------------------
[scz@ /home/scz/src]> echo $PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:.
[scz@ /home/scz/src]> myprog_4
/proc/121/file -> [/usr/home/scz/src/myprog_4]
[scz@ /home/scz/src]> ./myprog_4
/proc/122/file -> [/usr/home/scz/src/myprog_4]
[scz@ /home/scz/src]> ../src/myprog_4
/proc/123/file -> [/usr/home/scz/src/myprog_4]
[scz@ /home/scz/src]>
与Linux系统中"/proc/self/exe"一样,FreeBSD系统中"/proc/ /file"直?
痈??
了最期待的结果,没有冗余信息。
手头系统有限,无法一一验证其它Unix系统。个人觉得从栈底向低端移动取execve()
第一形参的办法比较通用,可以写成可移植的函数,但还是不太推荐这种Hacking。
php爱好者站 http://www.phpfans.net c/vc/c++/java.