En el pasado, /bin/true
y /bin/false
en el shell, en realidad eran guiones.
Por ejemplo, en un PDP / 11 Unix System 7:
$ ls -la /bin/true /bin/false
-rwxr-xr-x 1 bin 7 Jun 8 1979 /bin/false
-rwxr-xr-x 1 bin 0 Jun 8 1979 /bin/true
$
$ cat /bin/false
exit 1
$
$ cat /bin/true
$
Hoy en día, al menos en bash
, los comandos true
y false
se implementan como comandos integrados de shell. Por lo tanto, no se invocan archivos binarios ejecutables de forma predeterminada, tanto cuando se usan las directivas false
y true
en la bash
línea de comandos como dentro de los scripts de shell.
De la bash
fuente builtins/mkbuiltins.c
:
char * posix_builtins [] =
{
"alias", "bg", "cd", "command", "** false **", "fc", "fg", "getopts", "jobs",
"kill", "newgrp", "pwd", "read", "** true **", "umask", "unalias", "wait",
(char *) NULL
};
También según los comentarios de @meuh:
$ command -V true false
true is a shell builtin
false is a shell builtin
Así que se puede decir con un alto grado de certeza el true
y false
archivos ejecutables existen principalmente para ser llamado desde otros programas .
De ahora en adelante, la respuesta se centrará en el /bin/true
binario del coreutils
paquete en Debian 9/64 bits. ( /usr/bin/true
ejecutando RedHat. RedHat y Debian usan el coreutils
paquete, analizan la versión compilada de este último y lo tienen más a mano).
Como se puede ver en el archivo fuente false.c
, /bin/false
se compila con (casi) el mismo código fuente que /bin/true
, simplemente devolviendo EXIT_FAILURE (1), por lo que esta respuesta se puede aplicar a ambos binarios.
#define EXIT_STATUS EXIT_FAILURE
#include "true.c"
Como también puede ser confirmado por ambos ejecutables que tienen el mismo tamaño:
$ ls -l /bin/true /bin/false
-rwxr-xr-x 1 root root 31464 Feb 22 2017 /bin/false
-rwxr-xr-x 1 root root 31464 Feb 22 2017 /bin/true
Por desgracia, la pregunta directa a la respuesta why are true and false so large?
podría ser, porque ya no hay razones tan apremiantes para preocuparse por su alto rendimiento. No son esenciales para el bash
rendimiento, ya no son utilizados por bash
(secuencias de comandos).
Comentarios similares se aplican a su tamaño, 26 KB para el tipo de hardware que tenemos hoy en día es insignificante. El espacio no está en la prima para la típica de un servidor / escritorio más, y que ni siquiera se molestan más a utilizar el mismo binario para false
y true
, a medida que se despliega solo dos veces en el uso de distribuciones coreutils
.
Sin embargo, centrándonos en el verdadero espíritu de la pregunta, ¿por qué algo que debería ser tan simple y pequeño, se vuelve tan grande?
La distribución real de las secciones de /bin/true
es como se muestra en estos gráficos; el código principal + datos asciende a aproximadamente 3 KB de un binario de 26 KB, lo que equivale al 12% del tamaño de /bin/true
.
La true
utilidad obtuvo más código crujiente a lo largo de los años, especialmente el soporte estándar para --version
y --help
.
Sin embargo, esa no es la (única) justificación principal para que sea tan grande, sino que, mientras está vinculado dinámicamente (usando bibliotecas compartidas), también tiene parte de una biblioteca genérica comúnmente utilizada por coreutils
binarios vinculados como una biblioteca estática. La metada para construir un elf
archivo ejecutable también representa una parte significativa del binario, ya que es un archivo relativamente pequeño para los estándares actuales.
El resto de la respuesta es para explicar cómo llegamos a construir los siguientes cuadros que detallan la composición del /bin/true
archivo binario ejecutable y cómo llegamos a esa conclusión.
Como dice @Maks, el binario se compiló desde C; Según mi comentario también, también se confirma que es de coreutils. Estamos apuntando directamente al autor (es) git https://github.com/wertarbyte/coreutils/blob/master/src/true.c , en lugar del gnu git como @Maks (mismas fuentes, repositorios diferentes - este repositorio fue seleccionado ya que tiene la fuente completa de las coreutils
bibliotecas)
Podemos ver los diversos bloques de construcción del /bin/true
binario aquí (Debian 9 - 64 bits de coreutils
):
$ file /bin/true
/bin/true: ELF 64-bit LSB shared object, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, for GNU/Linux 2.6.32, BuildID[sha1]=9ae82394864538fa7b23b7f87b259ea2a20889c4, stripped
$ size /bin/true
text data bss dec hex filename
24583 1160 416 26159 662f true
De aquellos:
- el texto (generalmente el código) es de alrededor de 24 KB
- los datos (variables inicializadas, principalmente cadenas) son de alrededor de 1 KB
- bss (datos no inicializados) 0.5 KB
De los 24 KB, alrededor de 1 KB es para arreglar las 58 funciones externas.
Eso todavía deja alrededor de 23 KB para el resto del código. A continuación, mostraremos a continuación que el archivo principal real - el código main () + use () está compilado alrededor de 1 KB, y explicaremos para qué se usan los otros 22 KB.
Al profundizar más en el binario readelf -S true
, podemos ver que, si bien el binario tiene 26159 bytes, el código compilado real es 13017 bytes, y el resto es una variedad de datos / código de inicialización.
Sin embargo, true.c
no es toda la historia y 13 KB parece bastante excesivo si solo fuera ese archivo; podemos ver funciones llamadas main()
que no están listadas en las funciones externas vistas en el duende con objdump -T true
; funciones que están presentes en:
Esas funciones adicionales no vinculadas externamente en main()
son:
- set_program_name ()
- close_stdout ()
- version_etc ()
Entonces, mi primera sospecha fue en parte correcta, mientras que la biblioteca está usando bibliotecas dinámicas, el /bin/true
binario es grande * porque tiene algunas bibliotecas estáticas incluidas * (pero esa no es la única causa).
Compilar el código C no suele ser tan ineficiente para no tener en cuenta ese espacio, de ahí mi sospecha inicial de que algo andaba mal.
El espacio extra, casi el 90% del tamaño del binario, es de hecho bibliotecas / metadatos extra.
Al usar Hopper para desensamblar / descompilar el binario para comprender dónde están las funciones, se puede ver que el código binario compilado de la función true.c / use () es en realidad 833 bytes, y de la función true.c / main () es 225 bytes, que es aproximadamente un poco menos de 1 KB. La lógica para las funciones de versión, que está enterrada en las bibliotecas estáticas, es de alrededor de 1 KB.
El principal () + uso () + versión () + cadenas + vars compilados reales solo están usando alrededor de 3 KB a 3.5 KB.
De hecho, es irónico, tales utilidades pequeñas y humildes se han vuelto más grandes por las razones explicadas anteriormente.
pregunta relacionada: Comprender qué está haciendo un binario de Linux
true.c
main () con la función infractora invoca:
int
main (int argc, char **argv)
{
/* Recognize --help or --version only if it's the only command-line
argument. */
if (argc == 2)
{
initialize_main (&argc, &argv);
set_program_name (argv[0]); <-----------
setlocale (LC_ALL, "");
bindtextdomain (PACKAGE, LOCALEDIR);
textdomain (PACKAGE);
atexit (close_stdout); <-----
if (STREQ (argv[1], "--help"))
usage (EXIT_STATUS);
if (STREQ (argv[1], "--version"))
version_etc (stdout, PROGRAM_NAME, PACKAGE_NAME, Version, AUTHORS, <------
(char *) NULL);
}
exit (EXIT_STATUS);
}
El tamaño decimal de las diversas secciones del binario:
$ size -A -t true
true :
section size addr
.interp 28 568
.note.ABI-tag 32 596
.note.gnu.build-id 36 628
.gnu.hash 60 664
.dynsym 1416 728
.dynstr 676 2144
.gnu.version 118 2820
.gnu.version_r 96 2944
.rela.dyn 624 3040
.rela.plt 1104 3664
.init 23 4768
.plt 752 4800
.plt.got 8 5552
.text 13017 5568
.fini 9 18588
.rodata 3104 18624
.eh_frame_hdr 572 21728
.eh_frame 2908 22304
.init_array 8 2125160
.fini_array 8 2125168
.jcr 8 2125176
.data.rel.ro 88 2125184
.dynamic 480 2125272
.got 48 2125752
.got.plt 392 2125824
.data 128 2126240
.bss 416 2126368
.gnu_debuglink 52 0
Total 26211
Salida de readelf -S true
$ readelf -S true
There are 30 section headers, starting at offset 0x7368:
Section Headers:
[Nr] Name Type Address Offset
Size EntSize Flags Link Info Align
[ 0] NULL 0000000000000000 00000000
0000000000000000 0000000000000000 0 0 0
[ 1] .interp PROGBITS 0000000000000238 00000238
000000000000001c 0000000000000000 A 0 0 1
[ 2] .note.ABI-tag NOTE 0000000000000254 00000254
0000000000000020 0000000000000000 A 0 0 4
[ 3] .note.gnu.build-i NOTE 0000000000000274 00000274
0000000000000024 0000000000000000 A 0 0 4
[ 4] .gnu.hash GNU_HASH 0000000000000298 00000298
000000000000003c 0000000000000000 A 5 0 8
[ 5] .dynsym DYNSYM 00000000000002d8 000002d8
0000000000000588 0000000000000018 A 6 1 8
[ 6] .dynstr STRTAB 0000000000000860 00000860
00000000000002a4 0000000000000000 A 0 0 1
[ 7] .gnu.version VERSYM 0000000000000b04 00000b04
0000000000000076 0000000000000002 A 5 0 2
[ 8] .gnu.version_r VERNEED 0000000000000b80 00000b80
0000000000000060 0000000000000000 A 6 1 8
[ 9] .rela.dyn RELA 0000000000000be0 00000be0
0000000000000270 0000000000000018 A 5 0 8
[10] .rela.plt RELA 0000000000000e50 00000e50
0000000000000450 0000000000000018 AI 5 25 8
[11] .init PROGBITS 00000000000012a0 000012a0
0000000000000017 0000000000000000 AX 0 0 4
[12] .plt PROGBITS 00000000000012c0 000012c0
00000000000002f0 0000000000000010 AX 0 0 16
[13] .plt.got PROGBITS 00000000000015b0 000015b0
0000000000000008 0000000000000000 AX 0 0 8
[14] .text PROGBITS 00000000000015c0 000015c0
00000000000032d9 0000000000000000 AX 0 0 16
[15] .fini PROGBITS 000000000000489c 0000489c
0000000000000009 0000000000000000 AX 0 0 4
[16] .rodata PROGBITS 00000000000048c0 000048c0
0000000000000c20 0000000000000000 A 0 0 32
[17] .eh_frame_hdr PROGBITS 00000000000054e0 000054e0
000000000000023c 0000000000000000 A 0 0 4
[18] .eh_frame PROGBITS 0000000000005720 00005720
0000000000000b5c 0000000000000000 A 0 0 8
[19] .init_array INIT_ARRAY 0000000000206d68 00006d68
0000000000000008 0000000000000008 WA 0 0 8
[20] .fini_array FINI_ARRAY 0000000000206d70 00006d70
0000000000000008 0000000000000008 WA 0 0 8
[21] .jcr PROGBITS 0000000000206d78 00006d78
0000000000000008 0000000000000000 WA 0 0 8
[22] .data.rel.ro PROGBITS 0000000000206d80 00006d80
0000000000000058 0000000000000000 WA 0 0 32
[23] .dynamic DYNAMIC 0000000000206dd8 00006dd8
00000000000001e0 0000000000000010 WA 6 0 8
[24] .got PROGBITS 0000000000206fb8 00006fb8
0000000000000030 0000000000000008 WA 0 0 8
[25] .got.plt PROGBITS 0000000000207000 00007000
0000000000000188 0000000000000008 WA 0 0 8
[26] .data PROGBITS 00000000002071a0 000071a0
0000000000000080 0000000000000000 WA 0 0 32
[27] .bss NOBITS 0000000000207220 00007220
00000000000001a0 0000000000000000 WA 0 0 32
[28] .gnu_debuglink PROGBITS 0000000000000000 00007220
0000000000000034 0000000000000000 0 0 1
[29] .shstrtab STRTAB 0000000000000000 00007254
000000000000010f 0000000000000000 0 0 1
Key to Flags:
W (write), A (alloc), X (execute), M (merge), S (strings), I (info),
L (link order), O (extra OS processing required), G (group), T (TLS),
C (compressed), x (unknown), o (OS specific), E (exclude),
l (large), p (processor specific)
Salida de objdump -T true
(funciones externas vinculadas dinámicamente en tiempo de ejecución)
$ objdump -T true
true: file format elf64-x86-64
DYNAMIC SYMBOL TABLE:
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __uflow
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 getenv
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 free
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 abort
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __errno_location
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 strncmp
0000000000000000 w D *UND* 0000000000000000 _ITM_deregisterTMCloneTable
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 _exit
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __fpending
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 textdomain
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fclose
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 bindtextdomain
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 dcgettext
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __ctype_get_mb_cur_max
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 strlen
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.4 __stack_chk_fail
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 mbrtowc
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 strrchr
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 lseek
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 memset
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fscanf
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 close
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __libc_start_main
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 memcmp
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fputs_unlocked
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 calloc
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 strcmp
0000000000000000 w D *UND* 0000000000000000 __gmon_start__
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.14 memcpy
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fileno
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 malloc
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fflush
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 nl_langinfo
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 ungetc
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __freading
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 realloc
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fdopen
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 setlocale
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.3.4 __printf_chk
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 error
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 open
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fseeko
0000000000000000 w D *UND* 0000000000000000 _Jv_RegisterClasses
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 __cxa_atexit
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 exit
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 fwrite
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.3.4 __fprintf_chk
0000000000000000 w D *UND* 0000000000000000 _ITM_registerTMCloneTable
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 mbsinit
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.2.5 iswprint
0000000000000000 w DF *UND* 0000000000000000 GLIBC_2.2.5 __cxa_finalize
0000000000000000 DF *UND* 0000000000000000 GLIBC_2.3 __ctype_b_loc
0000000000207228 g DO .bss 0000000000000008 GLIBC_2.2.5 stdout
0000000000207220 g DO .bss 0000000000000008 GLIBC_2.2.5 __progname
0000000000207230 w DO .bss 0000000000000008 GLIBC_2.2.5 program_invocation_name
0000000000207230 g DO .bss 0000000000000008 GLIBC_2.2.5 __progname_full
0000000000207220 w DO .bss 0000000000000008 GLIBC_2.2.5 program_invocation_short_name
0000000000207240 g DO .bss 0000000000000008 GLIBC_2.2.5 stderr
command -V true
nowhich
. Saldrá:true is a shell builtin
para bash.