Prueba la utilidad Unicode :
$ unicode ‽
U+203D INTERROBANG
UTF-8: e2 80 bd UTF-16BE: 203d Decimal: ‽
‽
Category: Po (Punctuation, Other)
Bidi: ON (Other Neutrals)
O la uconv
utilidad del paquete ICU :
$ printf %s ‽ | uconv -x any-name
\N{INTERROBANG}
También puede obtener información a través de la recode
utilidad:
$ printf %s ‽ | recode ..dump
UCS2 Mne Description
203D point exclarrogatif
O con Perl:
$ printf %s ‽ | perl -CLS -Mcharnames=:full -lne 'print charnames::viacode(ord) for /./g'
INTERROBANG
Tenga en cuenta que estos dan información sobre los caracteres que componen ese glifo, no sobre el glifo en su conjunto. Por ejemplo, para é
(e con la combinación de acento agudo):
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E}\N{COMBINING ACUTE ACCENT}
A diferencia del personaje independiente é:
$ printf é | uconv -x any-name
\N{LATIN SMALL LETTER E WITH ACUTE}
Puede solicitar uconv
recombinarlos (para aquellos que tienen una forma combinada):
$ printf 'e\u0301b\u0301' | uconv -x '::nfc;::name;'
\N{LATIN SMALL LETTER E WITH ACUTE}\N{LATIN SMALL LETTER B}\N{COMBINING ACUTE ACCENT}
(é tiene una forma combinada, pero no b́).
unicode
? Parece que no tengo eso instalado (y no puedo encontrarlo en los repositorios de Arch Linux). Además, ¿qué demonios esexclarrogatif
? [EDITAR: también lo entiendo aquí, aunque mi sistema no es francés.]