Estoy preservando un manuscrito escrito por mi padre. Los archivos de datos están en un disquete de 5,25 ". He leído con éxito los archivos de los discos, pero ninguno de nosotros sabe de qué formato es el lenguaje de marcado. Es uno utilizado por los editores de libros a principios de la década de 1990.
Aquí hay algunas líneas de uno de los archivos.
\m\m<ps;3><l>\
<ep>\
{cn}1 \
{ct}Rethinking Universality:<qa>\
Six Cases<lrh;;1>Rethinking Universality: Six
Cases<xlrh><rrh;;2>Rethinking Universality: Six Cases<xrrh> \
{t1}In 1983 the anthropological community was convulsed by reactions to
Derek Freeman\'s <ital>Margaret Mead and Samoa: The Making and Unmaking
of a Myth.<med> Remarkably, two books with a very similar message but
by different authors attacking different myths were published within a
year of Freeman\'s. One was Melford Spiro\'s <ital>Oedipus in the
Trobriands<med> (1982); the other was Ekkehart Malotki\'s <ital>Hopi
Time<med> (1983). Each of these books refutes or questions one of the
centerpieces of anthropological relativism.\
%In <ital>Coming of Age in Samoa<med> (1928) Margaret Mead argued that
adolescence among Samoans was not the time of storm and stress that it
is in the West and, hence, that the Western conception of adolescence
is strictly cultural\Msomething that we could change. Freeman shows
that adolescence was just as stressful in Samoa as in the West and that
in other ways Samoa was not so different from Western societies as Mead
had led us to believe.\
¿Alguien puede identificar el lenguaje de marcado que se utiliza aquí?
Tengo estos dos archivos originales y el libro publicado. No sería muy difícil para mí entender qué significan los códigos. Pero si se pudiera identificar el formato, podría estar disponible algún tipo de traductor automático a algo más reciente (RTF, XML, etc.).
Editar
¡Es como un misterio por resolver! Así es como se comienza una mesa:
<begtab;tbl2;1p><setnc;2><setctr;5p><tblwidth;15p><setbgut;rsidbox;0q>
Busqué en Google algunos términos como begtab
y setbgut
. Este último mostró un documento PDF que parece tener un "error tipográfico", pero el error tipográfico es una setbgut
etiqueta casi exactamente como la de mis archivos.
http://sfmb.ulb.ac.be/pdf/J_Biol_Chem_1999_274_22_15510.pdf (buscar setbgut
)
Parece que este trabajo de investigación se presentó utilizando el mismo software. Lo traje a Acrobat y las propiedades dicen que fue generado por Xyvision Parlance Publisher (XPP). Aquí está lo mejor que he encontrado sobre ellos hasta ahora: http://www.isgmlug.org/n2-1/n2-1-49.htm
Editar 2
OK, ya veo ahora. XPP es un lenguaje de marcado similar a SGML. De hecho, la literatura de ventas de XPP anuncia cuán "fácil" es tomar un documento SGML existente y agregar sus etiquetas patentadas. Desafortunadamente, XPP fue vendido a General Dynamics hace algunos años. Traducir automáticamente el documento a, digamos, HTML es difícil sin la DTD. Sin embargo, como otros han señalado, la mayoría de las etiquetas son fáciles de entender. Algunos de ellos, como las referencias bibliográficas y los valores después del punto y coma en etiquetas como <rrh;1>
y <lp;&-1q>
todavía me eluden. Tendré que comparar el archivo con la copia física en paralelo para decodificarlo todo.
lrh
y rrh
están corriendo cabezas, respectivamente izquierda y derecha. xlrh
y xrrh
salga del modo de cabezal de ejecución. cn
centra un número donde-como ct
centra un título. ital
lo pone en modo cursiva mientras med
lo vuelve a poner en modo medio. %
comienza un nuevo párrafo donde una barra diagonal inversa simplemente continúa el párrafo. No puedo entender los otros, e hice algunos términos de búsqueda, pero ninguno revela el formato ...