¿Cómo se tratan generalmente los comentarios en lenguajes de programación y marcado? Estoy escribiendo un analizador para un lenguaje de marcado personalizado y quiero seguir el principio de menor sorpresa , así que estoy tratando de determinar la convención general.
Por ejemplo, ¿debería un comentario incrustado dentro de un token 'interferir' con el token o no? En general, es algo como:
Sys/* comment */tem.out.println()
¿válido?
Además, si el lenguaje es sensible a las nuevas líneas y el comentario abarca la nueva línea, ¿debería considerarse o no la nueva línea?
stuff stuff /* this is comment
this is still comment */more stuff
ser tratado como
stuff stuff more stuff
o
stuff stuff
more stuff
?
Sé lo que hacen algunos idiomas específicos, ni estoy buscando opiniones, pero estoy buscando si hay o no: ¿hay un consenso general sobre lo que generalmente se espera con un marcado en lo que respecta a tokens y nuevas líneas?
Mi contexto particular es un marcado tipo wiki.