Para ser preciso
Some text
begin
Some text goes here.
end
Some more text
y quiero extraer todo el bloque que comienza desde "comenzar" hasta "terminar".
con awk podemos hacer me gusta awk '/begin/,/end/' text
.
¿Cómo hacer con grep?
Para ser preciso
Some text
begin
Some text goes here.
end
Some more text
y quiero extraer todo el bloque que comienza desde "comenzar" hasta "terminar".
con awk podemos hacer me gusta awk '/begin/,/end/' text
.
¿Cómo hacer con grep?
Respuestas:
Actualizado el 18 de noviembre de 2016 (dado que el comportamiento de grep ha cambiado: grep con el parámetro -P ahora no es compatible ^
y $
ancla [en Ubuntu 16.04 con kernel v: 4.4.0-21-generic]) ( corrección incorrecta (no) )
$ grep -Pzo "begin(.|\n)*\nend" file
begin
Some text goes here.
end
nota: para otros comandos simplemente reemplace los anclajes '^' y '$' con el ancla de nueva línea '\n'
______________________________
Con el comando grep:
grep -Pzo "^begin\$(.|\n)*^end$" file
Si desea no incluir los patrones "comienzo" y "fin" en el resultado, use grep con soporte Lookbehind y Lookahead.
grep -Pzo "(?<=^begin$\n)(.|\n)*(?=\n^end$)" file
También puede usar la \K
notificación en lugar de la aserción Lookbehind.
grep -Pzo "^begin$\n\K(.|\n)*(?=\n^end$)" file
\K
La opción ignorar todo antes de la coincidencia de patrones e ignorar el patrón mismo.
\n
Se utiliza para evitar imprimir líneas vacías desde la salida.
O como @AvinashRaj sugiere que hay grep simple y simple de la siguiente manera:
grep -Pzo "(?s)^begin$.*?^end$" file
grep -Pzo "^begin\$[\s\S]*?^end$" file
(?s)
le dice a grep que permita que el punto coincida con los caracteres de nueva línea.
[\s\S]
coincide con cualquier carácter que sea espacio en blanco o no espacio en blanco.
Y su salida sin incluir "comenzar" y "finalizar" es la siguiente:
grep -Pzo "^begin$\n\K[\s\S]*?(?=\n^end$)" file # or grep -Pzo "(?<=^begin$\n)[\s\S]*?(?=\n^end$)"
grep -Pzo "(?s)(?<=^begin$\n).*?(?=\n^end$)" file
vea la prueba completa de todos los comandos aquí ( desactualizado ya que se modifica el comportamiento grep con el parámetro -P )
^
señalar el comienzo de una línea y $
señalar el final de una línea. estos se agregaron a "comenzar" y "terminar" para unirlos si están solos en una línea.
En dos comandos escapé $
porque también lo uso para "Sustitución de comandos" ( $(command)
) que permite que la salida de un comando reemplace el nombre del comando.
-o, --only-matching
Print only the matched (non-empty) parts of a matching line,
with each such part on a separate output line.
-P, --perl-regexp
Interpret PATTERN as a Perl compatible regular expression (PCRE)
-z, --null-data
Treat the input as a set of lines, each terminated by a zero byte (the ASCII
NUL character) instead of a newline. Like the -Z or --null option, this option
can be used with commands like sort -z to process arbitrary file names.
grep -Pzo "(?<=begin\n)(.|\n)*(?=\nend)" file
para no imprimir el \n
carácter que existe en la línea de inicio.
grep -Pzo "(?s)begin.*?end" file
grep -Pzo "begin[\s\S]*?end" file
grep: ein nicht geschütztes ^ oder $ wird mit -Pz nicht unterstützt
la traducción del error es algo así como:grep: a not protected ^ or $ is not supported with -Pz
grep
parece haber cambiado.