Este es un suplemento a la respuesta de @Dennis de las 18:06 al 30 de julio de 2012. Ciertamente aborda el caso más difícil.
En el caso más simple donde la marca de agua es texto simple, sin adornos, por ejemplo
Smedley para el comisionado
las marcas de agua PDF sin comprimir pueden definirse así:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
donde 75.96
está el desplazamiento horizontal y 625
el desplazamiento vertical para esta instancia particular de marca de agua. (Sí, se pueden ver números reales y enteros).
Una expresión regular como la siguiente funcionará para todas esas marcas de agua, ignorando cualquier variación en su ubicación:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Tenga en cuenta, sin embargo, que una variedad de operadores de PDF modificadores pueden entrar en juego con marcas de agua que tienen un formato más complicado. Tal fantasía puede transformar lo que el lector espera (¿espera?) Que sea una cadena contigua, fácil de buscar, en un desastre de sopa de letras. Por ejemplo,
E 1 = mc² por Smedley ™
Podría ser el producto de esto:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
. . . ¡o mucho peor si su marca de agua tiene color mejorado!
Habiendo notado todo esto, también notaré que PDFtk tiene una versión GUI que pretende manejar marcas de agua, en consideración a una tarifa de licencia de $ 4. No es caro en absoluto!
Por otro lado, creo que su sitio web actualmente anuncia soporte completo para O / S a través de Windows 8
y OS X 10.8 Mountain Lion
. Esa cosecha es hace más de 4 años. ¿Podría PDFtk estar desactualizado? Sospecho que no, pero no lo sé.