Si desea fusionar texto roto mientras conserva la mayor cantidad posible de formato, ubicación, párrafos y otra tipografía del texto existente, en lugar de pegar en un área de texto recién creada como texto plano, puede probar John Wundes ' increíble guión de unirse a marcos de texto .
Hace exactamente lo que dice en la lata: fusiona fragmentos de texto en un fragmento de texto, haciendo juicios inteligentes basados en dónde se relacionan entre sí:
- Fusiona fragmentos de texto adyacentes (por ejemplo, de líneas discontinuas de texto de archivos PDF) en líneas individuales, con cierto control ofrecido sobre qué tan cerca se considera la misma línea.
- Fusiona líneas de texto separadas en un objeto de texto de varias líneas con el texto en el orden correcto (de arriba a abajo), arreglando párrafos rotos.
- Luego hay una opción para restaurar el formato original de todo el texto combinado. Esto puede llevar un tiempo, pero de manera útil le brinda estimaciones bastante precisas de cuánto tiempo llevará y la opción de omitir si no vale la pena.
¡Es muy bueno!
Tenga en cuenta que solo funciona en texto de punto, no en texto de área (bien aquí, ya que los PDF casi siempre son texto de punto). Si está intentando fusionar texto de área por cualquier motivo, puede convertirlo con el script 'Hacer punto de texto' de Kelso Cartography
También es útil usado en conjunción con AjarProductions' Convertir a Área de texto guión (Kelso Cartografía también tienen un guión semejante, ver enlace anterior), si desea volver atrás en el texto roto en las áreas de texto adecuados con los párrafos de auto-fluye:
- Seleccione los fragmentos de texto rotos, ejecute el script Unir marcos de texto
- Copie y pegue el texto en un editor de texto que le permite buscar / reemplazar caracteres de párrafo (por ejemplo, InDesign, el editor de texto sin formato de un codificador, o tal vez incluso algo como ( susurros ) Word ...)
Encuentra / reemplaza los saltos de final de línea no deseados. Si hay muchos párrafos separados que desea conservar, 1) ¿está seguro de que no sería mejor usar InDesign? 2) podrías hacerlo así:
- Busque / reemplace dos marcadores de párrafo consecutivos con algún marcador de posición de texto que no aparece en ningún otro lugar del texto (p
\|\C.L.O.W.N.H.O.R.R.O.R/|/
. Ej. )
- Buscar / reemplazar marcadores de párrafo con nada o espacios: convirtiéndolo en una larga línea de texto con ráfagas ocasionales de
\|\C.L.O.W.N.H.O.R.R.O.R/|/
- Buscar / reemplazar
\|\C.L.O.W.N.H.O.R.R.O.R/|/
un nuevo carácter de párrafo, que coloca un párrafo dondequiera que estuvieran dos.
Vuelva a copiar el texto y ejecute el script Convertir a área de texto en él. Ahora es un área de texto fluido con saltos de párrafo en los lugares correctos.
Desafortunadamente, nada puede arreglar el texto resumido, excepto evitar que se describa, volver a escribirlo o confiar en un software de OCR potencialmente dudoso.