Similitud y / o diferencia de dos documentos ODT (Linux)

14

Tengo dos documentos ODT, tienen contenidos muy cercanos, quiero compararlos para ver qué tan similares son.

Lo mejor sería tener un porcentaje de similitud , si no es posible, una alternativa sería al menos tener algún tipo de diferencia .

Estoy ejecutando Ubuntu Lucid .

Solución:

Solía odt2txtconvertir los archivos a texto, luego wdiff -i --statistics one.txt two.txttenía una diferencia junto con estadísticas que me daban el porcentaje de palabras comunes (similitud).

ubuntu diff odt

— Weboide
fuente

posible duplicado de ¿Cómo difiere un binario en dos archivos de tamaño idéntico en Linux?

— James Mertz

8

No los he probado yo mismo, pero este par de herramientas , odt2txt y oodiff, parece prometedor.

— JRobert
fuente

1

Usé odt2txt para convertirlos a texto, y luego usé wdiff que da una diferencia por palabra.

— Weboide

Gracias. Esto es ideal para usar en sistemas de control de versiones como git o mercurial. Ver técnicas de integración / automatización en OpenDocument, diff y revision-control

— nealmcb

20

¿Probaste la funcionalidad de comparación incorporada? Editar / Comparar documento ...

Si solo desea una diferencia textual, su mejor opción es probablemente convertir ambos documentos en texto sin formato, luego ejecutar una diferencia regular en ellos. Sin embargo, tendrá que descubrir cómo normalizar los saltos de línea, de lo contrario, la diferencia no será muy útil.

— sleske
fuente

1

Gran función en LibreOffice, ¡nunca había oído hablar de eso! Muy útil pero no se dan estadísticas.

— Stragu

¡Excelente! Nunca hubiera pensado mirar en un menú Editar para comparar documentos. Miré en Archivo , Herramientas y Ventana , siendo la última la ubicación de Word de uSoft.

— wallyk

44

En la última versión parece ser Editar -> Seguir cambios -> Comparar documento ...

— FableBlaze

1

Si no le importa el formato de texto, también puede copiar el contenido a archivos de texto sin formato y usar un buen diff antiguo.

PD: ¿Eres un maestro en busca de posibles tramposos? :pag

— Tamtakos
fuente

lol no, no soy un profesor, pero sí, esta sería una buena manera de buscar tramposos :)

— Weboide

1

La forma en que hago esto es producir archivos .pdf con libreoffice y luego usar diffpdf para comparar los dos archivos pdf. Esto muestra las diferencias resaltadas en ventanas paralelas

— Peter Allott
fuente