Tengo dos documentos ODT, tienen contenidos muy cercanos, quiero compararlos para ver qué tan similares son.
Lo mejor sería tener un porcentaje de similitud , si no es posible, una alternativa sería al menos tener algún tipo de diferencia .
Estoy ejecutando Ubuntu Lucid .
Solución:
Solía odt2txt
convertir los archivos a texto, luego wdiff -i --statistics one.txt two.txt
tenía una diferencia junto con estadísticas que me daban el porcentaje de palabras comunes (similitud).