Estoy usando tre-agrep
(manpage) , una implementación de agrep
(manpage) , para realizar una coincidencia aproximada de patrones. Esta utilidad busca coincidencias en función de la distancia de Levenshtein , y el usuario puede configurar la penalización aplicada para las ediciones de sustitución, inserción o eliminación.
Sin embargo, me gustaría aplicar ponderaciones diferenciales a lo largo de la consulta, es decir, con una ponderación menor para las eliminaciones al principio (extremo izquierdo) de la consulta que a la derecha. La man
página de esta utilidad no indica que tal nivel de control sea posible.
¿Existen otras herramientas de línea de comando en las que es posible una coincidencia aproximada con un control más fino sobre las penalizaciones por desajuste?
agrep
realmente necesitan, probablemente podría preparar algo. Calcular la distancia de Levenshtein de dos cuerdas es muy fácil, de verdad. Sugeriría un script de shell envuelto alrededor de la invocación de GNU awk.