¿Qué pasa con el uso re
y la set
configuración de una bandera (aquí 0 y 1) en python? Extraerá re
todos los nombres (apellido y primer nombre) desde BENNETT MCCARL & ARNETTE BENNETT
afuera &
. Para la coincidencia de patrones re
es de máxima prioridad: puede usar re
cómo desee.
import re
def sorter(val):
words = re.findall(r'\w+',val)
uniques = set(words)
if len(words)>len(uniques):
return 1
else:
return 0
Y llama sorter( !N! )
** Vea cómo regex
agarra palabras enLIVE DEMO
Tenga en cuenta que todas estas respuestas resuelven el problema suponiendo que sus datos están desinfectados, es decir, que tienen un espacio adecuado entre las palabras, pero qué pasa si sus datos son algo así, BENNETTMCCARL&ARNETTEBENNETT
entonces todos estos fallarían. En ese caso, es posible que necesite usar el algoritmo Suffix Tree y, afortunadamente, python tiene alguna biblioteca como aquí .