Respuestas:
El .title()
método de una cadena (ya sea ASCII o Unicode está bien) hace esto:
>>> "hello world".title()
'Hello World'
>>> u"hello world".title()
u'Hello World'
Sin embargo, busque cadenas con apóstrofes incrustados, como se señala en los documentos.
El algoritmo utiliza una definición simple de una palabra independiente del idioma como grupos de letras consecutivas. La definición funciona en muchos contextos, pero significa que los apóstrofes en las contracciones y posesivos forman límites de palabras, que pueden no ser el resultado deseado:
>>> "they're bill's friends from the UK".title() "They'Re Bill'S Friends From The Uk"
"e g 3b"
, el resultado deseado sería "E G 3b"
. Sin embargo, "e g 3b".title()
vuelve "E G 3B"
.
In [2]: 'tEst'.title() Out[2]: 'Test'
El .title()
método no puede funcionar bien
>>> "they're bill's friends from the UK".title()
"They'Re Bill'S Friends From The Uk"
string.capwords()
Método de prueba ,
import string
string.capwords("they're bill's friends from the UK")
>>>"They're Bill's Friends From The Uk"
De los documentos de Python en capwords :
Divide el argumento en palabras usando str.split (), escribe cada palabra en mayúscula usando str.capitalize () y une las palabras en mayúscula usando str.join (). Si el segundo argumento opcional sep está ausente o Ninguno, las series de caracteres de espacios en blanco se reemplazan por un solo espacio y los espacios en blanco iniciales y finales se eliminan; de lo contrario, sep se usa para dividir y unir las palabras.
"There once was a string with an 'that had words right after it and then closed'"
. Con este ejemplo, todos los mundos excepto that
se capitalizan como se esperaba. Los resultados son"There Once Was A String With An 'that Had Words Right After It And Then Closed'"
title()
en situaciones normales. En mi situación, title()
devuelve una salida incorrecta para nombres con acentos o diéresis, mientras se capwords()
maneja correctamente.
Solo porque este tipo de cosas es divertido para mí, aquí hay dos soluciones más.
Divídase en palabras, encierre en mayúsculas cada palabra de los grupos divididos y vuelva a unirse. Esto cambiará el espacio en blanco que separa las palabras en un solo espacio en blanco, sin importar lo que sea.
s = 'the brown fox'
lst = [word[0].upper() + word[1:] for word in s.split()]
s = " ".join(lst)
EDITAR: No recuerdo lo que estaba pensando cuando escribí el código anterior, pero no hay necesidad de crear una lista explícita; podemos usar una expresión generadora para hacerlo de manera perezosa. Así que aquí hay una mejor solución:
s = 'the brown fox'
s = ' '.join(word[0].upper() + word[1:] for word in s.split())
Use una expresión regular para que coincida con el comienzo de la cadena, o palabras de separación de espacios en blanco, más un solo carácter que no sea un espacio en blanco; use paréntesis para marcar "grupos de coincidencia". Escriba una función que tome un objeto de coincidencia y devuelva el grupo de coincidencia de espacios en blanco sin cambios y el grupo de coincidencia de caracteres sin espacios en blanco en mayúsculas. Luego use re.sub()
para reemplazar los patrones. Este no tiene los problemas de puntuación de la primera solución, ni rehace el espacio en blanco como mi primera solución. Este produce el mejor resultado.
import re
s = 'the brown fox'
def repl_func(m):
"""process regular expression match groups for word upper-casing problem"""
return m.group(1) + m.group(2).upper()
s = re.sub("(^|\s)(\S)", repl_func, s)
>>> re.sub("(^|\s)(\S)", repl_func, s)
"They're Bill's Friends From The UK"
Me alegro de haber investigado esta respuesta. ¡No tenía idea de que re.sub()
podría tomar una función! ¡Puede hacer un procesamiento no trivial re.sub()
para producir el resultado final!
string.capwords
hace, según la documentación en la respuesta de Chen Houwu.
Aquí hay un resumen de las diferentes formas de hacerlo, funcionarán para todas estas entradas:
"" => ""
"a b c" => "A B C"
"foO baR" => "FoO BaR"
"foo bar" => "Foo Bar"
"foo's bar" => "Foo's Bar"
"foo's1bar" => "Foo's1bar"
"foo 1bar" => "Foo 1bar"
- La solución más simple es dividir la oración en palabras y poner en mayúscula la primera letra y luego volver a unirla:
# Be careful with multiple spaces, and empty strings
# for empty words w[0] would cause an index error,
# but with w[:1] we get an empty string as desired
def cap_sentence(s):
return ' '.join(w[:1].upper() + w[1:] for w in s.split(' '))
- Si no desea dividir la cadena de entrada en palabras primero y usar generadores elegantes:
# Iterate through each of the characters in the string and capitalize
# the first char and any char after a blank space
from itertools import chain
def cap_sentence(s):
return ''.join( (c.upper() if prev == ' ' else c) for c, prev in zip(s, chain(' ', s)) )
- O sin importar herramientas de iterto:
def cap_sentence(s):
return ''.join( (c.upper() if i == 0 or s[i-1] == ' ' else c) for i, c in enumerate(s) )
- O puede usar expresiones regulares, de la respuesta de steveha :
# match the beginning of the string or a space, followed by a non-space
import re
def cap_sentence(s):
return re.sub("(^|\s)(\S)", lambda m: m.group(1) + m.group(2).upper(), s)
Ahora, estas son algunas otras respuestas que se publicaron, y las entradas para las que no funcionan como se esperaba si estamos utilizando la definición de una palabra que es el comienzo de la oración o algo después de un espacio en blanco:
return s.title()
# Undesired outputs:
"foO baR" => "Foo Bar"
"foo's bar" => "Foo'S Bar"
"foo's1bar" => "Foo'S1Bar"
"foo 1bar" => "Foo 1Bar"
return ' '.join(w.capitalize() for w in s.split())
# or
import string
return string.capwords(s)
# Undesired outputs:
"foO baR" => "Foo Bar"
"foo bar" => "Foo Bar"
usar '' para la división arreglará la segunda salida, pero capwords () aún no funcionará para la primera
return ' '.join(w.capitalize() for w in s.split(' '))
# or
import string
return string.capwords(s, ' ')
# Undesired outputs:
"foO baR" => "Foo Bar"
Tenga cuidado con múltiples espacios en blanco
return ' '.join(w[0].upper() + w[1:] for w in s.split())
# Undesired outputs:
"foo bar" => "Foo Bar"
lower 123 upper
debería volver lower 123 Upper
, donde upper
se escribe con mayúscula como sigue a un número. Sé que va más allá del alcance de la pregunta del OP, pero es un buen complemento para su respuesta ya extensa. Gracias por adelantado.
"([0-9]+)(\s+.)"
lugar de "(^|\s)(\S)"
(hacer coincidir uno o más números, seguido de uno o más espacios y cualquier carácter después), o "([0-9]+)(\s*.)"
si desea poner en mayúscula el carácter después de 'cero o más' espacios después de número
WW1 - the great war
y la salida en WW1 - The Great War
lugar de Ww1 ...
? ¿Ves el problema con las abreviaturas? ¿Estaría dispuesto a agregar algo que demuestre este caso? Me he estado preguntando sobre esto por un tiempo y no puedo pensar en una forma de hacerlo.
WW1
lo que saldría comoWW1
Versión lista para copiar y pegar de @jibberia anwser:
def capitalize(line):
return ' '.join(s[:1].upper() + s[1:] for s in line.split(' '))
str.join
acepta generadores.
join
acepta gen exps, en el caso str.join
particular, generalmente se prefiere usar una lista de comprensión. Esto se debe a que join
itera dos veces sobre el argumento y, por lo tanto, es más rápido proporcionar una lista lista para usar en lugar de un generador.
str.join
necesitaría repetir dos veces el argumento? Acabo de comprobarlo, no lo hace. Aunque para secuencias pequeñas la comprensión de la lista es más rápida.
¿Por qué complicas tu vida con uniones y bucles cuando la solución es simple y segura?
Solo haz esto:
string = "the brown fox"
string[0].upper()+string[1:]
"the brown fox".capitalize()
?
'this is John'
en 'This is john'
.
string.capitalize()
(esencialmente haciéndose eco de @luckydonald)
Si str.title () no funciona para usted, haga las mayúsculas usted mismo.
Un trazador de líneas:
>>> ' '.join([s[0].upper() + s[1:] for s in "they're bill's friends from the UK".split(' ')])
"They're Bill's Friends From The UK"
Claro ejemplo:
input = "they're bill's friends from the UK"
words = input.split(' ')
capitalized_words = []
for word in words:
title_case_word = word[0].upper() + word[1:]
capitalized_words.append(title_case_word)
output = ' '.join(capitalized_words)
Si solo quieres la primera letra:
>>> 'hello world'.capitalize()
'Hello world'
Pero para capitalizar cada palabra:
>>> 'hello world'.title()
'Hello World'
'hello New York'.capitalize()
es'Hello new york'
Una cadena vacía generará un error si accede a [1:], por lo tanto, usaría:
def my_uppercase(title):
if not title:
return ''
return title[0].upper() + title[1:]
en mayúscula solo la primera letra.
str.capitalize
sirve?
return title[:1].upper() + title[1:]
También se encargará de eso problema, ya que cortar la cadena vacía como eso daría a 2 cadenas vacías, se unieron hacer una cadena vacía que se devuelve
Como Mark señaló, debes usar .title()
:
"MyAwesomeString".title()
Sin embargo, si desea poner la primera letra en mayúscula dentro de una plantilla de django , puede usar esto:
{{ "MyAwesomeString"|title }}
o usando una variable:
{{ myvar|title }}
El método sugerido str.title () no funciona en todos los casos. Por ejemplo:
string = "a b 3c"
string.title()
> "A B 3C"
en lugar de "A B 3c"
.
Creo que es mejor hacer algo como esto:
def capitalize_words(string):
words = string.split(" ") # just change the split(" ") method
return ' '.join([word.capitalize() for word in words])
capitalize_words(string)
>'A B 3c'
Aunque todas las respuestas ya son satisfactorias, trataré de cubrir los 2 casos adicionales junto con todos los casos anteriores.
si los espacios no son uniformes y quieres mantener el mismo
string = hello world i am here.
si todas las cadenas no comienzan desde alfabetos
string = 1 w 2 r 3g
Aquí puedes usar esto
def solve(s):
a = s.split(' ')
for i in range(len(a)):
a[i]= a[i].capitalize()
return ' '.join(a)
esto te dará
output = Hello World I Am Here
output = 1 W 2 R 3g
Espero que esto no sea redundante.
Para capitalizar palabras ...
str = "this is string example.... wow!!!";
print "str.title() : ", str.title();
@ Gary02127 comentario, debajo del título del trabajo de solución con apóstrofe
import re
def titlecase(s):
return re.sub(r"[A-Za-z]+('[A-Za-z]+)?", lambda mo: mo.group(0)[0].upper() + mo.group(0)[1:].lower(), s)
text = "He's an engineer, isn't he? SnippetBucket.com "
print(titlecase(text))
No pase por alto la preservación del espacio en blanco. Si desea procesar 'fred flinstone'
y obtiene en 'Fred Flinstone'
lugar de 'Fred Flinstone'
, ha corrompido su espacio en blanco. Algunas de las soluciones anteriores perderán espacio en blanco. Aquí hay una solución que es buena para Python 2 y 3 y conserva el espacio en blanco.
def propercase(s):
return ''.join(map(''.capitalize, re.split(r'(\s+)', s)))
Una función rápida funcionó para Python 3
Python 3.6.9 (default, Nov 7 2019, 10:44:02)
[GCC 8.3.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> capitalizeFirtChar = lambda s: s[:1].upper() + s[1:]
>>> print(capitalizeFirtChar('помните своих Предковъ. Сражайся за Правду и Справедливость!'))
Помните своих Предковъ. Сражайся за Правду и Справедливость!
>>> print(capitalizeFirtChar('хай живе вільна Україна! Хай живе Любовь поміж нас.'))
Хай живе вільна Україна! Хай живе Любовь поміж нас.
>>> print(capitalizeFirtChar('faith and Labour make Dreams come true.'))
Faith and Labour make Dreams come true.
Capitalizar cadena con espacios no uniformes
Bueno, entiendo que esta es una vieja pregunta y probablemente las respuestas casi se hayan agotado, pero me gustaría agregar al punto de espacios no uniformes de @Amit Gupta. De la pregunta original, nos gustaría capitalizar cada palabra en la cadena s = 'the brown fox'
. ¿Qué pasa si la cadena estaba s = 'the brown fox'
con espacios no uniformes?
def solve(s):
# if you want to maintain the spaces in the string, s = 'the brown fox'
# use s.split(' ') instead of s.split().
# s.split() returns ['the', 'brown', 'fox']
# while s.split(' ') returns ['the', 'brown', '', '', '', '', '', 'fox']
capitalized_word_list = [word.capitalize() for word in s.split(' ')]
return ' '.join(capitalized_word_list)
** En caso de que quiera reducir el tamaño **
#Assuming you are opening a new file
with open(input_file) as file:
lines = [x for x in reader(file) if x]
#for loop to parse the file by line
for line in lines:
name = [x.strip().lower() for x in line if x]
print(name) #check the result
Realmente me gusta esta respuesta:
Versión lista para copiar y pegar de @jibberia anwser:
def capitalize(line):
return ' '.join([s[0].upper() + s[1:] for s in line.split(' ')])
Pero algunas de las líneas que estaba enviando separaron algunos caracteres en blanco '' que causaron errores al intentar hacer s [1:]. Probablemente haya una mejor manera de hacer esto, pero tuve que agregar un if len (s)> 0, como en
return ' '.join([s[0].upper() + s[1:] for s in line.split(' ') if len(s)>0])
" ".join(w.capitalize() for w in s.split())