Estoy buscando una forma pitónica para insertar un espacio antes de mayúsculas

Tengo un archivo cuyo formato estoy alterando a través de un script de Python. Tengo varias cadenas en camello en este archivo donde solo quiero insertar un espacio antes de la letra mayúscula, por lo que "WordWordWord" se convierte en "Word Word Word".Estoy buscando una forma pitónica para insertar un espacio antes de mayúsculas

Mi limitada experiencia en expresiones regulares solo se detuvo en mí - ¿alguien puede pensar en una expresión regular decente para hacer esto, o (mejor aún) hay una manera más pitonica de hacer esto que me estoy perdiendo?

Fuente

2008-10-13 Electrons_Ahoy

Usted podría intentar:

>>> re.sub(r"(\w)([A-Z])", r"\1 \2", "WordWordWord") 
'Word Word Word'

Fuente

2008-10-13 21:20:55

re.sub (r "(\ w) ([AZ])", r "\ 1 \ 2", "SorryIThinkYouMissedASpot") – tzot

Como pequeña mejora, se debería usar [[: upper:]] en lugar de [AZ]. – Tomalak

@Tomalak, '[[: upper:]]' no es compatible con Python. Es una [expresión de paréntesis POSIX] (http://www.regular-expressions.info/posixbrackets.html). –

Con expresiones regulares se puede hacer esto:

re.sub('([A-Z])', r' \1', str)

Por supuesto, esto sólo funcionará para los caracteres ASCII, si usted quiere hacer Unicode es una nueva lata de gusanos :-)

Fuente

2008-10-13 21:25:17

re.sub ('([A-Z])', r '\ 1', "¿Queremos un espacio antes de los D's de esta frase?") – tzot

Ah, sí, buen punto. Parece que las soluciones de tu y Leonhard manejan esto correctamente. –

Si hay mayúsculas consecutivas, entonces el resultado de Gregs podría ser no es lo que busca, ya que \ w consume el caracter en frente de la carta capial para ser reemplazado.

>>> re.sub(r"(\w)([A-Z])", r"\1 \2", "WordWordWWWWWWWord") 
'Word Word WW WW WW Word'

Una mirada detrás resolvería esto:

>>> re.sub(r"(?<=\w)([A-Z])", r" \1", "WordWordWWWWWWWord") 
'Word Word W W W W W W Word'

Fuente

2008-10-13 21:37:39 Leonhard

La respuesta de Dan es mejor y más simple :) – hayalci

@hayalci: re.sub ('([A-Z])', r '\ 1', '¿De verdad?') – tzot

Tener un vistazo a mi respuesta en .NET - How can you split a “caps” delimited string into an array?

Editar: Tal vez mejor incluir aquí.

re.sub(r'([a-z](?=[A-Z])|[A-Z](?=[A-Z][a-z]))', r'\1 ', text)

Por ejemplo:

"SimpleHTTPServer" => ["Simple", "HTTP", "Server"]

Fuente

2008-10-13 21:41:49

Tu respuesta es probablemente lo que Electrons_Ahoy realmente quiere; sin embargo, según el fraseo de su pregunta, no lo es. – tzot

pero gracias por compartir este, esta es una respuesta increíble! –

Quizás más corto:

>>> re.sub(r"\B([A-Z])", r" \1", "DoIThinkThisIsABetterAnswer?")

Fuente

2008-10-13 22:17:14 tzot

Para cualquiera que se pregunte, '\ B' es" Sin límite de palabra ". Entonces no está insertando espacios donde ya hay un espacio. – ArtOfWarfare

Estoy de acuerdo en que la solución de expresiones regulares es el más fácil, pero yo no diría que es el más Pythonic.

¿Qué tal:

text = 'WordWordWord' 
new_text = '' 

for i, letter in enumerate(text): 
    if i and letter.isupper(): 
     new_text += ' ' 

    new_text += letter

Fuente

2008-10-14 05:51:10 monkut

Esto tiene el mismo problema que el de Dan: obtendrá espacios adicionales antes de mayúsculas, incluso si no son necesarios. – Brian

Cierto, lo he editado para agregar una bandera ... Admito que es un poco engorroso, pero puede ser más fácil de recordar que la expresión regular. – monkut

Creo expresiones regulares son el camino a seguir aquí, pero sólo para dar una versión de Python puro sin (con suerte) ninguno de los problemas ΤΖΩΤΖΙΟΥ ha señalado:

def splitCaps(s): 
    result = [] 
    for ch, next in window(s+" ", 2): 
     result.append(ch) 
     if next.isupper() and not ch.isspace(): 
      result.append(' ') 
    return ''.join(result)

ventana() es una función de utilidad que utilizo para operar en una ventana deslizante de artículos, que se define como:

import collections, itertools 

def window(it, winsize, step=1): 
    it=iter(it) # Ensure we have an iterator 
    l=collections.deque(itertools.islice(it, winsize)) 
    while 1: # Continue till StopIteration gets raised. 
     yield tuple(l) 
     for i in range(step): 
      l.append(it.next()) 
      l.popleft()

Fuente

2008-10-14 09:06:22 Brian

Tal vez usted estaría interesado en la aplicación de una sola línea sin necesidad de utilizar expresiones regulares:

''.join(' ' + char if char.isupper() else char.strip() for char in text).strip()

Fuente

2017-08-20 05:02:51

Si tiene acrónimos, es probable que no quieren espacios entre ellos.Esta expresión regular de dos etapas mantendrá intacta siglas (y también el tratamiento de puntuacion y otras letras mayúsculas no como algo para agregar un espacio en):

re_outer = re.compile(r'([^A-Z ])([A-Z])') 
re_inner = re.compile(r'(?<!^)([A-Z])([^A-Z])') 
re_outer.sub(r'\1 \2', re_inner.sub(r' \1\2', 'DaveIsAFKRightNow!Cool'))

la salida será: 'Dave Is AFK Right Now! Cool'

Fuente

2017-10-15 21:14:16

Estoy buscando una forma pitónica para insertar un espacio antes de mayúsculas

Respuesta

Cuestiones relacionadas