Python truncar una cadena larga

130

¿Cómo se trunca una cadena de 75 caracteres en Python?Python truncar una cadena larga

Ésta es la forma en que se lleva a cabo en JavaScript:

var data="saddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddsaddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddsadddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd" 
var info = (data.length > 75) ? data.substring[0,75] + '..' : data;

Fuente

2010-05-20 Hulk

238

info = (data[:75] + '..') if len(data) > 75 else data

Fuente

2010-05-20 09:38:05

+32

que cambiaría la condición quizá a ' len (data)> 77' para dar cuenta de los puntos dobles (no tiene sentido truncar solo el último carácter solo para reemplazarlo por un punto). – hasen

@hasenj: Eso no se ajustaría al código original, pero es una buena sugerencia que debería haber señalado en primer lugar. –

Tenga en cuenta que los parens incluidos son, por supuesto, opcionales. –

Usted podría utilizar esta sola línea:

data = (data[:75] + '..') if len(data) > 75 else data

Fuente

2010-05-20 09:44:08 phoenix24

Aún más concisa:

data = data[:75]

Si es menos de 75 caracteres, no habrá cambios.

Fuente

2010-05-20 11:48:37 neil

Es de suponer que quiere una elipsis adjunta si la cadena se trunca. – FogleBird

Tienes razón, nunca lo noté. No puedo pensar en una mejor manera de hacer eso que otras respuestas. – neil

aún más corto:

info = data[:75] + (data[75:] and '..')

Fuente

2010-05-20 11:58:46 stanlekub

enfoque divertido para hacerlo. Aunque sigue siendo un compuesto de una sola línea. ^^ – Cheery

¿esta solución no tiene 77 caracteres si incluye el '..'? –

@MarkChackerian: Sí, según el código original. –

 >>> info = lambda data: len(data)>10 and data[:10]+'...' or data 
     >>> info('sdfsdfsdfsdfsdfsdfsdfsdfsdfsdfsdf') 
      'sdfsdfsdfs...' 
     >>> info('sdfsdf') 
      'sdfsdf' 
     >>>

Fuente

2014-05-07 14:10:30 Spouk

Por favor explique su respuesta? – Gwenc37

ejemplo similar de esta función info2 def (datos): si len (datos)> 10: datos de retorno [10] + '...' otra cosa: datos de retorno instrucción lambda del diseño sin nombre con un estilo funcional ex = lambda x: x + 1 def ex (x): retorno x + 1 – Spouk

Con expresiones regulares:

re.sub(r'^(.{75}).*$', '\g<1>...', data)

cadenas largas se truncan:

>>> data="11111111112222222222333333333344444444445555555555666666666677777777778888888888" 
>>> re.sub(r'^(.{75}).*$', '\g<1>...', data) 
'111111111122222222223333333333444444444455555555556666666666777777777788888...'

Shorter cuerdas nunca se trunca:

>>> data="11111111112222222222333333" 
>>> re.sub(r'^(.{75}).*$', '\g<1>...', data) 
'11111111112222222222333333'

De esta manera, también puede "cortar" la parte media de la cadena, lo que es más agradable en algunos casos:

re.sub(r'^(.{5}).*(.{5})$', '\g<1>...\g<2>', data) 

>>> data="11111111112222222222333333333344444444445555555555666666666677777777778888888888" 
>>> re.sub(r'^(.{5}).*(.{5})$', '\g<1>...\g<2>', data) 
'11111...88888'

Fuente

2014-06-05 08:41:44

así que no trabaja cuando tiene espacios en la cadena de – holms

@holms funciona para mí! :) http://pastebin.com/28DR9xzL –

¿Por qué usarías Regex para un caso tan simple? – boramalper

Usted puede en realidad no "truncar" una cadena de Python como se hace hacer una cadena C dinámicamente asignada. Las cadenas en Python son inmutables. Lo que puede hacer es cortar una cadena como se describe en otras respuestas, produciendo una nueva cadena que contiene solo los caracteres definidos por los desplazamientos de corte y el paso. En algunos casos (no prácticos) esto puede ser un poco molesto, como cuando elige Python como el idioma de su entrevista y el entrevistador le pide que elimine los caracteres duplicados de una cadena en el lugar. Doh.

Fuente

2015-09-04 22:07:40 Dave

Para una solución de Django (que no ha sido mencionado en la pregunta):

from django.utils.text import Truncator 
value = Truncator(value).chars(75)

Tenga una mirada en el código fuente de truncador de apreciar el problema: https://github.com/django/django/blob/master/django/utils/text.py#L66

En cuanto truncamiento con Django: Django HTML truncation

Fuente

2016-01-25 13:30:08 Risadinha

Otra solución más. Con True y False obtendrá un pequeño comentario sobre la prueba al final.

data = {True: data[:75] + '..', False: data}[len(data) > 75]

Fuente

2016-03-10 01:40:35

No hay necesidad de una expresión regular, pero sí desea utilizar el formato de cadena en lugar de la concatenación de cadenas en la respuesta aceptada.

Esta es probablemente la forma más canónica y tricónica de truncar la cadena data a 75 caracteres.

>>> data = "saddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddsaddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddsadddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddddd" 
>>> info = "{}..".format(data[:75]) if len(data) > 75 else data 
>>> info 
'111111111122222222223333333333444444444455555555556666666666777777777788888...'

Fuente

2016-07-18 21:09:19

Me pareció gracioso cómo su cadena 'saddddddd ...' se convierte en '111111 ...' :) Sé que es un error de copiar y pegar, y estoy de acuerdo con usted acerca de las expresiones regulares. – akarilimano

Este método no utiliza ningún tipo si:

data[:75] + bool(data[75:]) * '..'

Fuente

2016-07-31 09:56:09 Sassan

Lo escribí solo para mostrar que es posible. Va en contra de la filosofía de legibilidad de Python. No tiene ninguna ventaja de rendimiento en comparación con otros métodos basados en "si". Nunca lo uso y no sugiero que lo uses también. – Sassan

Si está utilizando Python 3.4+, puede utilizar textwrap.shorten de la librería estándar:

colapso y truncar el texto dado para caber en el ancho dado.

Primero, el espacio en blanco en el texto se contrae (todos los espacios en blanco se reemplazan por por espacios simples). Si el resultado se ajusta al ancho, se devuelve. De lo contrario, suficientes palabras se lanzan desde el final para que los palabras restantes, más el ajuste marcador de posición dentro del ancho:
>>> textwrap.shorten("Hello world!", width=12) 
'Hello world!' 
>>> textwrap.shorten("Hello world!", width=11) 
'Hello [...]' 
>>> textwrap.shorten("Hello world", width=10, placeholder="...") 
'Hello...' 

Fuente

2016-08-18 11:52:56 boramalper

Parece que se caga en pantalones en cuerdas realmente largas (sin espacios) y solo produce puntos suspensivos. – elBradford

@elBradford (y otros interesados): eso es porque 'shorten()' trunca * words *, no solo caracteres. Busqué pero no parece una forma de configurar 'shorten()' o una instancia 'TextWrapper' para cortar caracteres individuales y no palabras. – none

Y tiene el molesto efecto secundario de eliminar saltos de línea – havlock

Esto acaba de llegar:

n = 8 
s = '123' 
print s[:n-3] + (s[n-3:], '...')[len(s) > n] 
s = '12345678' 
print s[:n-3] + (s[n-3:], '...')[len(s) > n] 
s = '123456789'  
print s[:n-3] + (s[n-3:], '...')[len(s) > n] 
s = '123456789' 
print s[:n-3] + (s[n-3:], '...')[len(s) > n] 

123 
12345678 
12345... 
12345...

Fuente

2016-12-15 17:36:15 dansalmo

Respuesta

Cuestiones relacionadas