En python, ¿cómo se puede encontrar de manera eficiente el mayor conjunto de números consecutivos en una lista que no son necesariamente adyacentes?

Por ejemplo, si tengo una listaEn python, ¿cómo se puede encontrar de manera eficiente el mayor conjunto de números consecutivos en una lista que no son necesariamente adyacentes?

[1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11]

Este algoritmo debe devolver [1,2,3,4,5,6,7,8,9,10,11].

Para aclarar, la lista más larga debe ejecutarse hacia adelante. Me preguntaba ¿cuál es una manera algorítmicamente eficiente de hacer esto (preferiblemente no O (n^2))?

Además, estoy abierto a una solución que no está en Python ya que el algoritmo es lo que importa.

Gracias.

Fuente

2011-12-29 dangerChihuahua007

por qué no '[1,2,3,4,5,6,7,8 , 9,10,11] '.No veo ninguna razón para que estos números no estén incluidos ya que no tienen que ser adyacentes. – Serdalis

Lo siento, mi error. Gracias por la corrección. – dangerChihuahua007

¿Puede la secuencia consecutiva más larga comenzar en un número distinto de 1? –

Aquí es un simple de una sola pasada O solución (n):

s = [1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11,42] 
maxrun = -1 
rl = {} 
for x in s: 
    run = rl[x] = rl.get(x-1, 0) + 1 
    print x-run+1, 'to', x 
    if run > maxrun: 
     maxend, maxrun = x, run 
print range(maxend-maxrun+1, maxend+1)

La lógica puede ser un poco más evidente si se piensa en términos de intervalos en lugar de las variables individuales para el punto final y de ejecución longitud:

rl = {} 
best_range = xrange(0) 
for x in s: 
    run = rl[x] = rl.get(x-1, 0) + 1 
    r = xrange(x-run+1, x+1) 
    if len(r) > len(best_range): 
     best_range = r 
print list(best_range)

Fuente

2011-12-29 08:29:19

+1 Chapeau !!!! – jimifiki

@RaymondHettinger - ¿debería ser esa última línea: 'rango de impresión (maxend-maxrun + 1, maxend + 1)'? De lo contrario, para 's = [1,4,2,3,5,4,9,10,11,5,6,7,8,1,3,4,5]' Solo obtengo '[4, 5, 6, 7, 8] ', no' [1, 2, 3, 4, 5, 6, 7, 8] '. – PaulMcG

@nightcracker - ¿Lo ejecutó y obtuvo un IndexError, o simplemente está ejecutando esto en su cabeza? La asignación encadenada funciona de derecha a izquierda, y rl.get tiene un valor predeterminado de 0 pasado, por lo que no hay IndexError allí. Y como rl [1] obtiene el valor de 0 + 1 = 1, entonces se puede copiar a 'ejecutar', y nuevamente, no a IndexError. Intenta ejecutar esto, realmente funciona correctamente. – PaulMcG

-2

Esto debería hacer el truco (y es O (n)):

target = 1 
result = [] 
for x in list: 
    for y in result: 
     if y[0] == target: 
      y[0] += 1 
      result.append(x)

Para cualquier número de partida, esto funciona:

result = [] 
for x in mylist: 
    matched = False 
    for y in result: 
     if y[0] == x: 
      matched = True 
      y[0] += 1 
      y.append(x) 
    if not matched: 
     result.append([x+1, x]) 
return max(result, key=len)[1:]

Fuente

2011-12-29 06:38:29 jknupp

+1, a menos que la secuencia pueda comenzar en números distintos de 1. –

Esto encontrará el * primero *, no el más grande, comenzando por 1. '[2, 3, 4, 5, 1, 2]' –

Guau, eso es inteligente, gracias. ¿Qué tal si '[1, 2, 3, 11, 12, 13, 14] 'sin embargo? ¿Este algoritmo simplemente devolverá '[1, 2, 3]'? – dangerChihuahua007

se puede utilizar el Patience Sort aplicación de la Largest Ascending Sub-sequence Algorithm

def LargAscSub(seq): 
    deck = [] 
    for x in seq: 
     newDeck = [x] 
     i = bisect.bisect_left(deck, newDeck) 
     deck[i].insert(0, x) if i != len(deck) else deck.append(newDeck) 
    return [p[0] for p in deck]

Y aquí está la Resultados de prueba

>>> LargAscSub([1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11]) 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11] 
>>> LargAscSub([1, 2, 3, 11, 12, 13, 14]) 
[1, 2, 3, 11, 12, 13, 14] 
>>> LargAscSub([11,12,13,14]) 
[11, 12, 13, 14]

El orden de complejidad es O (nlogn)

Había una nota en el enlace wiki en el que afirmaban que se puede lograr O (n.loglogn) apoyándose en Van Emde Boas tree

Fuente

2011-12-29 06:48:13 Abhijit

¿El resultado no tiene que ser * enteros * enteros? – srgerg

@srgerg, solo revisa la pregunta comentada de la respuesta de Serdalis y Chi Zeng – Abhijit

No es la más grande en ascensión, es la más grande consecutiva ascendente. – jknupp

No tan inteligente, no O (n), podría usar un poco de optimización. Pero funciona.

def longest(seq): 
    result = [] 
    for v in seq: 
    for l in result: 
     if v == l[-1] + 1: 
     l.append(v) 
    else: 
     result.append([v]) 
    return max(result, key=len)

Fuente

2011-12-29 06:54:57

Arrrrg ... 10 segundos antes de presionar "publicar tu respuesta" ... ¡has ganado! ;) +1 – mac

En realidad, no hay implementación * O * (n) para esto :-) – Abhijit

Esto es O (n^2), como lo es el mío. Necesita pensar en un enfoque diferente. – jknupp

Cómo sobre el uso de un modificado Radix Sort? Como JanneKarila señaló que la solución no es O (n). Utiliza el género Radix, que wikipedia dice Radix sort's efficiency is O(k·n) for n keys which have k or fewer digits.

Esto solo funcionará si conoce el rango de números con el que estamos tratando, de modo que será el primer paso.

vistazo a cada elemento de la lista que comienza a encontrar más bajo, y la más alta l, h número. En este caso, l es 1 y h es 11. Nota: si ya conoce el rango por algún motivo, puede omitir este paso.
Cree una lista de resultados del tamaño de nuestro rango y configure cada elemento como nulo.
Mire cada elemento en la lista y agréguelos a la lista de resultados en el lugar apropiado si es necesario. es decir, el elemento es un 4, agregue un 4 a la lista de resultados en la posición 4. result[element] = starting_list[element]. Puede tirar duplicados si lo desea, solo se sobrescribirán.
Consulte la lista de resultados para encontrar la secuencia más larga sin ningún valor nulo. Mantenga un element_counter para saber qué elemento de la lista de resultados estamos viendo.Mantenga un curr_start_element establecido en el elemento inicial de la secuencia actual y mantenga un curr_len de la longitud de la secuencia actual. También mantenga un longest_start_element y un `longest_len 'que comenzará como cero y se actualizará a medida que avancemos por la lista.
devolver el listado de resultados a partir de las longest_start_element y tomando longest_len

EDIT: Código añadió. Probado y trabajando

#note this doesn't work with negative numbers 
#it's certainly possible to write this to work with negatives 
# but the code is a bit hairier 
import sys 
def findLongestSequence(lst): 
    #step 1 
    high = -sys.maxint - 1 

    for num in lst: 
     if num > high: 
      high = num 

    #step 2 
    result = [None]*(high+1) 

    #step 3 
    for num in lst: 
     result[num] = num 

    #step 4 
    curr_start_element = 0 
    curr_len = 0 
    longest_start_element = -1 
    longest_len = -1 

    for element_counter in range(len(result)): 
     if result[element_counter] == None: 

      if curr_len > longest_len: 
       longest_start_element = curr_start_element 
       longest_len = curr_len 

      curr_len = 0 
      curr_start_element = -1 

     elif curr_start_element == -1: 
      curr_start_element = element_counter 

     curr_len += 1 

    #just in case the last element makes the longest 
    if curr_len > longest_len: 
     longest_start_element = curr_start_element 
     longest_len = curr_len 


    #step 5 
    return result[longest_start_element:longest_start_element + longest_len-1]

Fuente

2011-12-29 07:40:02

El paso 4 itera sobre la lista de resultados n veces, por lo que esto no es O (n). – jknupp

@jknupp No, solo necesitas pasar una vez. Es lo mismo que encontrar el valor máximo de una lista. Excepto que encuentra la secuencia más larga en la lista. supongamos list = '[1,2,3, null, 5,6,7,8, null, 10]' Veo que '[1,2,3]' es la longitud 3, así que guardo el índice de inicio. Luego vea que '[5,6,7,8]' es la longitud 4, de modo que actualice los vars de índice/longitud más largos. '[8]' no lo cambia. Un ciclo, encontrado el más largo. –

El n en O (n) se refiere al tamaño de la lista de entrada. El rango de valores puede ser mucho más grande e independiente de la longitud de la lista. –

Si el resultado realmente no tiene que ser una sub-secuencia de enteros ascendentes consecutivos, en lugar de números enteros simplemente ascendente, entonces no hay necesidad de recordar cada uno toda sub-secuencia consecutiva hasta que se determine cuál es el más largo, solo necesita recordar los valores iniciales y finales de cada subsecuencia. Por lo que podría hacer algo como esto:

def longestConsecutiveSequence(sequence): 
    # map starting values to largest ending value so far 
    map = collections.OrderedDict() 

    for i in sequence: 
     found = False 
     for k, v in map.iteritems(): 
      if i == v: 
       map[k] += 1 
       found = True 

     if not found and i not in map: 
      map[i] = i + 1 

    return xrange(*max(map.iteritems(), key=lambda i: i[1] - i[0]))

Si funciono esto en la fecha original de la muestra (es decir [1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11]) me sale:

>>> print list(longestConsecutiveSequence([1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11])) 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]

Si lo ejecuto en una de las muestras de Abhijit [1,2,3,11,12,13,14], me consiga:

>>> print list(longestConsecutiveSequence([1,2,3,11,12,13,14])) 
[11, 12, 13, 14]

Lamentablemente, este algoritmo es O (n * n) en el peor de los casos.

Fuente

2011-12-29 07:40:38 srgerg

Advertencia: Esta es la forma de hacerlo cheaty (también conocido como utilizo pitón ...)

import operator as op 
import itertools as it 

def longestSequence(data): 

    longest = [] 

    for k, g in it.groupby(enumerate(set(data)), lambda(i, y):i-y): 
     thisGroup = map(op.itemgetter(1), g) 

     if len(thisGroup) > len(longest): 
      longest = thisGroup 

    return longest 


longestSequence([1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11, 15,15,16,17,25])

Fuente

2011-12-29 08:41:01 odgrim

Es necesario el máxima suma contigua (Optimal Substructure):

def msum2(a): 
    bounds, s, t, j = (0,0), -float('infinity'), 0, 0 

    for i in range(len(a)): 
     t = t + a[i] 
     if t > s: bounds, s = (j, i+1), t 
     if t < 0: t, j = 0, i+1 
    return (s, bounds)

Este es un ejemplo de programación dinámica y es O (N)

Fuente

2011-12-29 09:28:05

funciona O solución (n) incluso si la secuencia no se inicia del primer elemento.

advertencia no funciona si Pythonizations len (A) = 0.

A = [1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11] 
def pre_process(A): 
    Last = {} 
    Arrow = [] 
    Length = [] 
    ArgMax = 0 
    Max = 0 
    for i in xrange(len(A)): 
     Arrow.append(i) 
     Length.append(0) 
     if A[i] - 1 in Last: 
      Aux = Last[A[i] - 1] 
      Arrow[i] = Aux 
      Length[i] = Length[Aux] + 1 
     Last[A[i]] = i 
     if Length[i] > Max: 
      ArgMax = i 
      Max = Length[i] 
    return (Arrow,ArgMax) 

(Arr,Start) = pre_process(A) 
Old = Arr[Start] 
ToRev = [] 
while 1: 
    ToRev.append(A[Start]) 
    if Old == Start: 
     break 
    Start = Old 
    New = Arr[Start] 
    Old = New 
ToRev.reverse() 
print ToRev

son bienvenidos !!

Fuente

2011-12-29 10:01:02 jimifiki

autorización, aquí es otro intento en Python:

def popper(l): 
    listHolders = [] 
    pos = 0 
    while l: 
     appended = False 
     item = l.pop() 
     for holder in listHolders: 
      if item == holder[-1][0]-1: 
       appended = True 
       holder.append((item, pos)) 
     if not appended: 
      pos += 1 
      listHolders.append([(item, pos)]) 
    longest = [] 
    for holder in listHolders: 
     try: 
      if (holder[0][0] < longest[-1][0]) and (holder[0][1] > longest[-1][1]): 
       longest.extend(holder) 
     except: 
      pass 
     if len(holder) > len(longest): 
      longest = holder 
    longest.reverse() 
    return [x[0] for x in longest]

entradas y salidas de la muestra:

>>> demo = list(range(50)) 
>>> shuffle(demo) 
>>> demo 
[40, 19, 24, 5, 48, 36, 23, 43, 14, 35, 18, 21, 11, 7, 34, 16, 38, 25, 46, 27, 26, 29, 41, 8, 31, 1, 33, 2, 13, 6, 44, 22, 17, 
12, 39, 9, 49, 3, 42, 37, 30, 10, 47, 20, 4, 0, 28, 32, 45, 15] 
>>> popper(demo) 
[1, 2, 3, 4] 
>>> demo = [1,4,2,3,5,4,5,6,7,8,1,3,4,5,9,10,11] 
>>> popper(demo) 
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11] 
>>>

Fuente

2011-12-29 18:29:35

En python, ¿cómo se puede encontrar de manera eficiente el mayor conjunto de números consecutivos en una lista que no son necesariamente adyacentes?

Respuesta

Cuestiones relacionadas