Estructura de datos eficiente para acceso aleatorio rápido, búsqueda, inserción y eliminación

Estoy buscando una estructura de datos (o estructuras) que me permita mantener una lista ordenada de enteros, sin duplicados, con índices y valores en el mismo distancia.Estructura de datos eficiente para acceso aleatorio rápido, búsqueda, inserción y eliminación

Necesito cuatro operaciones principales para ser eficiente, en orden aproximado de importancia:

tomando el valor de un índice dado
encontrar el índice de un valor dado
insertar un valor en una dado índice
la eliminación de un valor en un índice dado

Usando una matriz tengo 1 a O (1), pero 2 es O (N) y la inserción y las eliminaciones son costosas (O (N) también, creo).

Una lista vinculada tiene O (1) inserción y eliminación (una vez que tiene el nodo), pero 1 y 2 son O (N), por lo tanto, anula las ganancias.

He intentado mantener dos matrices a [índice] = valor yb [valor] = índice, que convierten 1 y 2 en O (1) pero convierten 3 y 4 en operaciones aún más costosas.

¿Existe una estructura de datos más adecuada para esto?

Fuente

2009-05-20 Leonel

¿Qué idioma está utilizando? –

Realmente no debería importar, pero es C++ – Leonel

No importa; no todos los idiomas ofrecen las mismas estructuras de datos. Por ejemplo, este problema particular podría resolverse de manera muy eficiente mediante una matriz C Judy o una C# CPTrie. (O, por supuesto, algún tipo de árbol binario equilibrado como sugirió Ayman). La inserción de – Qwertie

Yo utilizaría un red-black tree para asignar las claves a los valores. Esto le da O (log (n)) para 1, 3, 4. También mantiene las claves en orden ordenado.

Para 2, utilizaría una tabla hash para asignar valores a las claves, lo que le da un rendimiento O (1). También agrega O (1) sobrecarga para mantener actualizada la tabla hash al agregar y eliminar claves en el árbol rojo-negro.

Fuente

2009-05-20 21:39:02

sabía que lo leí en alguna parte: http://www.cs.tau.ac.il/~wein/publications/pdfs/rb_tree.pdf – Javier

Suena bien. Lo probaré – Leonel

@Javier: Los árboles rojo-negros no tienen acceso O (1) amortizado. Los árboles rojo-negros en realidad * no hacen * nada cuando lees un elemento en el árbol, por lo que no hay amortización. Ningún árbol binario, dinámico o no, puede lograr o (n log n) para acceder a n elementos arbitrarios en el árbol. –

¿Qué le parece usar una matriz ordenada con búsqueda binaria?

La inserción y borrado es lenta. pero dado el hecho de que los datos son enteros simples podrían optimizarse con llamadas a memcpy() si está usando C o C++. Si conoce el tamaño máximo de la matriz, puede incluso evitar cualquier asignación de memoria durante el uso de la matriz, ya que puede preasignarla al tamaño máximo.

El "mejor" enfoque depende de la cantidad de elementos que necesita almacenar y la frecuencia con la que tendrá que insertar/eliminar en comparación con la búsqueda. Si rara vez inserta o elimina una matriz ordenada con O (1), el acceso a los valores es ciertamente mejor, pero si inserta y elimina elementos con frecuencia, un árbol binario puede ser mejor que la matriz. Para un n suficientemente pequeño, la matriz probablemente sea mejor que el árbol en cualquier caso.

Si el tamaño de almacenamiento es preocupante, la matriz es mejor que los árboles, también. Los árboles también necesitan asignar memoria para cada elemento que almacenan y la sobrecarga de la asignación de memoria puede ser significativa ya que solo almacena valores pequeños (enteros).

Es posible que desee crear un perfil de lo que es más rápido, la copia de los enteros si inserta/elimina de la matriz ordenada o del árbol con sus asignaciones de memoria.

Fuente

2009-05-20 21:32:28 lothar

en ese caso es horrible ... –

la inserción y eliminación fueron las últimas en la lista de OP, y los enteros se pueden optimizar con llamadas a memcpy() . – lothar

La parte "ordenada" es importante, por lo que no puedo ordenar los datos. – Leonel

Howabout a Treemap? log (n) para las operaciones descritas.

Fuente

2009-05-20 21:35:25 CookieOfFortune

Me gustan mucho los árboles binarios equilibrados. A veces son más lentos que las tablas hash u otras estructuras, pero son mucho más predecibles; generalmente son O(log n) para todas las operaciones. Sugeriría usar un Red-black tree o un AVL tree.

Fuente

2009-05-20 21:36:00 Zifre

tabla hash no mantendrá los datos ordenados. –

Vaya, no vi la parte ordenada ... Lo arreglé. – Zifre

No sé qué idioma está utilizando, pero si se trata de Java puede aprovechar LinkedHashMap o una colección similar. Tiene todos los beneficios de una Lista y un Mapa, proporciona un tiempo constante para la mayoría de las operaciones y tiene la huella de memoria de un elefante. :)

Si no está utilizando Java, la idea de un LinkedHashMap probablemente sea aún adecuada para una estructura de datos utilizable para su problema.

Fuente

2009-05-20 21:43:35

¿Cómo va a obtener un elemento aleatorio utilizando LinkedHashMap? – Hengameh

Si está trabajando en .NET, entonces, de acuerdo a los documentos de MS http://msdn.microsoft.com/en-us/library/f7fta44c.aspx

SortedDictionary y ambos tienen SortedList O (log n ) para la recuperación
SortedDictionary ha O (log n ) para operaciones de inserción y eliminación, mientras que SortedList tiene O (n).

Ambos se diferencian por el uso de memoria y la velocidad de inserción/eliminación. SortedList utiliza menos memoria que SortedDictionary. Si SortedList se completa a la vez a partir de datos ordenados, es más rápido que SortedDictionary. Por lo tanto, depende de la situación en cuanto a cuál es realmente la mejor opción para usted.

Además, su argumento para la Lista vinculada no es realmente válido, ya que podría ser O (1) para la inserción, pero debe recorrer la lista para encontrar el punto de inserción, por lo que realmente no es.

Fuente

2009-05-20 21:49:07 BenAlabaster

¿Cómo conseguir 2 con árboles RB? Podemos hacer que cuenten a sus hijos con cada operación de inserción/eliminación. Esto no hace que estas operaciones duren mucho más. Luego, bajar al árbol para encontrar el elemento i-ésimo es posible en el tiempo de registro n. Pero no veo implementación de este método en java ni stl.

Fuente

2010-04-28 06:50:54

Utilice un vector para acceder a la matriz.

Utilice un mapa como índice de búsqueda del subíndice en el vector.

dado un subíndice buscar el valor a partir del vector O (1)
dado una llave, utilizar el mapa para encontrar el subíndice del valor. O (lnN)
insertar un valor, empujar de vuelta en el vector O (1) amortizado, insertar el subíndice en el mapa O (lnN)
eliminar un valor, borrar del mapa O (lnN)

Fuente

2012-10-21 09:57:35 EvilTeach

Estructura de datos eficiente para acceso aleatorio rápido, búsqueda, inserción y eliminación

Respuesta

Cuestiones relacionadas