Iteramos la colección grande en MongoDB a través de los datos de la primavera

¡Amigos!Iteramos la colección grande en MongoDB a través de los datos de la primavera

Estoy usando MongoDB en el proyecto de Java a través de Spring-Data. Utilizo interfaces de repositorio para acceder a datos en colecciones. Para algunos procesos, necesito iterar sobre todos los elementos de la colección. Puedo usar fetchAll method of repository, pero siempre devuelve ArrayList.

Sin embargo, se supone que una de las colecciones sería grande, hasta 1 millón de registros varios kilobytes cada uno como mínimo. Supongo que no debería usar fetchAll en tales casos, pero no pude encontrar ningún método conveniente que devuelva algún iterador (lo que puede permitir que la colección se obtenga de forma parcial), ni métodos convenientes con devoluciones de llamadas.

He visto solo soporte para recuperar tales colecciones en páginas. Me pregunto si es la única forma de trabajar con esas colecciones.

Fuente

2012-06-15 Rodion Gorkovenko

puede usar 'límite()' función de limitar la función de recuperar datos en fragmentos –

No estoy familiarizado con el marco que está utilizando, pero me resultaría muy extraño si no tiene algún contenedor para los cursores de MongoDB. ¿Estás seguro de que lo que obtienes es un 'ArrayList', y no una implementación personalizada' List' que envuelve un cursor? – thkala

sí, seguramente - Acabo de registrar su findAll(). GetClass() para la colección de aproximadamente 3 millones y creo que vi java.util.ArrayList ... –

Última respuesta, pero tal vez ayude a alguien en el futuro ...) Los datos de primavera no proporcionan ninguna API para ajustar Mongo DB Cursor capacidades. Lo usa dentro de los métodos find, pero siempre devuelve una lista completa de objetos. Las opciones son utilizar la API de Mongo directa o utilizar primavera de datos de localización API, algo así:

 final int pageLimit = 300; 
     int pageNumber = 0; 
     Page<T> page = repository.findAll(new PageRequest(pageNumber, pageLimit)); 
     while (page.hasNextPage()) { 
      processPageContent(page.getContent()); 
      page = repository.findAll(new PageRequest(++pageNumber, pageLimit)); 
     } 
     // process last page 
     processPageContent(page.getContent());

Fuente

2012-08-30 16:58:47 udalmik

Solo quería sonar más tarde y decir eso para grandes conjuntos de datos, también debe mantenerse alejado de la API de paginación, ya que tiene que recorrer toda la colección antes de compilar cada página. Esto se pone caro rápidamente. Seguir usando la API de Mongo directamente. –

@ShawnBush ¿Estás seguro de esto? – javadev

Otra forma:

do{ 
    page = repository.findAll(new PageRequest(pageNumber, pageLimit)); 
    pageNumber++; 

}while (!page.isLastPage());

Fuente

2014-03-28 11:34:07

Comprobar nuevo método para manejar resultados por base el documento.

http://docs.spring.io/spring-data/mongodb/docs/current/api/org/springframework/data/mongodb/core/MongoTemplate.html#executeQuery-org.springframework.data.mongodb.core.query.Query-java.lang.String-org.springframework.data.mongodb.core.DocumentCallbackHandler-

Fuente

2014-10-07 08:58:25

Uso MongoTemplate :: corriente() como probablemente el envoltorio de Java más adecuado para dbcursor

Fuente

2015-09-03 16:13:23 Segabond

puede seguir utilizando mongoTemplate para acceder a la colección y simplemente usar dbcursor:

 DBCollection collection = mongoTemplate.getCollection("boundary"); 
    DBCursor cursor = collection.find();   
    while(cursor.hasNext()){ 
     DBObject obj = cursor.next(); 
     Object object = obj.get("polygons"); 
     .. 
     ... 
    }

Fuente

2016-05-01 13:55:27

Es posible que desee probar el modo DBCursor de esta manera:

DBObject query = new BasicDBObject(); //setup the query criteria 
    query.put("method", method); 
    query.put("ctime", (new BasicDBObject("$gte", bTime)).append("$lt", eTime)); 

    logger.debug("query: {}", query); 

    DBObject fields = new BasicDBObject(); //only get the needed fields. 
    fields.put("_id", 0); 
    fields.put("uId", 1); 
    fields.put("ctime", 1); 

    DBCursor dbCursor = mongoTemplate.getCollection("collectionName").find(query, fields); 

    while (dbCursor.hasNext()){ 
     DBObject object = dbCursor.next(); 
     logger.debug("object: {}", object); 
     //do something. 
    }

Fuente

2017-02-15 07:54:20

corrientes como cursor:

@Query("{}") 
Stream<Alarm> findAllByCustomQueryAndStream();

Así, por la gran cantidad de datos que puede transmitir ellos y procesar la línea por línea y sin limitación de memoria

Fuente

2017-08-03 20:29:12

Iteramos la colección grande en MongoDB a través de los datos de la primavera

Respuesta

Cuestiones relacionadas