Estoy usando python y numpy/scipy para hacer expresiones regulares y derivar para una aplicación de procesamiento de texto. Pero también quiero usar algunos de los paquetes estadísticos de R.¿Cómo puedo pasar arreglos grandes entre numpy y R?
¿Cuál es la mejor manera de pasar los datos de python a R? (¿Y de vuelta?)
Además, necesito hacer una copia de seguridad de la matriz en el disco en algún momento, así que estoy abierto a guardar desde python y cargar th R si esa es la mejor solución. Las matrices son bastante grandes (por ejemplo, 100.000 x 10.000), por lo que el uso de matrices dispersas también podría ser agradable.
Disculpa si se trata de un reenvío. No he podido encontrar nada que junte todas estas piezas.
El problema es que la publicación cruzada en diferentes SE no es la forma de hacerlo (aparte del hecho de que no se recomienda). Uno de los propósitos de SE es crear un registro duradero de grandes soluciones a preguntas específicas, a las que se puede acceder desde, p. Google o sitios de referencia. Al duplicar su pregunta, plantea la posibilidad de obtener diferentes buenas respuestas de diferentes sitios, lo cual es bastante bueno, pero ¿cuál de todos aceptaría? Además, como usted no notificó a stats.SE que esto fue publicado de manera cruzada desde SO, simplemente se migró. Ahora, los mods tienen que unirlos a ambos. – chl
fusionado. Como dijo el chl, no publique la misma pregunta en varios sitios en el futuro. –
Mi error. Primero hice esta pregunta sobre la validación cruzada, y me dijeron que funcionaría mejor aquí. Después de publicar aquí, la otra publicación también se migró. Para referencia futura, ¿cómo podría mover la pregunta yo mismo? A veces es difícil decidir qué comunidad es más adecuada para responder una pregunta determinada. – Abe