¿Cómo configurar el directorio de datos nltk desde el código?¿Cómo configurar el directorio de datos nltk desde el código?
Respuesta
Simplemente cambie los artículos de nltk.data.path
, es una lista simple.
o establecer la variable de entorno NLTK_DATA. – schemacs
Mi nltk.data.path tiene ''/ home/aankney/nltk_data'' como el primer elemento de la lista, PERO estoy en un servidor y quiero que' nltk_data' sea compartido por otras personas que usan el servidor. ¿Cómo evito que nltk use esto como una de las rutas de descarga? –
utilizo añadir, ejemplo
nltk.data.path.append('/libs/nltk_data/')
A partir del código, http://www.nltk.org/_modules/nltk/data.html:
``nltk:path``: Specifies the file stored in the NLTK data package at *path*. NLTK will search for these files in the directories specified by ``nltk.data.path``.
A continuación, dentro del código:
######################################################################
# Search Path
######################################################################
path = []
"""A list of directories where the NLTK data package might reside.
These directories will be checked in order when looking for a
resource in the data package. Note that this allows users to
substitute in their own versions of resources, if they have them
(e.g., in their home directory under ~/nltk_data)."""
# User-specified locations:
path += [d for d in os.environ.get('NLTK_DATA', str('')).split(os.pathsep) if d]
if os.path.expanduser('~/') != '~/':
path.append(os.path.expanduser(str('~/nltk_data')))
if sys.platform.startswith('win'):
# Common locations on Windows:
path += [
str(r'C:\nltk_data'), str(r'D:\nltk_data'), str(r'E:\nltk_data'),
os.path.join(sys.prefix, str('nltk_data')),
os.path.join(sys.prefix, str('lib'), str('nltk_data')),
os.path.join(os.environ.get(str('APPDATA'), str('C:\\')), str('nltk_data'))
]
else:
# Common locations on UNIX & OS X:
path += [
str('/usr/share/nltk_data'),
str('/usr/local/share/nltk_data'),
str('/usr/lib/nltk_data'),
str('/usr/local/lib/nltk_data')
]
que modificar la ruta, simplemente appen d para la lista de posibles caminos:
import nltk
nltk.data.path.append("/home/yourusername/whateverpath/")
o en Windows:
import nltk
nltk.data.path.append("C:\somewhere\farfar\away\path")
¿Qué directorio contendría este archivo? – hlin117
está en el código fuente original de NLTK. Vaya al directorio donde guarda el código fuente y luego vaya a 'nltk/nltk/data' – alvas
eche un vistazo a' magically_find_nltk_data() 'desde http://stackoverflow.com/questions/36382937/nltk-doesnt-add-nltk -data-to-search-path/36383314 # 36383314 – alvas
Para aquellos que utilizan uwsgi:
que estaba teniendo problemas porque quería una aplicación uwsgi (que se ejecuta como un diferente usuario que yo) para tener acceso a los datos nltk que había descargado previamente. Lo que funcionó para mí fue añadiendo la siguiente línea a myapp_uwsgi.ini
:
env = NLTK_DATA=/home/myuser/nltk_data/
Esto establece la variable de entorno NLTK_DATA
, según lo sugerido por @schemacs.
Es posible que deba reiniciar su proceso uwsgi después de realizar este cambio.
- 1. Configurar recursos de aplicación desde el código
- 2. ¿Cómo configurar el directorio de trabajo actual?
- 3. Cómo configurar el diseño desde el controlador
- 4. ¿Cómo uso los datos en package_data desde el código fuente?
- 5. Cómo configurar FontFamily en el código
- 6. cómo configurar useUnsafeHeaderParsing en el código
- 7. Importar desde el directorio hermano
- 8. ¿Puedo configurar un directorio de datos diferente para Internet Explorer?
- 9. ¿Cómo configurar el directorio de trabajo/actual en Vim?
- 10. Cómo configurar el directorio de trabajo en NAnt?
- 11. ¿Cómo configurar el directorio actual de SBCL usando slime?
- 12. ¿Cómo incluir stdafx.h desde el directorio raíz?
- 13. Rieles: ¿Cómo probar el código en el directorio lib /?
- 14. cómo configurar el trabajo cron desde el script php?
- 15. ¿Cómo configurar el servicio WCF desde el código cuando se aloja en IIS?
- 16. Configurar manualmente ModelState.isValid desde el controlador
- 17. Rieles: ¿Está registrando el código en el directorio lib?
- 18. ¿Cómo instalar el complemento Grails desde el código fuente?
- 19. PowerShell: Ejecute el comando desde el directorio de scripts
- 20. NLTK - ¿Cuándo se debe normalizar el texto?
- 21. ¿Cómo configurar el delegado de scrollView desde una UITableView?
- 22. Cómo configurar el matraz app.logger desde un archivo de configuración?
- 23. ¿Cómo configurar la plantilla de control en el código?
- 24. Webpy: cómo configurar el código de estado http a 300
- 25. Cómo configurar un cliente WCF usando wsDualHttpBinding en el código?
- 26. Configurar el directorio de salida para Assetic en Symfony2
- 27. Cómo subir Suds.WebFault desde el código python?
- 28. Ejecutar el comando CMD desde el código
- 29. ¿Cómo desencadenar Google Analytics desde el código?
- 30. ¿Cómo invocar generadores desde el código?
Relacionado: [Cambie el directorio de ruta de acceso nltk.download() desde ~/ntlk_data predeterminado] (https://stackoverflow.com/questions/44857382/change-nltk-download-path-directory-from-default-ntlk-data) – smci