que tienen una cadena:R convertir la serie al vector tokenize usando ""
string1 <- "This is my string"
me gustaría convertirlo en un vector que tiene este aspecto:
vector1
"This"
"is"
"my"
"string"
¿Cómo hago esto ? Sé que podría usar el paquete tm
para convertirlo a termDocumentMatrix
y luego convertirlo a una matriz, pero alfabetizaría las palabras y las necesito para mantenerme en el mismo orden.
Dason proporciona una buena solución pero si su texto es más complicado que eso (es decir, signos de puntuación, etc.) necesitará un enfoque un poco más mejorado. –
posible duplicado: http://stackoverflow.com/questions/520810/does-r-have-quote-like-operators-like-perls-qw – GSee
GSee que está pidiendo algo diferente. screechOwl quiere dividir un único vector de caracteres en palabras, donde como el enlace que proporciona indica que el póster desea ingresar palabras sin comillas que se convertirán en caracteres. –