En mi código C++, quiero leer un archivo de texto (* .txt) y tokenizar cada entrada. Más específicamente, quiero poder leer palabras individuales de un archivo, como "formato", "pila", "Jason", "europa", , etc..¿Cómo puedo usar delimitadores no predeterminados cuando leo un archivo de texto con std :: fstream?
yo decidimos utilizar fstream
para realizar esta tarea, y no sé cómo configurar su delimitador a los que yo quiero usar (espacio, \n
, así como guiones e incluso apóstrofes como en "McDonald s"). Calculé que el espacio y \n
son los delimitadores por defecto, pero los guiones no, pero quiero tratarlos como delimitadores para que cuando analice el archivo, obtenga palabras en "blah blah xxx animal-cat" simplemente como "blah", "blah", "xxx", "animal", "gato".
Es decir, quiero ser capaz de obtener dos cadenas de "apilar-desbordamiento", "eres", etc, y seguir siendo capaz de mantener \n
y el espacio como delimitadores al mismo tiempo.
getline (secuencia, variable, delimitador); –
¿Desea excluir "animal - gato" porque contiene guiones? Eso no suena como tokenizing para mí. – Johnsyweb
No estoy tratando de filtrarlos; Estoy tratando de leer animales y gatos como dos palabras separadas. – FrozenLand