Si usted interesante en la forma de hacerlo por sí solo y no usar impulso.
Suponiendo que la cadena del delimitador puede ser muy larga - digamos que M, buscando cada carácter en su cadena si es un delimitador, costaría O (M) cada uno, haciendo un ciclo para todos los caracteres en su original cadena, digamos en longitud N, es O (M * N).
Usaría un diccionario (como un mapa - "delimitador" para "booleanos" - pero aquí usaría una matriz booleana simple que tiene verdadero en índice = valor ascii para cada delimitador).
Ahora iterar en la cadena y comprobar si el carácter es un delimitador es O (1), lo que finalmente nos da O (N) en general.
Aquí está mi código de ejemplo:
const int dictSize = 256;
vector<string> tokenizeMyString(const string &s, const string &del)
{
static bool dict[dictSize] = { false};
vector<string> res;
for (int i = 0; i < del.size(); ++i) {
dict[del[i]] = true;
}
string token("");
for (auto &i : s) {
if (dict[i]) {
if (!token.empty()) {
res.push_back(token);
token.clear();
}
}
else {
token += i;
}
}
if (!token.empty()) {
res.push_back(token);
}
return res;
}
int main()
{
string delString = "MyDog:Odie, MyCat:Garfield MyNumber:1001001";
//the delimiters are " " (space) and "," (comma)
vector<string> res = tokenizeMyString(delString, " ,");
for (auto &i : res) {
cout << "token: " << i << endl;
}
return 0;
}
Nota: tokenizeMyString vuelve vector por valor y crear en la pila en primer lugar, por lo que estamos usando aquí el poder del compilador >>> RVO - valor de retorno optimización :)
Boost.StringAlgorithm o Boost.Tokenizer ayudaría. –
O, alguna idea que puede obtener de esta respuesta: http://stackoverflow.com/questions/4888879/elegant-ways-to-count-the-frequency-of-words-in-a-file – Nawaz
@ K-ballo : Según la pregunta, no debe usar bibliotecas externas como Boost. – deepmax