2011-10-04 20 views
7

Este algoritmo está configurado para ejecutarse sobre la primera palabra o hasta que rellene las cuatro cadenas codificadas. Por ejemplo, el resultado de la entrada "Horrible Great" es: H612. Descuida la segunda palabra, o en otras palabras, solo toma la primera letra de la segunda palabra para completar la cadena codificada.Algunos cambios en el algoritmo de Soundex

Me gustaría cambiarlo tomando la primera palabra y encontrar su cadena codificada y LUEGO tomar la segunda palabra y encontrar su cadena codificada; la salida debe ser "H614 G600". Amablemente me gustaría saber si hay una manera de hacer eso haciendo un cambio a ** este código.
Muchas gracias :)

private string Soundex(string data) 
    { 
     StringBuilder result = new StringBuilder(); 
     if (data != null && data.Length > 0) 
     { 
      string previousCode = "", currentCode = "", currentLetter = ""; 
      result.Append(data.Substring(0, 1)); 
      for (int i = 1; i < data.Length; i++) 
      { 
       currentLetter = data.Substring(i,1).ToLower(); 
       currentCode = ""; 

       if ("bfpv".IndexOf(currentLetter) > -1) 
        currentCode = "1"; 
       else if ("cgjkqsxz".IndexOf(currentLetter) > -1) 
        currentCode = "2"; 
       else if ("dt".IndexOf(currentLetter) > -1) 
        currentCode = "3"; 
       else if (currentLetter == "l") 
        currentCode = "4"; 
       else if ("mn".IndexOf(currentLetter) > -1) 
        currentCode = "5"; 
       else if (currentLetter == "r") 
        currentCode = "6"; 

       if (currentCode != previousCode) 
        result.Append(currentCode); 

       if (result.Length == 4) break; 

       if (currentCode != "") 
        previousCode = currentCode; 
      } 
     } 

     if (result.Length < 4) 
      result.Append(new String('0', 4 - result.Length)); 

     return result.ToString().ToUpper(); 
    } 

Respuesta

4

Claro, esta es la solución que se me ocurrió. Envolví el algoritmo existente con otro método que divide las cadenas y llama al método original. Para usar esto, debería llamar a SoundexByWord ("Horrible Great") en lugar de llamar a Soundex ("Horrible Great") y obtener la salida de "H614 G630".

private string SoundexByWord(string data) 
{ 
    var soundexes = new List<string>(); 
    foreach(var str in data.Split(' ')){ 
     soundexes.Add(Soundex(str)); 
    } 
#if Net35OrLower 
    // string.Join in .Net 3.5 and before require the second parameter to be an array. 
    return string.Join(" ", soundexes.ToArray()); 
#endif 
    // string.Join in .Net 4 has an overload that takes IEnumerable<string> 
    return string.Join(" ", soundexes); 
} 
+0

¡SON INCREÍBLES! Muchas gracias por compartir. me permite editar el código que escribió más arriba: cadena privada SoundexByWord (datos de cadena) {var = soundexes nueva lista (); foreach (var str en data.Split ('')) { soundexes.Add (Soundex (str)); } return string.Join ("", soundexes.ToArray()); // Convierte la lista } // a una matriz coz join Fun. takes string array [] :) – user979014

+0

Ese es un buen punto. La respuesta original se basó en .Net 4. En función de su sugerencia, amplié la respuesta para incluir versiones anteriores también. – jhamm

+0

Admiro tu última edición y manera de explicar :) gracias de nuevo – user979014

0

sí - primero analizar la cadena en una matriz de palabras (después de recoger un separador)

continuación, hacer esto en cada palabra

luego armar los resultados de alguna manera aceptable y retorno.

+0

pensé en una cadena de Split a continuación, una cadena concat para separar y montar ellos, pero quiero cambiar el algoritmo en sí de alguna manera . aprecio su anser aunque :)) – user979014

0

La implementación en la pregunta es correcta pero crea un exceso de basura con operaciones de cadena. Aquí hay una implementación basada en Char-array que es más rápida y crea muy poca basura. Está diseñado como un método de extensión, y se encarga de frases (palabras separadas por espacios), así:

public static String Soundex(this String input) 
    { 
     var words = input.Split(' '); 
     var result = new String[ words.Length ]; 
     for(var i = 0; i < words.Length; i++) 
      result[ i ] = words[ i ].SoundexWord(); 

     return String.Join(",", result); 
    } 

    private static String SoundexWord(this String input) 
    { 
     var result = new Char[ 4 ] { '0', '0', '0', '0' }; 
     var inputArray = input.ToUpper().ToCharArray(); 

     if(inputArray.Length > 0) 
     { 
      var previousCode = ' '; 
      var resultIndex = 0; 

      result[ resultIndex ] = inputArray[ 0 ]; 

      for(var i = 1; i < inputArray.Length; i++) 
      { 
       var currentLetter = inputArray[ i ]; 
       var currentCode = ' '; 

       if("BFPV".IndexOf(currentLetter) > -1) 
        currentCode = '1'; 
       else if("CGJKQSXZ".IndexOf(currentLetter) > -1) 
        currentCode = '2'; 
       else if("DT".IndexOf(currentLetter) > -1) 
        currentCode = '3'; 
       else if(currentLetter == 'L') 
        currentCode = '4'; 
       else if("MN".IndexOf(currentLetter) > -1) 
        currentCode = '5'; 
       else if(currentLetter == 'R') 
        currentCode = '6'; 

       if(currentCode != ' ' && currentCode != previousCode) 
        result[ ++resultIndex ] = currentCode; 

       if(resultIndex == 3) break; 

       if(currentCode != ' ') 
        previousCode = currentCode; 
      } 
     } 

     return new String(result); 
    } 
Cuestiones relacionadas