Estoy tratando de eliminar caracteres diacríticos de un pangram en polaco. Estoy usando el código del blog de Michael Kaplan http://www.siao2.com/2007/05/14/2629747.aspx, sin embargo, sin éxito.Eliminando signos diacríticos en polaco
Considera los siguientes pangram: "Pchnąć w tę łódź jeża lub ośm skrzyń fig.". Todo funciona bien, pero para la letra "³", sigo teniendo "ł". Supongo que el problema es que "³" se representa como unicode carácter único y no hay siguiente NonSpacingMark.
¿Tiene alguna idea de cómo puedo solucionarlo (sin depender de la asignación personalizada en algún diccionario, estoy buscando algún tipo de conversión de Unicode)?
esperan de la 'L' todos esos personajes que acabamos [diacríticos] (http: //en.wikipedia.org/wiki/Diacritic) (veo al menos ogonek, aguda y punto) y podría normalizarse fácilmente usando 'Normalize'. Sugeriría combinar los dos métodos. – BalusC
¿Normalizar es una biblioteca .NET? Lo siento ... eso es un fragmento de mi código Java :) Y escribiendo "Net" estaba pensando en InterNet, no en ".NET". –