tengo un URI que contiene caracteres extraños como:Quitar los caracteres no ASCII de cadena en Java
http://www.abc.de/qq/qq.ww?MIval=typo3_bsl_int_Smtliste&p_smtbez=Schmalbl ttrigeSomerzischeruchtanb
¿Cómo puedo eliminar "" de este URI
tengo un URI que contiene caracteres extraños como:Quitar los caracteres no ASCII de cadena en Java
http://www.abc.de/qq/qq.ww?MIval=typo3_bsl_int_Smtliste&p_smtbez=Schmalbl ttrigeSomerzischeruchtanb
¿Cómo puedo eliminar "" de este URI
estoy adivinando que la fuente de la URL es más culpable. Tal vez estás arreglando el problema equivocado? Eliminar caracteres "extraños" de un URI podría darle un significado completamente diferente.
Dicho esto, puede ser capaz de eliminar todos los caracteres no ASCII con una simple sustitución de cadenas:
string fixed = original.replaceAll("[^\\x20-\\x7e]", "");
O puede extender el proceso a todos los no-cuatro bytes UTF-8 personajes si que no cubre el carácter "":
string fixed = original.replaceAll("[^\\u0000-\\uFFFF]", "");
no no no no no, esto no es ASCII ... [^\x20-\x7E]
ésta es ascii real: [^\x00-\x7F]
De lo contrario, recortará las líneas nuevas y otros caracteres especiales que forman parte de la tabla ascii!
yourstring=yourstring.replaceAll("[^\\p{ASCII}]", "");
Para eliminar los Caracteres no ASCII de Cadena, a continuación el código funcionó para mí.
String str = "616043287409»;
str = str.replaceAll ("[^ \ p {ASCII}]", "");
de salida: 616043287409
Por favor, trate de evitar solo el código de dumping como una respuesta y trate de explicar lo que hace y por qué. Es posible que su código no sea obvio para las personas que no tienen la experiencia de codificación relevante. – Frits
Uso guayaba CharMatcher
String onlyAscii = CharMatcher.ascii().retainFrom(original)
definen caracteres extraños * * ... – aioobe
caracteres no ingleses –
como '_' por ejemplo? – aioobe