¿Cuál es la mejor manera de convertir una cadena de Unicode a ASCII sin cambiar su longitud (eso es muy importante en mi caso)? Además, los caracteres sin problemas de conversión deben estar en las mismas posiciones que en la cadena original. Así que una "Ä" debe convertirse a "A" y no algo críptico que tenga más caracteres.Convertir Unicode en ASCII sin cambiar la longitud de la cadena (en Java)
Editar:
@novalis - Tales símbolos (por ejemplo, de idiomas asiáticos) deberían simplemente convertirse a algunos marcadores de posición. No estoy demasiado interesado en esas palabras ni en lo que significan.
@MtnViewMark - Debo conservar el número de todos los caracteres y la posición de los caracteres disponibles ASCII bajo ninguna circunstancia.
Aquí algo más de información: Tengo algunas herramientas de minería de textos que solo pueden procesar cadenas ASCII. La mayoría del texto que debe procesarse está en inglés, pero algunos contienen caracteres que no son ASCII. No me interesan esas palabras, pero debo estar seguro de que las palabras que me interesan (las que solo contienen caracteres ASCII) se encuentran en las mismas posiciones después de la conversión de la secuencia.
¿Qué pretende convertir 口水 雞 a? No sé cómo se podría expresar el concepto de pollo saliva en tres personajes ascii. – novalis
No está claro, ¿está tratando de conservar el número de caracteres o el número de bytes ... o quizás el ancho de la cadena cuando se muestra? – MtnViewMark
@novalis +1 para pollo saliva :-) –