Estoy leyendo algo sobre la búsqueda de una (variedad de) serie (s) en una matriz ordenada de cadenas.Imposible para mí entender un método de búsqueda de cadenas como se describe. ¿Qué es uFFFF?
Dice:
Si usted quiere encontrar todas las cadenas que comienzan con "h", puede ejecutar una búsqueda binaria para la cuerdas "h" y "h \ uFFFF". Esto da todos los índices de la banda para todas las teclas que comienzan con "h". Tenga en cuenta que una búsqueda binaria puede devolver el índice donde estaría la cadena incluso si no está realmente en la matriz.
No entiendo nada de este párrafo.
¿Qué es h\uFFFF
cómo ayuda/se usa en la búsqueda binaria y la última frase también significa que incluso esta búsqueda es defectuosa?
¿Alguna ayuda para entender lo que se dice aquí, por favor?
'\ uFFFF' es el valor máximo para un carácter Unicode, no se utiliza como un carácter imprimible –
'\ uFFFF' es una secuencia de escape para el punto de código U + FFFF, que está garantizado por [el estándar] (http: //unicode.org/charts/PDF/UFFF0.pdf) para no ser un personaje. ¿Hay algún uso especial para que se defina en otra parte de lo que estás leyendo? –
@Sam Dehaan: * "\ uFFFF es el valor máximo para un carácter Unicode" * ... Desde Unicode 3.1 hay mucho más de 65 536 puntos de código y un solo Java * char * no es suficiente para representar los nuevos puntos de código. Por ejemplo, el carácter Unicode 'MUSICAL SYMBOL G CLEF' tiene el punto de código Unicode 0x0001D11E (bastante más que 0xFFFF) y necesita dos Java * char * para ser representado: "\ uD8334 \ uDD1E". Esta SNAFU proviene del hecho de que Java (y su tipo primitivo * char *) se definió antes de que saliera Unicode 3.1. En resumen: no, \ uFFFF es definitivamente ** NO ** el valor máximo para un punto de código Unicode. – TacticalCoder