2009-12-19 12 views
12

Si se desplaza hacia abajo this page un poco, verías Reino Unido Inglés patrones de división de palabras como:patrones de TeX de separación de sílabas: ¿Qué representan

\patterns{ % just type <return> if you're not using INITEX 
.ab4i 
.ab3ol 
.ace4 
.acet3 
.ach4 
.ac5tiva 

¿Qué tienen estos patrones como .ab4i significan?

+1

Simplemente adivinando aquí, pero imagino que los números son un sistema de prioridad para elegir los mejores lugares para dividir una palabra en función de las letras que los rodean. La única pregunta que queda es: ¿el sistema prefiere valores altos o bajos? – dmckee

Respuesta

15

Hay tres tipos de caracteres en un patrón de separación de palabras TeX. El punto . es un delimitador de límite de palabra. Una letra representa por sí misma, es decir, una letra en la palabra para guionarse. Un número representa un punto potencial de separación por sílabas, y el número significa el nivel de separación por sílabas. Hay cinco niveles en total.

La idea básica del algoritmo es que una palabra se compara con los patrones y el nivel de separación por sílabas se inserta de cada patrón que coincida. Si dos niveles de dos patrones diferentes coinciden en el mismo punto, se selecciona el más alto. De los valores finales, solo los niveles impares indican los puntos de separación por sílabas permitidos. La idea es poder especificar tanto posibles puntos de separación por sílabas como lugares donde no se debe insertar un guión. Entonces, por ejemplo, si un punto específico de una palabra coincide con dos patrones que tienen un 1 y un 2 en ese punto, no se permite la separación silábica en ese punto porque el 2 anula el 1 y solo un valor impar indica un punto de separación por sílabas permitido.

En cuanto a los ejemplos, .ab4i indica que abi al comienzo de una palabra probablemente no recibirás un guión entre bi y debido a un nivel de 4, siendo incluso, inhibirá la división de palabras a menos que exista un 5. Por otra parte , una palabra que comienza con activa siempre se puede dividir entre c y t porque el 5 anulará cualquier otro valor y, como es impar, permite la separación silábica.

+0

@jk: Gracias por la maravillosa explicación. Pero no obtuve esta parte "De los valores finales, solo los niveles impares indican los puntos de separación permitidos". – understack

+0

@understack: los valores impares indican los lugares donde se alientan los guiones, e incluso los valores en los que se desaconsejan. Debido a que el algoritmo puede encontrar que se aplican varios patrones, tiene un sistema de precedencia para decir qué regla de hypenation cuenta más, indicada por el número más alto. –

4

Estos patrones se crean con una herramienta llamada patgen2. Hay una fuente de TeX para un tutorial sobre esta herramienta en patgen2.tutorial, y la tesis de doctorado sobre este tema está disponible en tug.org.

+0

También hay una buena explicación en The TeXbook de Kuth. –

Cuestiones relacionadas