2009-07-27 9 views
6

Me gusta usar el tiempo presente en mis registros de Git (por ejemplo, "Agregar función" en lugar de "Función agregada"). Actualmente, tengo un gancho Git extremadamente ingenuo que aborta el compromiso si la primera palabra del mensaje de registro termina en 'ed', pero me gustaría una solución más robusta (donde 'más robusto' significa 'no totalmente cojo'). ¿Hay un corrector gramatical que me daría la posibilidad de escribir un guión a lo largo de las líneas de:CLI Controlador de gramática para determinar el tiempo

 
echo $TEXT | check-grammar --present-tense || exit 1 

No necesito una solución perfecta, pero es algo mejor que emparejan/^ \ w * ed \ W/.

+0

Curioso: ¿la comprobación de "-ed" tiene algún problema? ¿Hay cosas que * no * han sido atrapadas usando este método? También puede verificar si hay gerundios ("agregar funciones"), así que simplemente agregue "-ing" a su lista de sufijos inválidos. Me imagino que no tienes que preocuparte por los verbos auxiliares ("tienen función adicional"). Entonces, lo único que quedaría serían verbos irregulares ("comprar/comprar una característica") pero creo que necesitarías algún tipo de diccionario para eso. – poundifdef

Respuesta

2

Es posible que pueda utilizar morpha para este fin. Morpha es un lematizador que divide las terminaciones de las palabras base y luego cambia la palabra base a su forma no flexionada, que es convenientemente lo mismo que la tercera persona singular no especificada en inglés.

Como ejemplo, la entrada 'added' daría como resultado 'add + ed', lo que significa que incluso puede solicitar su comando de salida si la primera palabra de la cadena de confirmación tiene un signo más, si ' Estamos buscando el enfoque más ingenuo posible.

Cuestiones relacionadas