Me pregunto si este tipo de biblioteca existe.¿Hay alguna biblioteca de Lua que convierta una cadena en bytes utilizando la codificación UTF8?
Respuesta
slnunicode es parte de la colección de bibliotecas de soporte lua de propósito general desarrolladas para el proyecto de base de datos Selene.
También está disponible como una luarock
lamentablemente no se compila en lua v5.2.0 –
Lua 5.3 tiene UTF-8 support en la biblioteca estándar ahora.
Por ejemplo, para obtener los puntos de código de una cadena UTF-8:
for p, c in utf8.codes("瑞&于") do
print(c)
end
Salida:
29790
38
20110
cadenas Lua son una secuencia de bytes. Cuando almacena texto UTF8 en ellos, ya está almacenando "bytes UTF8". Puede obtener los bytes igual que con todas las demás cadenas, utilizando string.byte(s,i,j)
:
local bytes = { string.byte(unicodeString, 1,-1) }
Ahora bytes es una tabla que contiene su "UTF-8 bytes". Más información sobre string.byte
y UTF8 en Lua está disponible en:
estándar Lua string library
Lua 5.3 estándar utf8 library
Presentation by Roberto Ierusalimschy (one of the creators of Lua) sobre el futuro de Lua, que habla de muchas cosas y una de ellas es UTF8 apoyo. Fue lanzado antes de que el soporte UTF8 fuera incorporado a Lua.
- 1. En Lua, ¿hay alguna función que, dada una función, devuelva su nombre como una cadena?
- 2. ¿Hay bytes delimitadores para caracteres UTF8?
- 3. ¿Hay una función de biblioteca de Python que intente adivinar la codificación de caracteres de algunos bytes?
- 4. Convierta una Cadena en una matriz de bytes y luego vuelva a la Cadena original
- 5. codificación Java UTF8
- 6. ¿Cómo detectar si tiene que aplicar decodificación u codificación de utf8 en una cadena?
- 7. Verificar la cadena utf8 válida en Python
- 8. PostgreSQL + PHP + UTF8 = secuencia de bytes no válida para la codificación
- 9. ¿Hay una versión std :: streambuf que convierta el host en orden de bytes de red?
- 10. .NET System :: Cadena a UTF8-bytes almacenada en char *
- 11. Convierta una fecha de cadena a una marca de hora
- 12. Almacenar una cadena como UTF8 en C#
- 13. ¿Hay alguna función que convierta HTML a texto sin formato?
- 14. knitr y codificación UTF8
- 15. ios Codificación UTF8 de nsstring
- 16. ¿Hay alguna utilidad que convierta POSIX a PCRE para PHP?
- 17. Cómo convertir una cadena a UTF8?
- 18. Convierta UTF8 a UTF16 con iconv
- 19. ¿Cómo GetBytes() en C# con codificación UTF8 con BOM?
- 20. Convierta una fecha en cadena en Javascript
- 21. Error de Postgres en la inserción - ERROR: secuencia de bytes no válida para la codificación "UTF8": 0x00
- 22. ¿Hay alguna funcionalidad en/para Delphi que convierta una cadena con entidades nombradas y numeradas html en texto unicode?
- 23. ¿Es posible llamar a la cadena de carga en la cadena de códigos de bytes lua que contiene una referencia a una función C?
- 24. ¿Hay alguna manera de acceder a una variable de JavaScript utilizando una cadena que contiene el nombre de la variable?
- 25. Convierta LPWSTR en la cadena
- 26. secuencia de bytes no válida para codificar "UTF8"
- 27. Cómo convertir cadenas a y desde matrices de bytes UTF8 en Java
- 28. Cómo truncar una cadena UTF8 en PHP?
- 29. Descodificación de doble codificación de utf8 en Python
- 30. ¿Hay una biblioteca para iPhone que funcione con la codificación HMAC-SHA-1?
UTF8 ya es bytes. ¿Quieres que se convierta en algo más? –