Estoy tratando de traducir el siguiente código Python en C++:Desembalaje flotadores hexagonal codificada
import struct
import binascii
inputstring = ("0000003F" "0000803F" "AD10753F" "00000080")
num_vals = 4
for i in range(num_vals):
rawhex = inputstring[i*8:(i*8)+8]
# <f for little endian float
val = struct.unpack("<f", binascii.unhexlify(rawhex))[0]
print val
# Output:
# 0.5
# 1.0
# 0.957285702229
# -0.0
para que se lea de 32 bits el valor de la cadena hexadecimal-codificado, lo convierte en una matriz de bytes con el método unhexlify
, y lo interpreta como un valor flotante little-endian.
Los siguientes casi funciona, pero el código es una especie de mierda (y el último 00000080
analiza incorrectamente):
#include <sstream>
#include <iostream>
int main()
{
// The hex-encoded string, and number of values are loaded from a file.
// The num_vals might be wrong, so some basic error checking is needed.
std::string inputstring = "0000003F" "0000803F" "AD10753F" "00000080";
int num_vals = 4;
std::istringstream ss(inputstring);
for(unsigned int i = 0; i < num_vals; ++i)
{
char rawhex[8];
// The ifdef is wrong. It is not the way to detect endianness (it's
// always defined)
#ifdef BIG_ENDIAN
rawhex[6] = ss.get();
rawhex[7] = ss.get();
rawhex[4] = ss.get();
rawhex[5] = ss.get();
rawhex[2] = ss.get();
rawhex[3] = ss.get();
rawhex[0] = ss.get();
rawhex[1] = ss.get();
#else
rawhex[0] = ss.get();
rawhex[1] = ss.get();
rawhex[2] = ss.get();
rawhex[3] = ss.get();
rawhex[4] = ss.get();
rawhex[5] = ss.get();
rawhex[6] = ss.get();
rawhex[7] = ss.get();
#endif
if(ss.good())
{
std::stringstream convert;
convert << std::hex << rawhex;
int32_t val;
convert >> val;
std::cerr << (*(float*)(&val)) << "\n";
}
else
{
std::ostringstream os;
os << "Not enough values in LUT data. Found " << i;
os << ". Expected " << num_vals;
std::cerr << os.str() << std::endl;
throw std::exception();
}
}
}
(compila en OS X 10.7/gcc-4.2.1, con un simple g++ blah.cpp
)
Particularmente, me gustaría deshacerme de las cosas macro BIG_ENDIAN
, ya que estoy seguro de que hay una manera más agradable de hacerlo, como se discute en this post.
Algunos otros detalles al azar: no puedo usar Boost (una dependencia demasiado grande para el proyecto). La cadena contendrá normalmente entre 1,536 (8 * 3) y 98304 valores de coma flotante (32 * 3), a lo sumo 786432 (64 * 3)
(Edit2: añadió otro valor, 00000080
== -0.0
)
Creo que quería decir (c - 'A') + 10; asumiendo que solo estará en mayúscula A –
Además, la ventaja de hacerlo dígito por dígito es que puede hacer un bucle de izquierda a derecha o de derecha a izquierda dependiendo de la endianidad –
@OrgnlDave - por eso 'tolower' está allí. Sí en la endianidad, aunque se vuelve un poco más complicado (para un dígito de un solo byte no se intercambia) –