字节序列和类型

2018-07-26  本文已影响0人  usrbin

1

做了一个简单的DHCP客户端,深入了解了一下字节和类型。代码片段如下:

static void DumpUInt(const char* title, unsigned int n) {
  assert(title != NULL);
  
  printf("%s %u\n", title n);
  unsigned char* bytes = (unsigned char*)&n;
  for (int i = 0; i < sizeof(n); ++i) {
    printf("%02x ", bytes[i]);
  }
  printf("\n");
}

int main() {
  // ...

  /*
    struct Buffer {
      char* base;
      size_t len;
    }
  */
  unsigned char*bytes = (unsigned char*)buf->base;
  printf("network\n");
  for (int i = 16; i < 20; ++i) {
    printf("%02x ", bytes[i]);
  }
  printf("\n");

  unsigned int* asInt = (unsigned int*)buf->base;
  unsigned int ipbin = ntohl(asInt[4]);
  unsigned char ip[4] = {0};
  for (int i = 0; i < 4; ++i) {
    ip[i] = (ipbin >> i * 8) & 0xFF;
  }
  LOGINFO("Offered IP: %d.%d.%d.%d", ip[3], ip[2], ip[1], ip[0]);

  DumpUInt("asInt[4]", asInt[4]);
  DumpUInt("ipbin", ipbin);

  // ...
}

网络数据存储在buf->base中。数据块的第17-20字节存的是DHCP服务器返回的IP地址。一般我都会直接转成字节流,去读第多少个字节。但参考的代码使用了unsigned int指针。这只是为了便利地访问到想要的数据:asInt[4]。觉得这种方法挺有意思,就打印了一下值。打印结果如下:

network
0a 0b 3f 07
[18-07-26 XX:XX:XX][INFO]Offered IP: 10.11.63.7
asInt[4] 121572106
0a 0b 3f 07
ipbin 168509191
07 3f 0b 0a

这段代码跑在Win10 X64上。现在把感兴趣的数据拿出来:

network
a. 0a 0b 3f 07 网络序列
asInt[4]
121572106
b. 0a 0b 3f 07 网络序列
c. 07 3f 0b 0a asInt[4]的十六进制格式
ipbin
168509191
d. 07 3f 0b 0a 主机序列
e. 0a 0b 3f 07 ipbin的十六进制格式
IP
10.11.63.7
f. 0a 0b 3f 07 最终的IP结果

asInt[4]ipbin的打印可以看到,无论内存中是什么数据,unsigned int指针都会从起始位置读取4个字节按照本机的序列来解析它。按类型读取出的数据和ntohl转换出来的数据是一样的。这个结论在大端机上也适用。
看了一下glibc的源码,发现ntohl只是简单的反序了参数的字节。如果知道读取的内容是什么类型时,可以不必给字节转序,直接使用该类型的指针读取就好了。

2

字节序是已字节为最小单位的。如果收发的数据都是单字节数据,那么不必考虑字节序的问题。不过,如果使用了bit filed特性,就需要考虑字节内的位序了。大端单字节的位序和小端单字节的位序是相反的。按位读取的时候如果不考虑位序就会出问题。例如,定义一个IP头数据结构:

typedef struct IPHeader {
    // {{
    unsigned char ipHeaderLength : 4;
    unsigned char ipVersion : 4;
    // }}
    unsigned char typeOfService;
    unsigned short ipTotalLength;

    unsigned short ipId;
    // {{
    unsigned char ipFragmentOffset : 5;
    unsigned char ipMoreFragment : 1;
    unsigned char ipDontFragment : 1;
    unsigned char ipReservedZero : 1;
    // }}
    unsigned char ipFragmentOffset1;

    unsigned char ipTTL;
    unsigned char ipProtocol;
    unsigned short ipChecksum;

    unsigned int ipSrcAddr;

    unsigned int ipDstAddr;
} IPV4Header, *PIPV4Header, FAR* LPIPV4Header;

上面IP头的定义中Version和Header Length反了,同样,保留0字段,不分片字段,分片字段,分片偏移的顺序也反了。这就是考虑了大端和小端的位序不同。

上一篇下一篇

猜你喜欢

热点阅读