大端、小端与网络字节序

  • C
  • 3,785 clicked

  大端(Big-Endian),小端(Little-Endian)以及网络字节序的概念在编程中经常会遇到。网络字节序(Network Byte Order)一般是指大端(Big-Endian,对大部分网络传输协议而言)传输,大端小端的概念是面向多字节数据类型的存储方式定义的,小端就是低位在前(低位字节存在内存低地址,字节高低顺序和内存高低地址顺序相同),大端就是高位在前,(其中“前”是指靠近内存低地址,存储在硬盘上就是先写那个字节)。概念上字节序也叫主机序。

一、大小端概念

  1. 首先大小端是面向多字节类型定义的,比如2字节、4字节、8字节整型、长整型、浮点型等,单字节的字符串一般不用考虑。
  2. 大端小端存储、传输、以及接收处理需要对应。
  3. 大端(Big-Endian)就是高字节(MSB)在前,内存存储体现上,数据的高位更加靠近低地址。(低地址存高字节)——人类常用习惯的方式,网络、存储中常用。
  4. 小端(Little-Endian)就是低字节(LSB)在前,内存存储体现上,数据的低位更加靠近低地址。(低地址存低字节)——机器效率高存储方式
  5. 网络字节序一般是指大端传输,人们常用数字读取方式也是大端。

二、大小端存储示例

  假设一个32位 unsigned int型数据0x12 34 56 78,大小端8位存储方式如下:

  • 大端存储方式为0x12 34 56 78(0x12所在位置为低地址,同时是数据大小的高位)
  • 小端存储方式为0x78 56 34 12,如下图。

三、常见CPU的大小端存储方式

  不同CPU有不同的字节序类型,典型的使用小端存储的CPU有:Intel x86和ARM 。典型的使用大端存储CPU有:Power PC、MIPS UNIX和HP-PA UNIX。以上CPU需根据具体型号查询手册,有的CPU甚至可能同时能支持两种存储方式。
注:
  上文说的网络字节顺序则是表示网络传输时的字节序,按照TCP/IP协议是按照大端传输方式,也就是高字节先走(先传12,接着34,56,78),这跟本机存储和服务器存储没有关系,只要确保双方解析对应即可。

四、四个转换函数

  C/C++中有如下四个常用的转换函数,这四个函数在小端系统中生效,大端系统由于和网络字节序相同,所以无需转换。

  • htons —— 把unsigned short类型从主机序转成网络字节序
  • ntohs —— 把unsigned short类型从网络字节序转成主机序
  • htonl —— 把unsigned long类型从主机序转成网络字节序
  • ntohl —— 把unsigned long类型从网络字节序转成主机序

以上函数包含头文件:

#if defined(_LINUX) || defined(_DARWIN)
    #include <netinet/in.h>
#endif

#ifdef WIN32
    #include <WINSOCK2.H>
#endif
//判断是否大小端函数
#include <windows.h>
#indlue <stdio.h>
void main(int argc, char* argv[])
{
  DWORD dwSmallNum = 0x01020304;
  if(*(*BYTE)&dwSmallNum  == 0x01)
    printf(“Big Sequence.\r\n”);
  else
    printf(“Small Sequence.\r\n”);
}

发表评论

邮箱地址不会被公开。 必填项已用*标注