本文是深入理解计算机系统的第二篇文章,接着上一篇我们讲解的计算机系统开篇- 《计算机系统漫游》 ,本篇文章继续深入,一起来学习 信息的表示和处理 。 本篇文章一共分为四部分, 信息存储 、 整数的表示 , 整数的运算 和 浮点数 。 程序将内存视为一个非常大的字节数组,称为 虚拟内存 。内存中的每一个字节都由一个唯一的数字来标识,称为它的 地址 ,地址的集合就称为 虚拟地址空间 。 对于我们日常程序中的对象,它们在内存中往往是多字节的,那么我们必须知道两个规则: 这个对象的地址是什么? 以及 内存中如何排列这些字节? 在几乎所有的机器上,字节都是被连续存储的,对象的地址为所使用字节中最小的地址。例如,一个int类型的变量x的地址为0x100,也就是地址表达式&x 的值为0x100,x的四个字节存储在内存0x100、0x101、0x102、0x103位置。 排列表示一个对象的字节,有两个通用的规则: 对于我们程序员来说,机器使用的字节顺序对我们是不可见的,无论哪种字节顺序的机器,我们的程序编译后得到的结果都是一样的,不过有时候字节顺序也会成为问题,这里不再详述什么情况下会产生问题,只作学习验证机器的字节顺序不同产生的不同结果。 运行上面的c语言程序,得到的结果如下: 39300000 00e44046 a8e7a4c2ff7f0000 参数12345的十六进制表示为0x00000393,结合上面的结果 39300000 说明我的linux64是一个小端法机器。下面在放一张在各个机器测试的不同结果,更加全面的对比图: 上图指针 值完全不相同的原因是不同的操作系统使用不同的存储分配规则,不过需要注意的是Linux64使用的是8字节地址。 C语言的字符串:一个以null(值为0)字符结尾的字符数组 如字符串"12345"编码为 61 62 63 64 65 使用ASCII编码。 linux系统可以使用 man ascii 命令查看ASCII编码表。 二进制是计算机编码、存储和操作信息的核心。 将逻辑值 TRUE 和 FALSE 编码为1和0,能够设计一种代数,用来研究逻辑推理的基本原则。 布尔运算: 以下是一些对char数据类型表达式求值的例子: 正如示例说明的那样,确定一个位级表达式的结果最好的方法,就是将十六进制的参数扩展成二进制表示并执行二进制运算,然后再转换回十六进制。 移位运算右移分为:逻辑右移和算术右移。 C语言中,几乎所有的编译器都对有符号数使用算术右移,无符号数使用逻辑右移。 Java中有明确定义,x>>k 表示算术右移k个位置,而x>>>k 会对x做逻辑右移。 这里说明一个移位运算有关的操作符优先级问题: 表达式 1<<2+3<<4 ,本意是(1<<2)+(3<<4),你可能也会犯这样的错误,其实前面的表达式等价于:1<<(2+3)<<4,因为 加法(减法)的优先级比移位运算要高 。 下面的数据术语用来精确定义和描述计算机如何编码和操作整数。 假设一个整数有w位,每个位的取值即0非1。 原理:无符号数编码的定义 对向量 用一个函数来表示: 计算规则: 上面介绍的是无符号编码的表示形式,但是我们应用中,还是希望表示负数值。最常见的有符号数计算机表示方式就是补码。 原理:补码编码的定义 对向量: 最高有效位即 也称为符号位。符号位等于1时,表示值为负,等于0时,值为非负,下面来看实际的计算示例: 这里让我们一起来考虑下补码所能表示的值的范围,最小值为: . 最大值为: 例如以长度为4为例, , 而 补码编码也是取值范围内每个数字都有唯一的w位补码编码。 原理:补码转换为无符号数 对满足 的 x 有: 比如, ,同时 u200b 。 原理:无符号数转换为补码 对满足 的 u 有: 在我们刚刚学习计算机时,大家有没有经历过,两个正数相加会得出一个负数,而比较表达式 x<y 和 x-y<0 会产生不同的结果呢?带着这些问题一起往下看吧。 原理:无符号加法,对满足 的 x 和 y有: 比如:x=9,y=12 的位表示分别为[1001] 和 [1100]。它们的和是21,表示为5位的[10101],产生溢出,丢弃最高位。 原理: 检测无符号数加法中的溢出 对在范围 ,s=x+y,若s < x 或者等价的 s < y时,发生了溢出。 原理: 无符号数求反 对满足 ,的任意x,其w位的无符号逆元 表达式如下: 原理: 补码加法 对满足 的整数x,y,有: 原理: 检测补码加法中的溢出 对满足 的x 和 y,令 s = x + y。当且仅当x>0,y>0,但s<=0时,计算s发生了正溢出。当且仅当 x<0,y<0,但s>=0时,计算发生了负溢出。 在大多数机器上,整数乘法指令相当慢,需要10个或者更多的时钟周期,然而 加法、减法、位运算、移位操作只需要一个时钟周期 。 因此,编译器使用了移位和加法运算的组合代替乘以常数因子的乘法。 原理: 乘以2的幂 例如:x*14,利用14 = ,编译器会将乘法重写为 ,将乘法替换为三个移位和一个加法。 在大多数机器上,整数除法比乘法更慢,需要30个左右的时钟周期。 所以除法,也可以采用移位运算,相对于乘法这里采用的是右移,而不是左移。 十进制数转换描述定义: 例如:12.34 = 二进制数转换描述定义: 例如, 增加二进制表示的长度可以提高表示的精度: IEEE浮点标准用 的形式来表示一个数: 如下图: 在单精度格式(float),s,exp 和 frac 字段分别为 s=1,k=8, n = 23,得到一个32位的表示。 在双精度浮点格式(double)中,s=1、k=11、n=52位,得到一个64位的表示。 u200b