8. 数组¶

8.1. 数组的基本概念¶

数组（Array）也是一种复合数据类型，它由一系列相同类型的元素（Element）组成。例如定义一个由4个 int 型元素组成的数组 count ：

int count[4];

和结构体成员类似，数组 count 的4个元素的存储空间也是相邻的。结构体成员可以是基本数据类型，也可以是复合数据类型，数组中的元素也是如此。根据组合规则，我们可以定义一个由4个结构体元素组成的数组：

struct complex_struct {
        double x, y;
} a[4];

也可以定义一个包含数组成员的结构体：

struct {
        double x, y;
        int count[4];
} s;

数组类型的长度应该用一个整型常量表达式来指定 [1] 。数组中的元素通过下标（或者叫索引，Index）来访问。例如前面定义的由4个 int 型元素组成的数组 count 图示如下：

[1]	C99的新特性允许使用变量来定义数组的长度，称为变长数组（VLA，Variable Length Array），VLA只能定义为局部变量而不能是全局变量，与VLA有关的语法规则比较复杂，本书不做详细介绍。

数组count

整个数组占了4个 int 型的存储单元，存储单元用小方框表示，里面的数字是存储在这个单元中的数据（假设都是0），而框外面的数字是下标，这4个单元分别用 count[0] 、 count[1] 、 count[2] 、 count[3] 来访问。注意，在定义数组 int count[4]; 时，[]括号（Bracket）中的数字4表示数组的长度，而在访问数组时，[]括号中的数字表示访问数组的第几个元素。和我们平常数数不同，数组元素是从“第0个”开始数的，大多数编程语言都是这么规定的，所以计算机术语中有Zeroth这个词。这样规定使得访问数组元素非常方便，比如 count 数组中的每个元素占4个字节，则 count[0] 位于数组开头，而 count[i] 表示从数组开头跳过 4*i 个字节之后的那个存储单元。

这种数组下标的表达式不仅可以表示存储单元中的值，也可以表示存储单元本身，也就是说可以做左值，因此以下语句都是正确的：

count[0] = 7;
count[1] = count[0] * 2;
++count[2];

到目前为止我们学习了五种后缀运算符：后缀++、后缀–、结构体取成员.、数组取下标[]、函数调用()。还学习了五种单目运算符（或者叫前缀运算符）：前缀++、前缀–、正号+、负号-、逻辑非!。在C语言中后缀运算符的优先级最高，单目运算符的优先级仅次于后缀运算符，比其他运算符的优先级都高，所以上例中的 ++count[2] 应该看作对 count[2] 做前缀++运算。

数组下标也可以是表达式，但表达式的值必须是整型的。例如：

int i = 10;
count[i] = count[i+1];

使用数组下标不能超出数组的长度范围，这一点在使用变量做数组下标时尤其要注意。C编译器并不检查 count[-1] 或是 count[100] 这样的访问越界错误，编译时能顺利通过，所以数组访问越界属于运行时错误 [2] 。这种错误有时候很隐蔽，发生访问越界时程序可能并不会立即崩溃，而执行到后面某个正确的语句时却有可能突然崩溃（在程序崩溃我们会看到这样的例子）。所以在写代码时要小心避免出这样的问题，事后依靠调试来解决问题的成本是很高的。

[2]

你可能会想为什么编译器对这么明显的错误都视而不见？理由一，这种错误并不总是显而易见的，在指针会讲到通过指针而不是数组名来访问数组的情况，指针指向数组中的什么位置只有运行时才知道，编译时无法检查是否越界，而运行时每次访问数组元素都检查越界会严重影响性能，所以干脆不检查了；理由二， [C99Rationale] 的第0章指出，C语言的设计精神是：相信每个C程序员都是高手，不要阻止程序员去干他们需要干的事，在高手们写的代码中数组访问越界往往是一种技巧而不是Bug。此外，gcc 的C语法扩展允许把数组长度定义为0，对这种数组的任何下标访问显然都是越界的，0长度的数组通常用作结构体的最后一个成员，详见 http://gcc.gnu.org/onlinedocs/gcc/Zero-Length.html 。

数组也可以像结构体一样初始化，未赋初值的元素也是用0来初始化，例如：

int count[4] = { 3, 2, };

则 count[0] 等于3， count[1] 等于2，后面两个元素等于0。如果定义数组的同时初始化它，也可以不指定数组的长度，例如：

int count[] = { 3, 2, 1, };

编译器会根据Initializer有三个元素确定数组的长度为3。利用C99的新特性也可以做Memberwise Initialization：

int count[4] = { [2] = 3 };

下面看一个完整的例子：

#include <stdio.h>

int main(void)
{
        int count[4] = { 3, 2, }, i;

        for (i = 0; i < 4; i++)
                printf("count[%d]=%d\n", i, count[i]);
        return 0;
}

这个例子通过循环把数组中的每个元素依次访问一遍，在计算机术语中称为遍历（Traversal）。注意控制表达式 i < 4 ，如果写成 i <= 4 就错了，因为 count[4] 是访问越界。

数组和结构体虽然有很多相似之处，但也有一个显著的不同： 数组不能相互赋值或初始化。 比如：

int a[5] = { 4, 3, 2, 1 };
int b[5] = a; /* WRONG! */
b = a;        /* WRONG! */

用数组 a 来初始化数组 b 是错的，用数组 a 给数组 b 赋值也是错的。既然不能相互赋值，也就 不能用数组类型作为函数的参数或返回值 。如果写出这样的函数定义：

void foo(int a[5])
{
        ...
}

然后这样调用：

int array[5] = {0};
foo(array);

编译器也不会报错，但这样写的意思并不是传一个数组类型的参数。对于数组类型有一条特殊的类型转换规则： 数组类型做右值使用时，自动转换成指向数组首元素的指针。 对于函数声明也有一条特殊规则： 在函数原型中，如果参数写成数组的形式，则该参数实际上是指针类型。 所以上面的函数调用其实是传一个指针类型的参数，而不是数组类型的参数。接下来的几章里有的函数需要访问数组，我们就把数组定义为全局变量给函数访问，等到指针讲了指针再使用传参的办法。

数组类型不能相互赋值或初始化也是因为这条规则，例如上面提到的 b = a 这个表达式， a 和 b 都是数组类型的变量， a 做右值使用自动转换成指针类型，而 b 做左值仍然是数组类型，把指针赋给数组是不行的，所以编译器报的错是 error: incompatible types when assigning to type ‘int[5]’ from type ‘int *’ 。

习题

编写一个程序，定义两个类型和长度都相同的数组，将其中一个数组的所有元素拷贝给另一个。既然数组不能直接赋值，想想应该怎么实现。

8.2. 数组应用实例：统计随机数¶

本节通过一个实例介绍使用数组的一些基本模式。问题是这样的：首先生成一列0~9的随机数保存在数组中，然后统计其中每个数字出现的次数并打印，检查这些数字的随机性如何。随机数在某些场合（例如游戏程序）是非常有用的，但是用计算机生成完全随机的数却不是那么容易。计算机执行每一条指令的结果都是确定的，没有一条指令产生的是随机数，调用C标准库函数得到的随机数其实是伪随机（Pseudorandom）数，是用数学公式算出来的确定的数，只不过这些数看起来很随机，并且从统计意义上也很接近于均匀分布（Uniform Distribution）的随机数。

C标准库中生成伪随机数的是 rand 函数，使用这个函数需要包含头文件 stdlib.h ，它没有参数，返回值是一个介于0和 RAND_MAX 之间的接近均匀分布的整数。 RAND_MAX 是该头文件中定义的一个常量，在不同的平台上有不同的取值，但可以肯定它是一个非常大的整数。通常我们用到的随机数是限定在某个范围之中的，例如0~9，而不是0~RAND_MAX，我们可以用%运算符将 rand 函数的返回值处理一下：

int x = rand() % 10;

完整的程序如下：

#include <stdio.h>
#include <stdlib.h>
#define N 20

int a[N];

void gen_random(int upper_bound)
{
        int i;
        for (i = 0; i < N; i++)
                a[i] = rand() % upper_bound;
}

void print_random()
{
        int i;
        for (i = 0; i < N; i++)
                printf("%d ", a[i]);
        printf("\n");
}

int main(void)
{
        gen_random(10);
        print_random();
        return 0;
}

这里介绍一种新的预处理指示：用 #define 定义一个常量。实际上编译器的工作分为两个阶段，先是预处理（Preprocess）阶段，然后才是编译阶段，用 gcc 的 -E 选项可以看到预处理之后、编译之前的程序，例如:

$ gcc -E main.c
...（这里省略了很多行stdio.h和stdlib.h的代码）
int a[20];

void gen_random(int upper_bound)
{
        int i;
        for (i = 0; i < 20; i++)
                a[i] = rand() % upper_bound;
}

void print_random()
{
        int i;
        for (i = 0; i < 20; i++)
                printf("%d ", a[i]);
        printf("\n");
}

int main(void)
{
        gen_random(10);
        print_random();
        return 0;
}

可见在这里预处理器做了两件事情，一是把头文件 stdio.h 和 stdlib.h 在代码中展开，二是把 #define 定义的标识符 N 替换成它的定义 20 （在代码中做了三处替换，分别位于数组的定义中和两个函数中）。用 cpp main.c 命令也可以达到同样的效果，只做预处理而不编译， cpp 是C preprocessor的缩写。

那么用 #define 定义的常量和数据类型标志讲的枚举常量有什么区别呢？首先， #define 不仅用于定义常量，也可以定义更复杂的语法结构，称为宏（Macro）定义，我们将在预处理详细介绍。其次， #define 定义是在预处理阶段处理的，而枚举是在编译阶段处理的，试试看把数据类型标志习题中的程序改成下面这样会是什么结果。

#include <stdio.h>
#define RECTANGULAR 1
#define POLAR 2

int main(void)
{
        int RECTANGULAR;
        printf("%d %d\n", RECTANGULAR, POLAR);
        return 0;
}

注意，虽然 include 和 define 在预处理指示中有特殊含义，但它们并不是C语言的关键字，换句话说，它们也可以用作标识符，例如声明 int include; 或者 void define(int); 。在预处理阶段，如果一行以#号开头，后面跟 include 或 define ，预处理器就认为这是一条预处理指示，除此之外出现在其他地方的 include 或 define 预处理器并不关心，只当成普通的标识符留给编译阶段去处理。

回到随机数这个程序继续讨论，一开始为了便于分析和调试，我们取小一点的数组长度，只生成20个随机数，这个程序的运行结果为:

3 6 7 5 3 5 6 2 9 1 2 7 0 9 3 6 0 6 2 6

看起来很随机了。但随机性如何呢？分布得均匀吗？所谓均匀分布，应该每个数出现的概率是一样的。在上面的20个结果中，6出现了5次，而4和8一次也没出现过。但这说明不了什么问题，毕竟我们的样本太少了，才20个数，如果样本足够多，比如说100000个数，统计一下其中每个数字出现的次数也许能说明问题。但总不能把100000个数都打印出来然后挨个去数吧？我们需要写一个函数统计每个数字出现的次数。完整的程序如下：

#include <stdio.h>
#include <stdlib.h>
#define N 100000

int a[N];

void gen_random(int upper_bound)
{
        int i;
        for (i = 0; i < N; i++)
                a[i] = rand() % upper_bound;
}

int howmany(int value)
{
        int count = 0, i;
        for (i = 0; i < N; i++)
                if (a[i] == value)
                        ++count;
        return count;
}

int main(void)
{
        int i;

        gen_random(10);
        printf("value\thow many\n");
        for (i = 0; i < 10; i++)
                printf("%d\t%d\n", i, howmany(i));

        return 0;
}

我们只要把 #define N 的值改为 100000 ，就相当于把整个程序中所有用到 N 的地方都改为 100000 了。如果我们不这么写，而是在定义数组时直接写成 int a[20]; ，在每个循环中也直接使用 20 这个值，则称为硬编码（Hard Coding）。如果原来的代码是硬编码的，那么一旦需要把 20 改成 100000 就非常麻烦，你需要找遍整个代码，判断哪些 20 表示这个数组的长度就改为 100000 ，哪些 20 表示别的数量则不做改动，如果代码很长，这是很容易出错的。所以， 写代码时应尽可能避免硬编码 ，这其实也是一个“提取公因式”的过程，和数据抽象讲的抽象具有相同的作用，就是尽量把一个改动局限在一个地方，避免这个改动波及大范围的代码。这个程序的运行结果如下:

$ ./a.out
value   how many
     10130
     10072
     9990
     9842
     10174
     9930
     10059
     9954
     9891
     9958

各数字出现的次数都在10000次左右，可见是比较均匀的。

习题

用 rand 函数生成[10, 20]之间的随机整数，表达式应该怎么写？

8.3. 数组应用实例：直方图¶

继续上面的例子。我们统计一列0~9的随机数，打印每个数字出现的次数，像这样的统计结果称为直方图（Histogram）。有时候我们并不只是想打印，更想把统计结果保存下来以便做后续处理。我们可以把程序改成这样：

int main(void)
{
        int howmanyones = howmany(1);
        int howmanytwos = howmany(2);
        ...
}

这显然太繁琐了。要是这样的随机数有100个呢？显然这里用数组最合适不过了：

int main(void)
{
        int i, histogram[10];

        gen_random(10);
        for (i = 0; i < 10; i++)
                histogram[i] = howmany(i);
        ...
}

有意思的是，这里的循环变量 i 有两个作用，一是作为参数传给 howmany 函数，统计数字 i 出现的次数，二是做 histogram 的下标，也就是“把数字 i 出现的次数保存在数组 histogram 的第 i 个位置”。

尽管上面的方法可以准确地得到统计结果，但是效率很低，这100000个随机数需要从头到尾检查十遍，每一遍检查只统计一种数字的出现次数。其实可以把 histogram 中的元素当作累加器来用，这些随机数只需要从头到尾检查一遍（Single Pass）就可以得出结果：

int main(void)
{
        int n, histogram[10] = {0};

        gen_random(10);
        for (n = 0; n < N; n++)
                histogram[a[n]]++;
        ...
}

首先把 histogram 的所有元素初始化为0，注意使用局部变量的值之前一定要初始化，否则值是不确定的。接下来的代码很有意思，在每次循环中， a[n] 就是出现的随机数，而这个随机数同时也是 histogram 的下标，这个随机数每出现一次就把 histogram 中相应的元素加1。

把上面的程序运行几遍，你就会发现每次产生的随机数都是一样的，不仅如此，在别的计算机上运行该程序产生的随机数很可能也是这样的。这正说明了这些数是伪随机数，是用一套确定的公式基于某个初值算出来的，只要初值相同，随后的整个数列就都相同。实际应用中不可能使用每次都一样的随机数，例如开发一个麻将游戏，每次运行这个游戏摸到的牌不应该是一样的。因此，C标准库允许我们自己指定一个初值，然后在此基础上生成伪随机数序列，这个初值称为Seed，可以用 srand 函数指定Seed。通常我们通过别的途径得到一个不确定的数作为Seed，例如调用 time(2) 函数得到当前系统时间距1970年1月1日00:00:00 [3] 的秒数，然后传给 srand ：

[3]	各种派生自UNIX的系统都把这个时刻称为Epoch，因为这个时刻近似等于UNIX系统诞生的时间（实际上最早的UNIX系统诞生于1969年）。

srand(time(NULL));

然后再调用 rand ，得到的随机数就和刚才完全不同了。调用 time(2) 函数需要包含头文件 time.h ，这里的 NULL 表示空指针，到指针的基本概念再详细解释。

习题

补完本节直方图程序的 main 函数，以可视化的形式打印直方图。例如上一节统计20个随机数的结果是:

0  1  2  3  4  5  6  7  8  9

*  *  *  *     *  *  *     *
*     *  *     *  *  *     *
      *  *        *
                  *
                  *

用数组定义一个序列，编程打印它的全排列。比如定义：
1 2
#define N 3 int a[N] = { 1, 2, 3 };
则运行结果是:
```
$ ./a.out
1 2 3
1 3 2
2 1 3
2 3 1
3 2 1
3 1 2
```
程序的主要思路是：
1. 把第1个数换到最前面来（和第1个数交换，其实就是自己和自己交换，序列不变，还是1，2，3），准备打印1xx，再对后两个数2和3做全排列，打印完所有排列后恢复序列原来的次序。
2. 把第2个数换到最前面来（和第1个数交换，序列变成2，1，3），准备打印2xx，再对后两个数1和3做全排列，打印完所有排列后恢复序列原来的次序。
3. 把第3个数换到最前面来（和第1个数交换，序列变成3，2，1），准备打印3xx，再对后两个数2和1做全排列，打印完所有排列后恢复序列原来的次序。
可见这是一个递归的过程，把“对整个序列做全排列”的问题归结为“对它的子序列做全排列”的问题，注意我没有描述Base Case怎么处理，你需要自己想。你的程序要具有通用性，如果改变了 N 和数组 a 的定义（比如改成4个数的数组），其他代码不需要修改就可以做4个数的全排列（共24种排列）。

完成了上述要求之后再考虑第二个问题：如果再定义一个常量 M 表示从 N 个数中取 M 个数做排列（ N == M 时表示全排列），原来的程序应该怎么改？

最后再考虑第三个问题：如果要求从 N 个数中取 M 个数做组合而不是做排列，就不能用原来的递归过程了，想想组合的递归过程应该怎么描述，编程实现它。

8.4. 字符串¶

之前我一直对字符串避而不谈，不做详细解释，现在已经具备了必要的基础知识，可以深入讨论一下字符串了。字符串字面值和数组类型相似，它的每个元素是字符型的，例如字符串 "Hello, world.\n" 图示如下：

字符串

注意每个字符串末尾都有一个字符 '\0' 做结束符，在字符类型与字符编码讲过 '\0' 叫Null字符，所以字符串也称为“以Null结尾的字符串”（Null-terminated String）。

数组元素可以通过数组名加下标的方式访问，而字符串字面值也可以像数组名一样使用，可以加下标访问其中的字符，例如：

char c = "Hello, world.\n"[14];

把 "Hello, world.\n" 这个字符串看作一个数组，下标14的位置是字符 '\0' ，所以这个语句把 '\0' 赋给了变量 c 。C标准没有规定字符串字面值所占的存储空间是否允许被修改，但常见的C编译器都把字符串字面值实现成只读的。假如代码中有这么一行：

"Hello, world.\n"[0] = 'A';

gcc 在编译时会给出一个警告 warning: assignment of read-only location ，在运行时程序执行到这一条语句会产生段错误。

字符串字面值还有一点和数组类型相似：做右值使用时自动转换成指向首字符的指针。在形参和实参我们看到 printf 原型的第一个参数是指向字符的指针类型，而函数调用 printf("Hello, world.\n") 其实就是传一个指针参数给 printf ，关于字符串字面值和指针的关系将在指针与const限定符详细解释。字符串字面值有一种特殊用法，可以作为Initializer给一个字符数组初始化 [4] ：

[4]	这个语法的特殊之处在于，在这里字符串字面值和数组的用法并不相似，我们不能用一个数组给另一个数组初始化，却可以用一个字符串字面值给一个数组初始化。另一方面，我们不能把一个数组赋值给另一个数组，同样也不能把一个字符串字面值赋值给一个数组。这些特殊规定没什么道理可讲，一切都可归结于历史原因。

char str[10] = "Hello";

等价于这样初始化：

char str[10] = { 'H', 'e', 'l', 'l', 'o', '\0' };

str 的后4个元素没有指定，自动初始化为Null字符。注意，虽然字符串字面值 "Hello" 是只读的，但用它初始化的数组 str 却是可读可写的，这说明 str 和 "Hello" 各自占据不同的存储空间，只不过 str 所占的存储空间里的内容拷贝自 "Hello" 。数组 str 中保存了一串字符，以Null字符结尾，也可以叫字符串。 在本书中只要是以Null结尾的一串字符都叫字符串，不管是像str这样的字符数组，还是像”Hello”这样的字符串字面值。

如果用于初始化的字符串字面值比数组还长，比如：

char str[10] = "Hello, world.\n";

则数组 str 只包含字符串的前10个字符，不包含Null字符，这种情况编译器会给出警告。如果要用一个字符串字面值准确地初始化一个字符数组，最好的办法是不指定数组的长度，让编译器自己计算：

char str[] = "Hello, world.\n";

字符串字面值的长度包括Null字符在内一共15个字符，编译器会确定数组 str 的长度为15。有一种情况需要特别注意，如果用于初始化的字符串字面值比数组刚好长出一个Null字符的长度，比如：

char str[14] = "Hello, world.\n";

则数组 str 不包含Null字符，并且编译器不会给出警告， [C99Rationale] 的6.7.8节说这样规定是为了程序员方便，以前的很多编译器也都是这样实现的，不管它有理没理，C标准既然这么规定了我们也没办法，只能自己小心了。

补充一点，在 printf 函数的格式化字符串中可以用 %s 表示字符串的占位符。在学习字符数组以前，我们用 %s 没什么意义，因为

printf("string: %s\n", "Hello");

还不如写成

printf("string: Hello\n");

但现在字符串可以保存在一个数组里面，用 %s 来打印就很有必要了：

printf("string: %s\n", str);

printf 会从数组 str 的开头一直打印到Null字符为止，Null字符本身是Non-printable字符，不打印。这其实是一个危险的信号：如果数组 str 中没有Null字符，那么 printf 函数就会访问数组越界，后果可能会很诡异，有时候打印出乱码，有时候看起来没错误，有时候引起程序崩溃。

8.5. 多维数组¶

就像结构体可以嵌套一样，数组也可以嵌套，一个数组的元素可以是另外一个数组，这样就构成了多维数组（Multi-dimensional Array）。例如定义并初始化一个二维数组：

int a[3][2] = { 1, 2, 3, 4, 5 };

数组 a 有3个元素， a[0] 、 a[1] 、 a[2] 。每个元素也是一个数组，例如 a[0] 是一个数组，它有两个元素 a[0][0] 、 a[0][1] ，这两个元素的类型是 int ，值分别是1、2，同理，数组 a[1] 的两个元素是3、4，数组 a[2] 的两个元素是5、0。如下图所示：

多维数组

从概念模型上看，这个二维数组是三行两列的表格，元素的两个下标分别是行号和列号。从物理模型上看，这六个元素在存储器中仍然是连续存储的，就像一维数组一样，相当于把概念模型的表格一行一行接起来拼成一串，C语言的这种存储方式称为Row-major方式，而有些编程语言（例如FORTRAN）是把概念模型的表格一列一列接起来拼成一串存储的，称为Column-major方式。

多维数组也可以像嵌套结构体一样用嵌套Initializer初始化，例如上面的二维数组也可以这样初始化：

int a[3][2] = { { 1, 2 }, { 3, 4 }, { 5, } };

利用C99的新特性也可以做Memberwise Initialization，例如：

int a[3][2] = { [0][1] = 9, [2][1] = 8 };

结构体和数组嵌套的情况也可以做Memberwise Initialization，例如：

struct complex_struct {
        double x, y;
} a[4] = { [0].x = 8.0 };

struct {
        double x, y;
        int count[4];
} s = { .count[2] = 9 };

如果是多维字符数组，也可以嵌套使用字符串字面值做Initializer，例如：

#include <stdio.h>

void print_day(int day)
{
        char days[8][10] = { "", "Monday", "Tuesday",
                             "Wednesday", "Thursday", "Friday",
                             "Saturday", "Sunday" };

        if (day >= 1 && day <= 7)
                printf("%s\n", days[day]);
        else
                printf("Illegal day number!\n");
}

int main(void)
{
        print_day(2);
        return 0;
}

多维字符数组

这个程序中定义了一个多维字符数组 char days[8][10]; ，如上图所示。为了使1~7刚好映射到 days[1] ~ days[7] ，我们把 days[0] 空出来不用，所以第一维的长度是8，为了使最长的字符串 "Wednesday" 能够保存到一行，末尾还能多出一个Null字符的位置，所以第二维的长度是10。

这个程序和 switch语句的功能其实是一样的，但是代码简洁多了。简洁的代码不仅可读性强，而且维护成本也低，像 switch语句那样一堆 case 、 printf 和 break ，如果漏写一个 break 就要出Bug。这个程序之所以简洁，是因为用数据代替了代码。具体来说，通过下标访问字符串组成的数组可以代替一堆 case 分支判断，这样就可以把每个 case 里重复的代码（ printf 调用）提取出来，从而又一次达到了“提取公因式”的效果。这种方法称为数据驱动的编程（Data-driven Programming），写代码最重要的是选择正确的数据结构来组织信息，设计控制流程和算法尚在其次，只要数据结构选择得正确，其他代码自然而然就变得容易理解和维护了，就像这里的 printf 自然而然就被提取出来了。 [人月神话] 的第9章说：“Show me your flowcharts and conceal your tables, and I shall continue to be mystified. Show me your tables, and I won’t usually need your flowcharts; they’ll be obvious.”

最后，综合本章的知识，我们来写一个最简单的小游戏－－剪刀石头布：

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

int main(void)
{
        char gesture[3][10] = { "scissor", "stone", "cloth" };
        int man, computer, result, ret;

        srand(time(NULL));
        while (1) {
                computer = rand() % 3;
                printf("\nInput your gesture (0-scissor 1-stone 2-cloth):\n");
                ret = scanf("%d", &man);
                if (ret != 1 || man < 0 || man > 2) {
                        printf("Invalid input!\n");
                        return 1;
                }
                printf("You: %s\tComputer: %s\n",
                       gesture[man], gesture[computer]);

                result = (man - computer + 4) % 3 - 1;
                if (result > 0)
                        printf("You win!\n");
                else if (result == 0)
                        printf("Draw!\n");
                else
                        printf("You lose!\n");
        }
        return 0;
}

0、1、2三个整数分别是剪刀、石头、布在程序中的内部表示，用户也要求输入0、1或2，然后和计算机随机生成的0、1或2比胜负。这个程序的主体是一个死循环，需要按Ctrl-C退出程序。以往我们写的程序都只有打印输出，在这个程序中我们第一次碰到处理键盘输入的情况。我们简单介绍一下 scanf 函数的用法，到格式化I/O函数再详细解释。

scanf("%d", &man) 这个调用的功能是等待用户输入一个整数并回车，这个整数会被 scanf 函数保存在 man 这个整型变量里。如果用户输入合法（输入的确实是数字而不是别的字符），则 scanf 函数返回1，表示成功读入一个数据。但即使用户输入的是整数，我们还需要进一步检查是不是在0~2的范围内，写程序处理用户输入时要格外小心，用户有可能输入任何数据，他才不管游戏规则是什么。

和 printf 类似， scanf 也可以用 %c 、 %f 、 %s 等转换说明。如果在传给 scanf 的第一个参数中用 %d 、 %f 或 %c 表示读入一个整数、浮点数或字符，则第二个参数的形式应该是&运算符加相应类型的变量名，表示读进来的数保存到这个变量中，&运算符的作用是取变量存储空间的地址得到一个指针类型，到指针的基本概念再详细解释。如果在第一个参数中用 %s 读入一个字符串，则第二个参数应该是数组名，数组名前面不加&，因为数组类型做右值时自动转换成指针类型，在断点有 scanf 读入字符串的例子。

留给读者思考的问题是： (man - computer + 4) % 3 - 1 这个神奇的表达式是如何比较出0、1、2这三个数字在“剪刀石头布”意义上的大小的？