Android NDK入门:C++ 基础知识
为什么写这篇文章
本文算作是 《Android 音视频开发打怪升级》系列文章的“番外”篇,原本打算将本文的内容写在 《Android FFmpeg视频解码播放》 这篇文章中,因为要想学习 FFmpeg
相关知识,C++
的基础知识是必不可少的。
但是写着写着发现,篇幅还是太长了,加上有部分小伙伴对 C++
可能也比较熟悉,所以把此节独立成篇,更有利于不熟悉 C++
的小伙伴学习查看,熟悉的小伙伴也可以直接跳过。
C++
相对于 Java
还是有许多的不同之处,对于没有使用过 C++
的人来说,如果要学习 NDK
开发,C++
是第一道坎,必须要掌握。
本文通过对比的方式,把 C++
和 Java
之间最基础,也是最常使用知识的异同标记出来,方便大家学习。
当然了,本文只是重点对 C++
中最常用的,也是重点的知识进行讲解,如有时间,最好还是系统地学一下相关的基础知识。
本文你可以了解到
本文使用对比的方式,将
C++
与我们非常熟悉的Java
进行对比学习,介绍C++
与Java
使用的异同,帮助大家快速入门C++
。
一、 C++ 基本数据类型
C++ 提供了一下几种基础数据类型
类型 | 关键字 |
---|---|
布尔型 | bool |
字符型 | char |
整型 | int |
浮点型 | float |
双浮点型 | double |
无类型 | void |
同时,这些类型还可以被类型修饰符修饰,拓展出更多的数据类型:
类型修饰符 | 关键字 |
---|---|
有符号类型 | signed |
无符号类型 | unsigned |
短类型 | short |
长类型 | long |
其中 signed
和 unsigned
指定了数据是否有正负; short
和 long
主要指定了数据的内存大小。
由于不同的系统,同个数据类型所占用的内存大小也不一定是一样的,以下是典型值:
类型 | 内存大小 | 范围 |
---|---|---|
char | 1 个字节 | -128到127 或 0到255 |
unsigned char | 1 个字节 | 0 到 255 |
signed char | 1 个字节 | -128 到 127 |
int | 4 个字节 | -2147483648 到 2147483647 |
unsigned int | 4 个字节 | 0 到 4294967295 |
signed int | 4 个字节 | -2147483648 到 2147483647 |
short int | 2 个字节 | -32768 到 32767 |
unsigned short int | 2 个字节 | 0 到 65,535 |
signed short int | 2 个字节 | -32768 到 32767 |
long int | 8 个字节 | -xxx 到 xxx |
signed long int | 8 个字节 | -xxx 到 xxx |
unsigned long int | 8 个字节 | -xxx 到 xxx |
float | 4 个字节 | -xxx 到 xxx |
double | 8 个字节 | -xxx 到 xxx |
long double | 16 个字节 | -xxx 到 xxx |
可以看到,
short
修饰符将原类型内存大小减小一半;
long
修饰符将原数据类型内存大小扩大一倍。
二、C++ 类
C++
是一门面向对象的语言,类是必不可少的。其类的定义与 Java
大同小异。
Java
类通常声明和定义通常都是在同一个文件 xxx.java
中。
而 C++
类的声明和定义通常是分开在两个不同的文件中,分别是 .h 头文件
和 .cpp 文件
定义一个类
一个 类的头文件
通常如下:
// A.h
class A
{
private: //私有属性
int a;
void f1();
protected: //子类可见
int b;
void f2(int i);
public: //公开属性
int c = 2;
int f3(int j);
A(int a, int b); // 构造函数
~A(); //析构函数
};
对应的类实现文件 A.cpp
如下:
// A.cpp
/**
* 实现构造函数
*/
A::A(int a, int b):
a(a),
b(b) {
}
// 等价于
/*
A::A(int a, int b) {
this.a = a;
this.b = b;
}
*/
/**
* 实现析构函数
*/
A::~A() {
}
/**
* 实现 f1 方法
*/
void A::f1() {
}
/**
* 实现 f2 方法
*/
void A::f2(int j) {
this.b = j
}
/**
* 实现 f3 方法
*/
int A::f3(int j) {
this.c = j
}
可以看到,.h
文件主要负责类成员变量和方法的声明; .cpp
文件主要负责成员变量和方法的定义。
但是,并非一定要按照这样的结构去实现类,你也可以在 .h
头文件中直接定义变量和方法。
比如:
// A.h
class A {
private:
int a = 1;
public:
void f1(int i) {
this.a = i;
}
}
C++ 类中几个特别的地方
1) 可见性 private、protected、public
这几个关键字和 Java
是一样的,只不过在 C++
中,通常不会对每个成员变量和方法进行可见性声明,而是将不同的可见性的变量和方法集中在一起,统一声明,具体见上面定义的类A。
2) 构造函数和析构函数
C++
中类的构造函数和 Java
基本一致,只不过,在实现构造函数时,对成员变量的初始化方式比较特别。如下:
A::A(int a, int b):
a(a),
b(b) {
}
// 等价于
A::A(int a, int b) {
this.a = a;
this.b = b;
}
以上两种方式都可以,通常使用第一种方式。
析构函数
则是 Java
中没有的。通过波浪符号 ~
进行标记。
它和构造函数一样,都是由系统自动调用,只不过,构造函数
在类创建的时候调用,析构函数
在类被删除的时候调用,主要用于释放内部变量和内存。
析构函数的声明形式为 ~类名();
实现的形式为 类名::~类名() { }
具体见上面类 A 的写法。
3) ::
双冒号
看了上面类的定义,肯定会对 ::
这个符号感到很神奇。这是 C++
中的 域作用符
,用于标示变量和方法是属于哪个域的,比如上面的
void A::a() { }
说明 方法a
是属于 类A
的。
也可以用于调用类的静态成员变量,如
//A.h
class A {
private:
static int a = 1;
int b;
void a();
}
//A.cpp
void A::a() {
b = A::a;
}
类的继承
C++
类的继承和 Java
也是大同小异,其格式如下:
class B: access-specifier A
,其中 access-specifier
是访问修饰符, 是 public
、protected
或 private
其中的一个。
访问修饰符的作用如下:
公有继承(public):当一个类派生自公有基类时,基类的公有成员也是派生类的公有成员,基类的保护成员也是派生类的保护成员,基类的私有成员不能直接被派生类访问,但是可以通过调用基类的公有和保护成员来访问。
保护继承(protected): 当一个类派生自保护基类时,基类的公有和保护成员将成为派生类的保护成员。
私有继承(private):当一个类派生自私有基类时,基类的公有和保护成员将成为派生类的私有成员。
通常情况下,我们都是使用
公有继承(public)
,也就是和Java
是一样的。
类可以多继承
Java
中,子类只能继承一个父类,但是 C++
可以继承自多个父类,使用逗号 ,
隔开:
class <派生类名>:<继承方式1><基类名1>,<继承方式2><基类名2>,…
{
<派生类类体>
};
三、 C++ 指针
Java 中的 “指针”
Java
中,是没有指针的概念的,但是其实 Java
中除了基本数据类,大部分情况下使用都是 指针
。
比如下面这段 Java
代码:
People p1 = new People("David","0001");
People p2 = p1;
p2.setName("Denny");
System.out.println(p1.getName());
// 输出结果为:Denny
原因就是 p1 和 p2 都是对对象的引用,在完成赋值语句 People p2 = p1; 后, p2 和 p1 指向同一个存储空间,所以对于p2的修改也影响到了p1。
那么,为什么在 Java
中很少去关注指针呢?
因为 Java
已经将指针封装了,也不允许显式地去操作指针,并且 Java
中的内存都由虚拟机进行管理,无需我们去释放申请的内存。
C++ 中的指针
1) 指针的声明和定义
与 Java
不同的是,C++
中的指针概念非常重要,并且无处不在。
指针
:是一个变量,这个变量的值是另一个变量的内存地址。也就是说,指针是一个指向内存地址的变量。
指针的声明和定义方法如下:
int a = 1; // 实际变量的声明
int *p; // 指针变量的声明
p = &a; // 指针指向 a 的内存地址
printf("p 指向的地址: %d, p指向的地址存储的内容: %d\n", p, *p);
// 输出如下:
// p 指向的地址: -1730170860, p指向的地址存储的内容: 1
这个例子中有两个很重要的符号: *
、&
。其中:
*
:有两个作用:
i. 用于定义一个指针: type *var_name;
,var_name
是一个指针变量,如 int *p;
ii. 用于对一个指针取内容: *var_name
, 如 *p
的值是 1
。
&
:是一个取址符号
其用于获取一个变量所在的内存地址。如 &a;
的值是 a
所在内存的位置,即 a
的地址。
通过上面的例子,可能无法很好的理解指针的用处,来看另一个例子。
class A {
public:
int i;
};
int main() {
//-----1-------
A a = A(); // 定变量 a
a.i = 1; // 修改 a 中的变量
A b = a; // 定义变量 b ,赋值为 a
A *c = &a; // 定义指针 c,指向 a
printf("%d, %d, %d\n", a.i, b.i, c->i);
// 输出:1, 1, 1
//-----2-------
b.i = 2; //修改 b 中的变量
printf("%d, %d, %d\n", a.i, b.i, c->i);
// 输出:1, 2, 1
//-----3-------
c->i = 3; //修改 c 中的变量
printf("%d, %d, %d\n", a.i, b.i, c->i);
// 输出:3, 2, 3
//-----4-------
// 打印地址
printf("%d, %d, %d\n", &a, &b, c);
// 输出:-1861360224, -1861360208, -1861360224
return 0;
}
上面的例子,定义了一个变量 a
,然后将 a
分别赋值给普通变量 b
和指针变量 c
。
第一次,打印三个变量中的成员变量的 i
的值都为 1
;
第二次,修改了 b
中的 i
,结果只修改了 b
的值,对 a
和 c
都没有影响;
第三次,修改了 c
中的 i
,结果修改了 a
和 c
的值,对 b
都没有影响;
最后,打印了三个变量的地址,可以发现 a
和 c
的值是一样的,b
的地址不一样。
从这个例子就可以看出端倪了:
通过
普通变量
赋值的时候,系统创建了一个新的独立的内存块,如b
,对b
的修改,只影响其本身;
通过
指针变量
赋值时,系统没有创建新的内存块,而是将指针指向了已存在的内存块,如c
, 任何对c
的修改,都将影响原来的变量,如a
。
还有一点需要注意的是,指针变量
对成员变量的引用,使用的是箭头符号 ->
,如 c->i
;普通变量对成员变量的引用,使用的是点符号 .
,如 b.i
。
2) new 和 delete
在上面的例子中,是通过创建了一个变量 a
,然后将 指针变量 c
指向了 a
的方式定义了 c
。还有另外一种方法,可以声明和定义一个指针变量,那就是通过 new
动态创建。
class A {
public:
int i;
}
int main() {
A *a = new A();
a->i = 0;
printf("%d\n", a->i);
// 输出: 0
// 删除指针变量,回收内存
delete a;
return 0;
}
这就是动态创建指针变量的方式,这是 C++
常用的方式。
重要提醒:
要注意的是,通过
new
的方式创建的指针变量和不通过new
创建的变量最大的区别在于:通过new
创建的指针需要我们自己手动回收内存,否则将会导致内存泄漏。回收内存则是通过delete
关键字进行的。
也就是说,
new
和delete
必须要成对调用。
int main() {
A a = A(); // 无new,main 函数结束后,系统会自动回收内存
A *b = new A(); // new 方式创建,系统不会自动回收内存,要手动 delete
delete b; // 手动删除,回收内存
return 0;
}
可以看到,C++
的指针变量其实更接近与 Java
中普通变量的使用方式。
四、C++ 引用
引用
是除了指针外,另一个非常重要的概念。在 C++
也是经常使用的。
引用指的是:为一个变量起一个别名,也就是说,它是某个已存在变量的另一个名字。
引用和指针非常的相似,初学者非常容易把这两者混淆了。
引用的声明和定义
首先来看下如何声明一个引用变量。
// 声明一个普通变量 i
int i = 0;
// 声明定义一个引用 j
int &j = i;
j = 1;
printf("%d, %d\n", i, j)
// 输出:1, 1
是不是有点熟悉,又是与符号 &
,但是这里并非表示取址,这里只是作为一个标示符号。
请记住,千万不要和取址符号混淆,取址表示方式是:A *p = &a;
在上面的例子中,修改了 j
的值,i
的值也发生了变化。这和指针是不是非常像?
那么,引用和指针有什么不一样呢?
i. 不存在空引用。引用必须连接到一块合法的内存。
ii. 一旦引用被初始化为一个对象,就不能被指向到另一个对象。指针可以在任何时候指向到另一个对象。
iii. 引用必须在创建时被初始化。指针可以在任何时间被初始化。
i 和 iii 都很好理解,就是声明引用的时候,必须要初始化好,并且不能初始化为空 NULL
。
ii 是最让人不理解的,什么叫做 “不能被指向到另一个对象” ?
引用和指针的区别
看以下的例子:
int i = 0;
// 定义引用 j ,指向 i
int &j = i;
int k = 1;
// 这个操作是指向另外一个对象吗?
j = k;
printf("%d, %d, %d\n", i, j, k);
// 输出:1, 1, 1
// 打印地址
printf("%d, %d, %d\n", &i, &j, &k);
// 输出:-977299952, -977299952, -977299948
可以看到,i
j
k
三个的值都变成了 1
,这看起来和指针是一样的效果,但却有质的区别。
看最后一个打印输出,i
和 j
的地址始终是一样的,和 k
是不一样的。也就是说, j
始终指向 i
,不可改变。 j = k
只是把 k
的值给到了 j
,同时也改变了 i
。
如果还不懂,再来看一下指针的例子,你就明白了。
int i = 0;
// 定义指针 j ,指向 i
int *j = &i;
int k = 1;
// 指向另一个对象
j = &k;
printf("%d, %d, %d\n", i, *j, k);
// 输出:0, 1, 1
// 打印地址
printf("%d, %d, %d\n", &i, j, &k);
// 输出:-1790365184, -1790365180, -1790365180
看到了吗? j
在赋值了 &k
以后,地址就变成和 k
一样了,也就是说,指针 j
可以指向不同的对象。这时候, j
和 i
就没有任何关系了,i
的值也不会随着 j
改变而改变。
如何使用引用
引用最常出现的地方是作为函数的参数使用。
void change(int &i, int &j) {
int temp = i;
i = j;
j = temp;
}
int main() {
int i = 0;
int j = 1;
// 打印地址
printf("[before: %d, %d]\n", &i, &j);
//输出:[before: -224237816, -224237812]
change(i, j);
printf("[i: %d, j: %d]\n", i, j);
// 输出:i: 1, j: 0
// 打印地址
printf("[after: %d, %d]\n", &i, &j);
// 输出:after: -224237816, -224237812
return 0;
}
在上面的例子中,change
方法的两个参数都是引用,和普通的参数有以下两个区别:
i. 引用参数不会创建新的内存块,参数只是对外部传进来的变量的一个引用。
ii. 引用参数可以改变外部变量的值。
这是普通变量的情况:
void change(int i, int j) {
int temp = i;
i = j;
j = temp;
// 打印地址
pritf("[change: %d, %d]\n", &i, &j);
// 输出[change: -1136723044, -1136723048]
}
int main() {
int i = 0;
int j = 1;
// 打印地址
printf("[before: %d, %d]\n", &i, &j);
//输出:[before: -224237816, -224237812]
change(i, j);
printf("[i: %d, j: %d]\n", i, j);
// 输出:i: 0, j: 1
// 打印地址
printf("[after: %d, %d]\n", &i, &j);
// 输出:after: -224237816, -224237812
return 0;
}
可以看到,i
j
的值不会被改不变,原因是 change
方法创建了两个临时的局部变量,都有自己的内存块,这个变量的地址和外部传进来的变量是没有关系的,所以无法改变外部变量的值。
到这里,就可以看到参数引用的好处了:引用参数为我们节省了内存,执行效率也更快。
同样的,指针参数也有类似的效果,但是其仍然和引用有着本质的区别。引用为我们提供另一个种很好的传参选择。
有时候,我们并不想让函数内部改变外部变量的值,可以给参数加上常量的标志。
void change(const int &i, const int &j) {
int temp = i;
i = j; // 不允许修改i,编译出错
j = temp; // 不允许修改j,编译出错
}
五、C++ 多态和虚函数
多态
是面向对象的三大特点之一。
C++
的多态和 Java
非常相似,但是也有着明显的不同。
静态绑定
看下面一个例子:
class A {
public:
void f() {
printf("a\n");
};
};
class B : public A {
public:
void f() {
printf("b\n");
};
};
int main() {
A *a = new B();
a->f();
// 输出:a
return 0;
}
这里 B
继承了 A
,并重写了方法 f
。
在 main
函数中,定义了一个基类变量指针 a
,并指向子类 B
。接着调用了 a
的方法 f
。
如果是 Java
中类似的操作的话,那么毫无疑问,此处会输出 b
,可是这里却输出了 a
。也就是说,这里方法 f
实际上是基类 A
的 f
方法。
这就是 C++
和 Java
其中一个很大的不同。
原因是,调用函数 f() 被编译器设置为基类中的版本,这就是所谓的静态多态,或静态链接。
函数调用在程序执行前就准备好了。有时候这也被称为早绑定,因为 f() 函数在程序编译期间就已经设置好了。
那么如果想实现类似 Java
中的多态重载呢?
虚函数
virtual
是 C++
中的一个关键字,用于声明函数,表示虚函数。用于告诉编译器不要静态链接到该函数,改为动态链接。
依然是上面的例子,在 A
的 f
函数上加上 virtual
,将得到类似 Java
的效果:
class A {
public:
virtual void f() {
printf("a\n");
};
};
class B : public A {
public:
void f() {
printf("b\n");
};
};
int main() {
A *a = new B();
a->f();
// 输出:b
return 0;
}
纯虚函数
在 Java
中,我们经常会使用 interface
或 abstract
来定义一些接口,方便代码规范和拓展,但是在 C++
没有这样的方法,但是可以有类似的实现,那就是:纯虚函数。
class A {
public:
// 声明一个纯虚函数
virtual void f() = 0;
}
class B : public A {
public:
// 子类必须实现 f ,否则编译不通过
void f() {
printf("b\n");
};
};
int main() {
A *a = new B();
a->f();
// 输出:b
return 0;
}
A
中的 virtual void f() = 0;
就是一个纯虚函数。如果继承 A
,子类必须实现 f
这个接口,否则编译不通过。
A
则是一个抽象类。不能被直接定义使用。
六、C++ 预处理
在 C++
中有一个方法,可以让我们在程序编译前,对代码做一些处理,称为预处理。这是 Java
中没有的,在 C++
中却经常使用到。
预处理是一些指令,但是这些指令并不是 C++
语句,所以不需要以分号 ;
结束。
所有的预处理语句都是以井号 #
开始的。
比如 #include
就是一个预处理,用于将其他文件导入到一个另一个文件中,类似 Java
的 import
。
例如导入头文件:
// A.h
class A{
public:
A();
~A();
}
#include "A.h"
A::A() {
}
A::~A() {
}
在 C++
中常用的预处理有以下几个 #include
、 #define
、#if
、#else
、 #ifdef
、 #endif
等。
宏定义
最常用的一个预处理语句 #define
,通常称为宏定义。
其形式为:
#define name replacement-text
#define PI 3.14159
printf("PI = %f", PI);
// 在编译之前,上面的语句被展开为:
// printf("PI = %f", 3.14159);
- 带参数宏定义
#define SUM(a,b) (a + b)
printf("a + b = %d", SUM(1, 2));
// 在编译之前,上面的语句被展开为:
// printf("a + b = %d", 1 + 2);
// 输出:a + b = 3
-
#
和##
运算符
在宏定义中,#
用于将参数 字符串化
。
#define MKSTR( x ) #x
printf(MKSTR(Hello C++));
// 在编译之前,上面的语句被展开为:
// printf("Hello C++");
// 输出: Hello C++
在宏定义中,##
用于将参数 连接起来
。
#define CONCAT(a, b) a ## b
int xy = 100;
printf("xy = %d", CONCAT(x, y));
// 在编译之前,上面的语句被展开为:
// printf("xy = %d", xy);
// 输出:xy = 100
注意:#
、 ##
在多个宏定义嵌套使用的时候,会导致不展开的问题
例如:
#define CONCAT(x, y) x ## y
#define A a
#define B b
void mian() {
char *ab = "ab";
char *AB = "AB";
printf("AB = %s", CONCAT(A, B));
// 在编译之前,上面的语句被展开为:
// printf("AB = %s", AB);
}
虽然定义了 A
B
两个宏定义,但是在 CONCAT
中遇到 ##
的时候,A
B
这两个宏定义是不会开展的,而是直接当作两个参数被连接起来了。
那么要如何解决这个问题呢?那就是再转接一层。
#define _CONCAT(x, y) x ## y
#define CONCAT(x, y) _CONCAT(x, y)
#define A a
#define B b
void mian() {
char *ab = "ab";
char *AB = "AB";
printf("AB = %s", CONCAT(A, B));
// 在编译之前,上面的语句被展开为:
// printf("AB = %s", _CONCAT(a, b));
// printf("AB = %s", ab);
// 输出:AB = ab
}
条件编译
#if
、#else
、 #ifdef
、 #endif
这几个的组合主要用条件编译。
在 C++
中条件编译也是经常使用到的,可以用来控制哪些代码参与编译,哪些不参与编译。
#define DEBUG
int main() {
#ifdef DEBUG
// 参与编译
printf("I am DEBUG\n");
#else
// 不参与编译
printf("No DEBUG\n");
#endif
return 0;
}
// 输出:I am DEBUG
以上代码,由于先前已经定义了 #define DEBUG
所以 #ifdef DEBUG
为 true
,编译 printf("I am DEBUG\n");
。
如果去掉 #define DEBUG
,则编译 printf("No DEBUG\n");
。
int main() {
#if 0
// 这里面的代码都被注释掉,不参与编译
printf("I am not compiled\n");
#endif
return 0;
}
七、总结
以上,基本就是在 C++
经常使用到的,与 Java
相似,又存在差异的一些基础知识,由于面向对象语言都存在一定的相似性,相信有了以上的基础之后,你就可以比较通畅地阅读一些 C++
代码了。
如果你是一个 Java
程序员,可能对其中的一些知识还是会感到迷惑,这时候需要你抛弃 Java
中的一些惯有思维,重新细细品尝一下 C++
的味道,可以实际的去敲一下代码来消化这些知识,只有实践才能出真知。