STL（一）vector、set/multiset、list

2017-08-29 本文已影响90人第八区

Vector

动态数据，可以随机访问。末尾添加和删除的效率高。元素的顺序和推入的顺序一致。

基本函数

push_back 数组最后添加一个元素。如果是对象会执行对象的拷贝构造函数
pop_back 去掉数组最后一个元素
at 根据下标得到数据的引用，可以当左值。越界会抛异常
[] 可以使用[]操作符，得到结果可以当左值。越界不会抛异常
begin 得到数组头的指针iterator
end 得到数组的最后一个单元+1的指针 iterator
front 数组首元素的引用
back 数组尾元素的引用
size 数组大小
earse 删除参数为iterator
insert 指定位置插入元素
empty 判断空

遍历

迭代器方式

void printV(vector<int>& v) {
    for (vector<int>::iterator it = v.begin(); it != v.end(); it++) {
        cout << *it << "  ";
    }
    cout << endl;
}

删除

vector<int>::iterator it = v.begin();
v.erase(v.begin(), v.end() - 1);

案例

void test() {
    vector<Student> v;
    Student stu1(1, "first");
    Student stu2(2, "second");
    Student stu3(3, "third");
    v.push_back(stu1);
    cout << "------------" << endl;
    v.push_back(stu2);
    cout << "------------" << endl;
    vector<Student>::iterator it = v.begin();
    v.insert(it, stu3);
    cout << "------------" << endl;
    printStud(v);
}

运行结果：

insert.png

Set

vector封装数组，list封装了链表，map和set封装了二叉树等。set关联式容器。set作为一个容器也是用来存储同一数据类型的数据类型，并且能从一个数据集合中取出数据，在set中每个元素的值都唯一，而且系统能根据元素的值自动进行排序。应该注意的是set中数元素的值不能直接被改变。C++ STL中标准关联容器set, multiset, map, multimap内部采用的就是一种非常高效的平衡检索二叉树：红黑树，也成为RB树(Red-Black Tree)。RB树的统计性能要好于一般平衡二叉树，所以被STL选择作为了关联容器的内部结构。set插入是按照一定规则排序，默认是由小到大。

为何map和set的插入删除效率比用其他序列容器高？

对于关联容器来说，不需要做内存拷贝和内存移动。说对了，确实如此。set容器内所有元素都是以节点的方式来存储，其节点结构和链表差不多，指向父节点和子节点。

为何每次insert之后，以前保存的iterator不会失效？

iterator这里就相当于指向元素的指针，元素的内存没有变，指向内存的指针当然也不会失效，当然这里排除元素被删除的情况。相对于vector,每一次删除和插入，指针都可能失效。所以一定要记住，不要使用过期的iterator

  set<int> s;
  s.insert(3);
  set<int>::iterator it1 = s.begin();
  cout << *it1 << endl;
  s.insert(1);
  //虽然插入1后，1在3的前面。但是it1指向的元素的内存。而set内所有的元素以节点
  //方式存储，节点结构合链表差不多，插入和删除元素不需要做内存的移动，只需节点做
  //变换即可
  //牢记这个原则：不要使用过期的iterator。
  cout << *it1 << endl;
  s.insert(2);

这里档次打印的it1结果都是3.

当数据元素增多时，set的插入和搜索速度变化如何？

set中查找是使用二分查找，也就是说，如果有16个元素，最多需要比较4次就能找到结果，有32个元素，最多比较5次。

测试案例一

#include "iostream"
using namespace std;
#include "set"
#include "vector"
//迭代器遍历
void print(set<int>& s) {
    for (set<int>::iterator it = s.begin(); it != s.end(); it++) {
        cout << *it <<" ";
    }
    cout << endl;
}
int main()
{
    cout << "---------插入----------" << endl;
    set<int> s;
    s.insert(3);
    set<int>::iterator it1 = s.begin();
    cout << *it1 << endl;
    s.insert(1);
    //虽然插入1后，1在3的前面。但是it1指向的元素的内存。而set内所有的元素以节点
    //方式存储，节点结构合链表差不多，插入和删除元素不需要做内存的移动，只需节点做
    //变换即可
    //牢记这个原则：不要使用过期的iterator。
    cout << *it1 << endl;
    s.insert(2);
    s.insert(5);
    s.insert(6);
    print(s);
    cout << "---------equal_range----------" << endl;
    pair<set<int>::iterator, set<int>::iterator> p1=s.equal_range(4);
    if (p1.first != s.end()) {
        cout <<">=4 is "<< *p1.first << endl;
    }
    if (p1.second != s.end()) {
        cout << ">4 is " << *p1.second << endl;
    }
    set<int>::iterator it = s.begin();
    //不可以随机访问，关联型数据结构。红黑二叉树
    //it=it+4;
    cout << "---------erase----------" << endl;
    s.erase(it);
    print(s);
    cout << "---------insert及其返回值----------" << endl;
    pair<set<int>::iterator, bool> p2=s.insert(7);
    if (p2.second) {
        cout <<"insert success"<< *p2.first << endl;
    }
    print(s);
    cout << "---------lower_bound、upper_bound----------" << endl;
    //lower_bound是>=值的最小指针  upper_bound是>值的最小指针
    cout << *s.lower_bound(5) << " " << *s.upper_bound(5) << endl;
    return 0;
}

结果：

set_test1.png

测试案例二

#include "string"
#include "iostream"
#include "set"
using namespace std;
class Student {
private:
    string name;
    int number;
public:
    Student(int number, string name) {
        cout << "构造" << number << endl;
        this->number = number;
        this->name = name;
    }
    Student(const Student& student) {
        this->number = student.getNumber();
        this->name = student.getName();
    }

    void print()const {
        cout << this->number << " "<<this->name << endl;
    }

    string getName()const {
        return this->name;
    }

    int getNumber()const  {
        return this->number;
    }
};
//函数对象
struct StuCmp{
    bool operator()(const Student &first,const Student& second) {
        return first.getNumber() > second.getNumber();
    }
};

//遍历
void print(set<Student, StuCmp>& s) {
    for (set<Student, StuCmp>::iterator it = s.begin(); it != s.end(); it++) {
        it->print();
    }
}
int main()
{
    set<Student, StuCmp> set;
    Student stu1(3, "third");
    Student stu2(1, "first");
    Student stu3(2, "second");
    set.insert(stu1);
    set.insert(stu2);
    set.insert(stu3);
    print(set);
    return 0;
}

结果：

set_test2.png

multiset

set集合中一个值只能出现一次，而multiset集合中一个值可以出现多次。

set::insert(key)的返回值是一个pair<iterator, bool>，其中pair中的bool成员表明了key被插入之前，set中是否已存在相同的key。根据我在VS2010上的实验结果，如果set中已经存在相同key的元素，那么插入操作是会失败的，新的元素不会被插进去。而multiset::insert的返回值只是一个iterator，插入操作总是会成功的。
multiset::count(key)的返回值可能大于1。
multiset::size()的返回值是多重集合的势（cardinality），即multiset中元素的个数，而不是值的个数。比如，{1, 1, 2}的size是3，而不是2。
multiset::erase(key)会将对应的key全部删掉，所以对{1, 1, 2}调用erase(1)之后，它就变成了{2}。
只要key存在于集合中，set::equal_range(key)的返回值pair<iterator1, iterator2>总是会有++iterator1 == iterator2。但是对multiset来说就不一定了。
如果使用自定义类型，则需要在构造时候传入函数对象或者在自定义类型中重载<操作符。注意：函数要加const限定符。

什么时候需要用multiset？当然是需要用set，但是又允许重复key存在的时候了。什么时候用set？我的答案是：需要随时往容器中插入元素，随时对元素进行快速查找，又需要按某种顺序对元素进行遍历的时候

示例

int main() {
    multiset<Student, StuCmp> s;
    Student stu1(3, "third");
    Student stu2(1, "first");
    Student stu3(2, "second");
    Student stu4(2, "second_2");
    s.insert(stu1);
    s.insert(stu2);
    multiset<Student,StuCmp>::iterator res= s.insert(stu3);
    cout << "--------插入结果---------" << endl;
    res->print();
    res= s.insert(stu4);
    cout << "--------插入结果---------" << endl;
    res->print();
    cout << "--------遍历---------" << endl;
    print(s);
    Student stu5(2, "second_3");
    cout << "--------count方法---------" << endl;
    cout << "count(5)=" << s.count(stu5) << endl;;
    return 0;
}

这里的Student和StuCmp沿用Set中的定义。编译后发现出错:

multi_set_error.png

发现是StuCmp的问题，函数的const修饰符漏了。修改后

struct StuCmp{
    bool operator()(const Student &first,const Student& second) const{
        return first.getNumber() > second.getNumber();
    }
};

运行结果：

multi_set_test3.png

list

list是一个线性双向链表结构，它的数据由若干个节点构成，每一个节点都包括一个信息块（即实际存储的数据）、一个前驱指针和一个后驱指针。它无需分配指定的内存大小且可以任意伸缩，这是因为它存储在非连续的内存空间中，并且由指针将有序的元素链接起来。由于其结构的原因，list 随机检索的性能非常的不好，因为它不像vector 那样直接找到元素的地址，而是要从头一个一个的顺序查找，这样目标元素越靠后，它的检索时间就越长。检索时间与目标元素的位置成正比。虽然随机检索的速度不够快，但是它可以迅速地在任何节点进行插入和删除操作。因为list 的每个节点保存着它在链表中的位置，插入或删除一个元素仅对最多三个元素有所影响，不像vector 会对操作点之后的所有元素的存储地址都有所影响，这一点是vector 不可比拟的。

不使用连续的内存空间这样可以随意地进行动态操作
可以在内部任何位置快速地插入或删除，当然也可以在两端进行push 和pop
不能进行内部的随机访问，即不支持[ ] 操作符和vector.at()
相对于verctor 占用更多的内存

示例

void print(list<Student> l) {
    for (list<Student>::iterator it = l.begin(); it != l.end(); it++) {
        it->print();
    }
}
struct PrintStu{
    bool operator()(const Student& stu)const  {
        stu.print();
        return true;
    }
};
int main()
{
    list<Student> l;
    Student stu1(1, "first");
    Student stu2(2, "second");
    Student stu3(3, "third");
    Student stu4(4, "fourth");
    l.push_back(stu1);
    l.push_front(stu2);
    l.push_back(stu3);
    l.push_front(stu4);
    print(l);
    cout << "---pop_back、pop_front-------" << endl;
    Student s=l.back();
    s.print();
    l.pop_back();
    s = l.front();
    s.print();
    l.pop_front();
    cout << "----for_each------" << endl;
    for_each(l.begin(), l.end(), PrintStu());
    return 0;
}

结果：

list.png
这里使用了for_each函数算法。需要引入#include<algorithm>头文件