scala的数据结构——集
2017-06-21 本文已影响45人
ppmoon
scala当中的集是不重复元素的集合,集不会对元素进行排序,而且是以“哈希”方法对元素进行组织,所以使用集合的时候可以更快的查找元素。
什么是“哈希”
这里稍微解释一下,哈希是怎么一回事。
假设有一万张照片,我有这一万张照片其中一张的照片副本,我想在这一万张照片当中找到和我手里副本一样的照片应该怎么办?
常规的解决办法是一张照片一张照片的对比,但是照片的数据比较大,挨个对比速度很慢,这时候我们就可以使用hash的办法。我们将每一张照片的文件字节作为hash值,(假设每张照片的字节数是不一样的),用我手中照片副本的hash值以纯数字的方式在一万张照片当中对比,去寻找那张相同的照片,这样查询速度就会比原来对比数据更快。
scala的不可变集
scala> var mySet = Set("Hadoop","Spark")
mySet: scala.collection.immutable.Set[String] = Set(Hadoop, Spark)
scala> mySet += "Scala"
scala> println(mySet.contains("Scala"))
true
这里需要注意如果使用val来声明不可变集,那么不可以使用 +=的方法向集合当中添加数据,因为不可变嘛,用var方法却改变了set的可变特性。这个地方稍微有点绕
不可添加数据因为 += 不是scala.collection.immutable.Set的成员。
scala的可变集
如果我们想使用val创建一个可变集,那么就需要引入 scala.collection.immutable.Set。
scala> import scala.collection.mutable.Set
import scala.collection.mutable.Set
scala> val mybb = Set("d","b")
mybb: scala.collection.mutable.Set[String] = Set(d, b)
scala> mybb += "c"
res3: mybb.type = Set(c, d, b)
scala> println(mybb)
Set(c, d, b)
总结
虽然可变集和不可变集都有添加或删除元素的操作,但是,二者有很大的区别。对不可变集进行操作,会产生一个新的集,原来的集并不会发生变化。 而对可变集进行操作,改变的是该集本身。