python的竞争者scala,谁更适合大数据
在浏览spark的官网时,机缘巧合的我看到这这样一张图
这其中出现了三个熟悉的身影,Java、Scala、python,作为最近热门讨论的语言,那python和scala在大数据的竞争中到底谁更胜一筹呢?虽然python因为其“胶水”特性,被更多的使用和讨论,但是scala也真的不要小瞧他,他在spark的支撑下,真的也是一门强大的语言,来看一下scala的神秘色彩吧
Scala介绍
1.Spark中使用的是Sacla2.10。
2.Scala官网6个特征。
1).Java和scala可以混编
2).类型推测(自动推测类型)
3).并发和分布式(Actor)
4).特质,特征(类似java中interfaces 和 abstract结合)
5).模式匹配(类似java switch)
6).高阶函数
Scala安装使用
1. windows安装,配置环境变量
Ø 官网下载scala2.10:http://www.scala-lang.org/download/2.10.4.html
Ø 下载好后安装。双击msi包安装,记住安装的路径。
Ø 配置环境变量(和配置jdk一样)
l 新建SCALA_HOME
l 上个步骤完成后,编辑Path变量,在后面追加如下:
;%SCALA_HOME%\bin;%SCALA_HOME%\jre\bin
Ø 打开cmd,输入:scala - version 看是否显示版本号,确定是否安装成功
2. eclipse 配置scala插件
Ø 下载插件(一定要对应eclipse版本下载)
http://scala-ide.org/download/prev-stable.html
Ø 下载好zip包后,解压如下:
Ø 将features和plugins两个文件夹拷贝到eclipse安装目录中的” dropins/scala”目录下。进入dropins,新建scala文件夹,将两个文件夹拷贝到“dropins/scala”下
3. scala ide
下载网址:http://scala-ide.org/download/sdk.html
4. idea 中配置scala插件
Ø 打开idea,close项目后,点击Configure->Plugins
Ø 搜索scala,点击Install安装
Ø 设置jdk,打开Project Structure,点击new 选择安装好的jdk路径
Ø 创建scala项目,配置scala sdk(Software Development Kit)
点击第三步,弹出选择SDK,点击Browse选择本地安装的Scala目录。选择system.
需要scala以及大数据更多资料的,可以私信“资料”联系博主获取
Scala基础
1. 数据类型
2. 变量和常量的声明
Ø 定义变量或者常量的时候,也可以写上返回的类型,一般省略,如:val a:Int = 10
Ø 常量不可再赋值
/**
* 定义变量和常量
* 变量 :用 var 定义 ,可修改
* 常量 :用 val 定义,不可修改
*/
var name = "zhangsan"
println(name)
name ="lisi"
println(name)
val gender = "m"
// gender = "m"//错误,不能给常量再赋值
3. 类和对象
Ø 创建类
class Person{
val name = "zhangsan"
val age = 18
def sayName() = {
"my name is "+ name
}
}
Ø 创建对象
object Lesson_Class {
def main(args: Array[String]): Unit = {
val person = new Person()
println(person.age);
println(person.sayName())
}
}
Ø 伴生类和伴生对象
class Person(xname :String , xage :Int){
var name = Person.name
val age = xage
var gender = "m"
def this(name:String,age:Int,g:String){
this(name,age)
gender = g
}
def sayName() = {
"my name is "+ name
}
}
object Person {
val name = "zhangsanfeng"
def main(args: Array[String]): Unit = {
val person = new Person("wagnwu",10,"f")
println(person.age);
println(person.sayName())
println(person.gender)
}
}
注意点:
l 建议类名首字母大写 ,方法首字母小写,类和方法命名建议符合驼峰命名法。
l scala 中的object是单例对象,相当于java中的工具类,可以看成是定义静态的方法的类。object不可以传参数。另:Trait不可以传参数
l scala中的class类默认可以传参数,默认的传参数就是默认的构造函数。
重写构造函数的时候,必须要调用默认的构造函数。
l class 类属性自带getter ,setter方法。
l 使用object时,不用new,使用class时要new ,并且new的时候,class中除了方法不执行,其他都执行。
l 如果在同一个文件中,object对象和class类的名称相同,则这个对象就是这个类的伴生对象,这个类就是这个对象的伴生类。可以互相访问私有变量。
4. if else
/**
* if else
*/
val age =18
if (age < 18 ){
println("no allow")
}else if (18<=age&&age<=20){
println("allow with other")
}else{
println("allow self")
}
5. for ,while,do…while
1. to和until 的用法(不带步长,带步长区别)
/**
* to和until
* 例:
* 1 to 10 返回1到10的Range数组,包含10
* 1 until 10 返回1到10 Range数组 ,不包含10
*/
println(1 to 10 )//打印 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
println(1.to(10))//与上面等价,打印 1, 2, 3, 4, 5, 6, 7, 8, 9, 10
println(1 to (10 ,2))//步长为2,从1开始打印 ,1,3,5,7,9
println(1.to(10, 2))
println(1 until 10 ) //不包含最后一个数,打印 1,2,3,4,5,6,7,8,9
println(1.until(10))//与上面等价
println(1 until (10 ,3 ))//步长为2,从1开始打印,打印1,4,7
2. 创建for循环
/**
* for 循环
*
*/
for( i <- 1 to 10 ){
println(i)
}
3. 创建多层for循环
//可以分号隔开,写入多个list赋值的变量,构成多层for循环
//scala中 不能写count++ count-- 只能写count+
var count = 0;
for(i <- 1 to 10; j <- 1 until 10){
println("i="+ i +", j="+j)
count += 1
}
println(count);
//例子: 打印小九九
for(i <- 1 until 10 ;j <- 1 until 10){
if(i>=j){
print(i +" * " + j + " = "+ i*j+" ")
}
if(i==j ){
println()
}
}
4. for循环中可以加条件判断,分号隔开
//可以在for循环中加入条件判断
for(i<- 1 to 10 ;if (i%2) == 0 ;if (i == 4) ){
println(i)
}
5. scala中不能使用count++,count—只能使用count = count+1 ,count += 1
6. for循环用yield 关键字返回一个集合
7. while循环,while(){},do {}while()
//将for中的符合条件的元素通过yield关键字返回成一个集合
val list = for(i <- 1 to 10 ; if(i > 5 )) yield i
for( w <- list ){
println(w)
}
/**
* while 循环
*/
var index = 0
while(index < 100 ){
println("第"+index+"次while 循环")
index += 1
}
index = 0
do{
index +=1
println("第"+index+"次do while 循环")
}while(index <100 )