大数据

python的竞争者scala,谁更适合大数据

2020-03-24  本文已影响0人  8829e55b8216

在浏览spark的官网时,机缘巧合的我看到这这样一张图

这其中出现了三个熟悉的身影,Java、Scala、python,作为最近热门讨论的语言,那python和scala在大数据的竞争中到底谁更胜一筹呢?虽然python因为其“胶水”特性,被更多的使用和讨论,但是scala也真的不要小瞧他,他在spark的支撑下,真的也是一门强大的语言,来看一下scala的神秘色彩吧

Scala介绍

1.Spark中使用的是Sacla2.10。

2.Scala官网6个特征。

1).Java和scala可以混编

2).类型推测(自动推测类型)

3).并发和分布式(Actor)

4).特质,特征(类似java中interfaces 和 abstract结合)

5).模式匹配(类似java switch)

6).高阶函数

Scala安装使用

1. windows安装,配置环境变量

Ø 官网下载scala2.10:http://www.scala-lang.org/download/2.10.4.html

Ø 下载好后安装。双击msi包安装,记住安装的路径。

Ø 配置环境变量(和配置jdk一样)

l 新建SCALA_HOME

l 上个步骤完成后,编辑Path变量,在后面追加如下:

;%SCALA_HOME%\bin;%SCALA_HOME%\jre\bin

Ø 打开cmd,输入:scala - version 看是否显示版本号,确定是否安装成功

2. eclipse 配置scala插件

Ø 下载插件(一定要对应eclipse版本下载)

http://scala-ide.org/download/prev-stable.html

Ø 下载好zip包后,解压如下:

Ø 将features和plugins两个文件夹拷贝到eclipse安装目录中的” dropins/scala”目录下。进入dropins,新建scala文件夹,将两个文件夹拷贝到“dropins/scala”下

3. scala ide

下载网址:http://scala-ide.org/download/sdk.html

4. idea 中配置scala插件

Ø 打开idea,close项目后,点击Configure->Plugins

Ø 搜索scala,点击Install安装

Ø 设置jdk,打开Project Structure,点击new 选择安装好的jdk路径

Ø 创建scala项目,配置scala sdk(Software Development Kit)

点击第三步,弹出选择SDK,点击Browse选择本地安装的Scala目录。选择system.

需要scala以及大数据更多资料的,可以私信“资料”联系博主获取

Scala基础

1. 数据类型

2. 变量和常量的声明

Ø 定义变量或者常量的时候,也可以写上返回的类型,一般省略,如:val a:Int = 10

Ø 常量不可再赋值

/**

* 定义变量和常量

* 变量 :用 var 定义 ,可修改

* 常量 :用 val 定义,不可修改

*/

var name = "zhangsan"

println(name)

name ="lisi"

println(name)

val gender = "m"

// gender = "m"//错误,不能给常量再赋值

3. 类和对象

Ø 创建类

class Person{

val name = "zhangsan"

val age = 18

def sayName() = {

"my name is "+ name

}

}

Ø 创建对象

object Lesson_Class {

def main(args: Array[String]): Unit = {

val person = new Person()

println(person.age);

println(person.sayName())

}

}

Ø 伴生类和伴生对象

class Person(xname :String , xage :Int){

var name = Person.name

val age = xage

var gender = "m"

def this(name:String,age:Int,g:String){

this(name,age)

gender = g

}

def sayName() = {

"my name is "+ name

}

}

object Person {

val name = "zhangsanfeng"

def main(args: Array[String]): Unit = {

val person = new Person("wagnwu",10,"f")

println(person.age);

println(person.sayName())

println(person.gender)

}

}

注意点:

l 建议类名首字母大写 ,方法首字母小写,类和方法命名建议符合驼峰命名法。

l scala 中的object是单例对象,相当于java中的工具类,可以看成是定义静态的方法的类。object不可以传参数。另:Trait不可以传参数

l scala中的class类默认可以传参数,默认的传参数就是默认的构造函数。

重写构造函数的时候,必须要调用默认的构造函数。

l class 类属性自带getter ,setter方法。

l 使用object时,不用new,使用class时要new ,并且new的时候,class中除了方法不执行,其他都执行。

l 如果在同一个文件中,object对象和class类的名称相同,则这个对象就是这个类的伴生对象,这个类就是这个对象的伴生类。可以互相访问私有变量。

4. if else

/**

* if else

*/

val age =18

if (age < 18 ){

println("no allow")

}else if (18<=age&&age<=20){

println("allow with other")

}else{

println("allow self")

}

5. for ,while,do…while

1. to和until 的用法(不带步长,带步长区别)

/**

* to和until

* 例:

* 1 to 10 返回1到10的Range数组,包含10

* 1 until 10 返回1到10 Range数组 ,不包含10

*/

println(1 to 10 )//打印 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

println(1.to(10))//与上面等价,打印 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

println(1 to (10 ,2))//步长为2,从1开始打印 ,1,3,5,7,9

println(1.to(10, 2))

println(1 until 10 ) //不包含最后一个数,打印 1,2,3,4,5,6,7,8,9

println(1.until(10))//与上面等价

println(1 until (10 ,3 ))//步长为2,从1开始打印,打印1,4,7

2. 创建for循环

/**

* for 循环

*

*/

for( i <- 1 to 10 ){

println(i)

}

3. 创建多层for循环

//可以分号隔开,写入多个list赋值的变量,构成多层for循环

//scala中 不能写count++ count-- 只能写count+

var count = 0;

for(i <- 1 to 10; j <- 1 until 10){

println("i="+ i +", j="+j)

count += 1

}

println(count);

//例子: 打印小九九

for(i <- 1 until 10 ;j <- 1 until 10){

if(i>=j){

print(i +" * " + j + " = "+ i*j+" ")

}

if(i==j ){

println()

}

}

4. for循环中可以加条件判断,分号隔开

//可以在for循环中加入条件判断

for(i<- 1 to 10 ;if (i%2) == 0 ;if (i == 4) ){

println(i)

}

5. scala中不能使用count++,count—只能使用count = count+1 ,count += 1

6. for循环用yield 关键字返回一个集合

7. while循环,while(){},do {}while()

//将for中的符合条件的元素通过yield关键字返回成一个集合

val list = for(i <- 1 to 10 ; if(i > 5 )) yield i

for( w <- list ){

println(w)

}

/**

* while 循环

*/

var index = 0

while(index < 100 ){

println("第"+index+"次while 循环")

index += 1

}

index = 0

do{

index +=1

println("第"+index+"次do while 循环")

}while(index <100 )

上一篇下一篇

猜你喜欢

热点阅读