scala 通过 sql 读取数据的3种方法

张映发表于 2019-01-15

通过sql的方式，读取数据，根我们常用的关系型数据库差不多，更容易上手，当然没有updata和delete。

1，启动spark-shell

# spark-shell --master yarn
Setting default log level to "WARN".
To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel).
Spark context Web UI available at http://bigserver1:4040
Spark context available as 'sc' (master = yarn, app id = application_1547025808071_0015). //sc
Spark session available as 'spark'. //spark
Welcome to
 ____ __
 / __/__ ___ _____/ /__
 _\ \/ _ \/ _ `/ __/ '_/
 /___/ .__/\_,_/_/ /_/\_\ version 2.4.0
 /_/

Using Scala version 2.11.12 (OpenJDK 64-Bit Server VM, Java 1.8.0_191)
Type in expressions to have them evaluated.
Type :help for more information.

2，方法一

scala> val sqlDF = spark.sql("SELECT * FROM tanktest.test");
sqlDF: org.apache.spark.sql.DataFrame = [id: int, name: string]

scala> sqlDF.show();
+---+---------+
| id| name|
+---+---------+
| 1| tank|
| 2| zhang|
| 3| ying|
| 5|tanktest1|
| 6|tanktest2|
| 4| tanktest|
| 7| denggei|
+---+---------+

3，方法2

scala> val test = spark.sqlContext.sql("SELECT * FROM tanktest.test");
test: org.apache.spark.sql.DataFrame = [id: int, name: string]

scala> test.show();
+---+---------+
| id| name|
+---+---------+
| 1| tank|
| 2| zhang|
| 3| ying|
| 5|tanktest1|
| 6|tanktest2|
| 4| tanktest|
| 7| denggei|

4，方法3

scala> import org.apache.spark.sql.SQLContext
import org.apache.spark.sql.SQLContext

scala> val sqlContext = new org.apache.spark.sql.SQLContext(sc)
warning: there was one deprecation warning; re-run with -deprecation for details
sqlContext: org.apache.spark.sql.SQLContext = org.apache.spark.sql.SQLContext@4ac73165

scala> val df = sqlContext.sql("SELECT * FROM tanktest.test")
df: org.apache.spark.sql.DataFrame = [id: int, name: string]

scala> df.show();
+---+---------+
| id| name|
+---+---------+
| 1| tank|
| 2| zhang|
| 3| ying|
| 5|tanktest1|
| 6|tanktest2|
| 4| tanktest|
| 7| denggei|
+---+---------+

转载请注明
作者:海底苍鹰
地址:http://blog.51yip.com/hadoop/2043.html

留下评论

抱歉，发表回复评论您必须登录。

分类目录
- apache/nginx (36)
- cache (21)
- clickhouse (14)
- drupal (7)
- eclipse (8)
- elasticsearch (18)
- google (3)
- hadoop/spark/scala (96)
- html/css (12)
- java/android (14)
- linux (87)
- mariadb (2)
- mysql (74)
- nodejs/vue/js/jquery (72)
- nosql (39)
- oracle (9)
- pgsql (8)
- php (107)
- seo (16)
- shell (11)
- smarty (5)
- tidb (21)
- wordpress (13)
- 云计算 (22)
- 双眼看社会 (13)
- 技术其他 (41)
- 服务器相关 (136)
- 系统安全 (7)
最近文章
最近评论和留言
- banner 在 awk是命令还是编程语言上的评论
- lin 在 hadoop 查看 mr日志报错上的评论
- ccc 在 cdh hive 2.1.1 升级到 2.3.4 上的评论
- 简简单单在关于我上的评论
- www 在 clickhouse,tidb,mysql 读取速度对比上的评论
- zzq 在 mysql分表，分区的区别和联系上的评论
- Bill 在怎么在网上找到你要的信息上的评论
- 11 在留言板留言了
- Michael 在 canal 同步mysql数据到clickhouse 支持update delete truncate 上的评论
- 我兜里有糖在 linux postgresql 安装配置详解上的评论
登录
- 登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站

关于我

留言板

开发手册

linux命令

首页

scala 通过 sql 读取数据的3种方法

留下评论

分类目录

最近文章

最近评论和留言

登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站 关于我 留言板 开发手册 linux命令 首页

scala 通过 sql 读取数据的3种方法

留下评论

分类目录

最近文章

最近评论和留言

登录

赞助本站

关于我

留言板

开发手册

linux命令

首页