spark«海底苍鹰(tank)博客

spark sql derby 替换成 mysql

张映发表于 2019-01-09

分类目录： hadoop/spark/scala

hive和spark sql 默认用的都是derby，上篇文章说了，hive怎么使用mysql做为元数据库。

spark sql使用hive的配置来连接mysql，配置下来挺简单的，并且不需要启动hive

阅读全文>>

spark-sql 创建表插入数据

张映发表于 2019-01-07

分类目录： hadoop/spark/scala

spark-sql是spark的一个核心组件，可以实现简单的关系型数据库操作。

阅读全文>>

spark 创建 dataframe

张映发表于 2019-01-04

分类目录： hadoop/spark/scala

dataframe类似于关系型数据库的表，从dataframe中查询数据，需要调用api来实现，到目前为止spark支持的语言scala，java，r，python。

阅读全文>>

spark on yarn 安装配置

张映发表于 2019-01-02

分类目录： hadoop/spark/scala

sppark支持三种分布式部署方式，分别是standalone、spark on mesos和 spark on yarn。

standalone模式，即独立模式，自带完整的服务，可单独部署到一个集群中，无需依赖任何其他资源管理系统。

spark on mesos官方推荐这种模式（当然，原因之一是血缘关系）。正是由于spark开发之初就考虑到支持Mesos，Spark运行在Mesos上会比运行在yarn上更加灵活，更加自然。

spark on yarn这是一种最有前景的部署模式。但限于yarn自身的发展，目前仅支持粗粒度模式（Coarse-grained Mode）。这是由于yarn上的Container资源是不可以动态伸缩的，一旦Container启动之后，可使用的资源不能再发生变化，不过这个已经在yarn计划中了

阅读全文>>

分类目录
- apache/nginx (36)
- cache (21)
- clickhouse (14)
- drupal (7)
- eclipse (8)
- elasticsearch (18)
- google (3)
- hadoop/spark/scala (96)
- html/css (12)
- java/android (14)
- linux (87)
- mariadb (2)
- mysql (74)
- nodejs/vue/js/jquery (72)
- nosql (39)
- oracle (9)
- pgsql (8)
- php (107)
- seo (16)
- shell (11)
- smarty (5)
- tidb (21)
- wordpress (13)
- 云计算 (22)
- 双眼看社会 (13)
- 技术其他 (41)
- 服务器相关 (136)
- 系统安全 (7)
最近文章
最近评论和留言
- banner 在 awk是命令还是编程语言上的评论
- lin 在 hadoop 查看 mr日志报错上的评论
- ccc 在 cdh hive 2.1.1 升级到 2.3.4 上的评论
- 简简单单在关于我上的评论
- www 在 clickhouse,tidb,mysql 读取速度对比上的评论
- zzq 在 mysql分表，分区的区别和联系上的评论
- Bill 在怎么在网上找到你要的信息上的评论
- 11 在留言板留言了
- Michael 在 canal 同步mysql数据到clickhouse 支持update delete truncate 上的评论
- 我兜里有糖在 linux postgresql 安装配置详解上的评论
登录
- 登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站

关于我

留言板

开发手册

linux命令

首页

spark sql derby 替换成 mysql

spark-sql 创建表插入数据

spark 创建 dataframe

spark on yarn 安装配置

分类目录

最近文章

最近评论和留言

登录

海底苍鹰(tank)博客

－－一步，二步，三步，N步，二行脚印

赞助本站 关于我 留言板 开发手册 linux命令 首页

spark sql derby 替换成 mysql

spark-sql 创建表 插入数据

spark 创建 dataframe

spark on yarn 安装配置

分类目录

最近文章

最近评论和留言

登录

赞助本站

关于我

留言板

开发手册

linux命令

首页

spark-sql 创建表插入数据