张映 发表于 2019-12-27

分类目录: hadoop/spark/scala

cdh6默认没有spark-sql,对于开发来说,有没有spark-sql都不重要,建议开发者,尽量少用sql语句。而对于数据分析人员来说,hive sql较慢,spark-sql还是比较合适的。

cdh6的安装,请参考:cloudera cdh 6.3 安装配置

阅读全文>>

张映 发表于 2019-12-03

分类目录: hadoop/spark/scala

spark-sql常用的查询工具,速度比较hivesql要快。但是cdh6并没有spark-sql。

在看这篇文章前,先看:cdh 6 使用独立的 apache spark

阅读全文>>

张映 发表于 2019-07-11

分类目录: hadoop/spark/scala

没找到合适spark sql的客户端,所以不能像navicat,heidisql等那样,可以把可视化数据导成csv,excel等。但是可以通过spark-shell导出数据。

阅读全文>>

张映 发表于 2019-01-07

分类目录: hadoop/spark/scala

spark-sql是spark的一个核心组件,可以实现简单的关系型数据库操作。

阅读全文>>