hadoop/spark/scala«海底苍鹰(tank)博客

‘hadoop/spark/scala’ 类别下的博文

单flume消费kafka数据到hdfs

张映发表于 2019-10-18

分类目录： hadoop/spark/scala

从kafka消费数据到hdfs，目前主要是通过程序的方式来实现的，在这在这个过程中做了简单的数据处理。

其实通过flume就可以实现数据从kafka到hdfs

阅读全文>>

kafka KeeperErrorCode = NodeExists 错误

张映发表于 2019-10-16

分类目录： hadoop/spark/scala

增加kafka节点，对原有节点的顺序做了调整，报错如下：

cxid:0x2a zxid:0x1e txntype:-1 reqpath:n/a Error Path:/brokers/ids Error:KeeperErrorCode = NodeExists for /brokers/ids (org.apache.zookeeper.server.PrepRequestProcessor)

阅读全文>>

通过hive实现hbase的分页

张映发表于 2019-10-15

分类目录： hadoop/spark/scala

hbase通过scan和filter可以实现分页功能，网上已经有很多了。今天要说的是通过hivesql的形势来实现分页。

阅读全文>>

hive 与 hbase 整合

张映发表于 2019-10-15

分类目录： hadoop/spark/scala

hbase可以进行亿级数据存储，查询数据用scan,get还是比较弱的，不支持sql查询，这就增加了数据分析人员的学习成本。hbase只提供了简单的基于Key值的快速查询能力，要进行复杂的查询功能，通过filter还是比较麻烦的。

不过hive与hbase的整合解决这个问题。不仅如此，还能通过hive将数据批量地导入到hbase中。在看本文前，请查看以下文章

centos7 hadoop 集群安装配置

zookeeper hadoop 集群安装配置

centos7 hadoop2.7.7 hbase1.4安装配置详解

hive mysql 安装配置

阅读全文>>

hbase ERROR: Can't get master address from ZooKeeper; znode data == null

张映发表于 2019-10-14

分类目录： hadoop/spark/scala

hbase一直好好的，突然hbase shell报以下错误

hbase(main):001:0> list
TABLE

ERROR: Can't get master address from ZooKeeper; znode data == null

Here is some help for this command:
List all user tables in hbase. Optional regular expression parameter could
be used to filter the output. Examples:

hbase> list
hbase> list 'abc.*'
hbase> list 'ns:abc.*'
hbase> list 'ns:.*'

阅读全文>>