php开发,服务器架构,seo优化

spark-sql YARN application has exited unexpectedly with state FAILED! 解决

张映发表于 2019-02-26

sqark-sql登录进去后，过段时间就会自动退出。并且会报

2019-02-26 18:38:09 INFO SparkSQLCLIDriver:951 - Spark master: yarn, Application Id: application_1550658770519_0084
spark-sql>
>
> use 2019-02-26 18:38:32 ERROR YarnClientSchedulerBackend:70 - YARN application has exited unexpectedly with state FAILED! Check the YARN application logs for more details.，以前一直都没有出现过。

阅读全文>>

hive 导入 mysql文本

张映发表于 2019-02-26

分类目录： hadoop/spark/scala

数据量过大，mysql支持不了。mysql只是个临时方案，最终大数据搭建好了以后，还是需要把mysql的数据，导入到hadoop中。

阅读全文>>

hadoop hive 创建表的坑

张映发表于 2019-02-25

分类目录： hadoop/spark/scala

同事说spark-sql插入不了数据，读取数据可以。写会报以下错误

2019-02-20 19:12:40 INFO audit:371 - ugi=root ip=unknown-ip-addr cmd=get_table : db=dataall tbl=track_pc
Error in query: java.lang.IllegalArgumentException: Wrong FS: hdfs://aaaaa:9000/user/hive/warehouse/dataall.db/track_pc/.hive-staging_hive_2019-02-20_19-12-39_656_7771985312772642109-1/-ext-10000/part-00000-53761c78-6e3b-47e0-b203-57fba5f90856-c000, expected: hdfs://bbbbb;

hive读取数据，插入数据都可以。

阅读全文>>

sqoop 从mysql直接导入到hive表

张映发表于 2019-02-19

分类目录： hadoop/spark/scala

mysql的数据库数据过大，做数据分析，需要从mysql转向hadoop。

阅读全文>>

idea spring boot 热部署

张映发表于 2019-02-12

分类目录： java/android

用了十几年的eclipse了， java现在主要用idea，转的过程中，也没感觉有什么不适应。推荐大家使用idea。idea的热部署根eclipse差不多，除了ide配置不同外。

阅读全文>>

zookeeper kafka 集群安装配置

张映发表于 2019-01-28

分类目录： hadoop/spark/scala

kafka是由Apache软件基金会开发的一个开源流处理平台，由Scala和Java编写。Kafka是一种高吞吐量的分布式发布订阅消息系统，它可以处理消费者规模的网站中的所有动作流数据。这种动作（网页浏览，搜索和其他用户的行动）是在现代网络上的许多社会功能的一个关键因素。这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。对于像Hadoop一样的日志数据和离线分析系统，但又要求实时处理的限制，这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理，也是为了通过集群来提供实时的消息。

阅读全文>>