张映 发表于 2019-08-03

分类目录: hadoop/spark/scala

大数据开发,一直都用java spring boot框架,加载scala,spark,scala兼容包等,spark开发用scala,其他的开发用java,打包用mvn,感觉还是挺不错的。

如果只是开spark,scala就足够了,没必要在用spring boot。这样感觉不会那么怪。

阅读全文>>

张映 发表于 2019-08-03

分类目录: hadoop/spark/scala

安装IDEA就不说了,也很简单。在这里推荐做java和scala的人使用idea,真的比eclipse好用。

阅读全文>>

张映 发表于 2019-08-01

分类目录: hadoop/spark/scala

scala sbt 加载了spark包,DEBUG的时候报错了。

libraryDependencies ++= Seq(
    "org.apache.spark" % "spark-core_2.12" % "2.4.0",
    "org.apache.spark" % "spark-sql_2.12" % "2.4.0"
)

阅读全文>>

张映 发表于 2019-07-27

分类目录: 云计算, 服务器相关

samba做为共享文件服务器,其实还是挺不错的。但是用户管理,权限管理,文件操作记录等,非常的薄弱了。针对于这些问题,nextcloud就是不错的选择。

阅读全文>>

张映 发表于 2019-07-12

分类目录: 服务器相关

想实现一部分人,可以发测试环境,一部分人可以发正式环境。

阅读全文>>

张映 发表于 2019-07-11

分类目录: hadoop/spark/scala

没找到合适spark sql的客户端,所以不能像navicat,heidisql等那样,可以把可视化数据导成csv,excel等。但是可以通过spark-shell导出数据。

阅读全文>>

张映 发表于 2019-07-05

分类目录: nodejs/vue/js/jquery

headers: {}
at Timeout._onTimeout (/usr/lib/node_modules/cnpm/node_modules/urllib/lib/urllib.js:855:15)
at ontimeout (timers.js:498:11)
at tryOnTimeout (timers.js:323:5)
at Timer.listOnTimeout (timers.js:290:5)
Get /bug-versions/latest from https://registry.npm.taobao.org error: ConnectionTimeoutError: Connect timeout for 5000ms

阅读全文>>

张映 发表于 2019-05-23

分类目录: html/css

h5从视频中截取图片,报错

Uncaught DOMException: Failed to execute 'toDataURL' on 'HTMLCanvasElement': Tainted canvases may not be exported.

产生这个问题原因是跨域,第一次碰到静态文件跨域问题

阅读全文>>

张映 发表于 2019-05-22

分类目录: 技术其他

jetbrains产的开发工具,在使用方面感觉差不多。debug的配置也是比较相似的。

阅读全文>>

张映 发表于 2019-05-21

分类目录: 服务器相关

python的环境以前搭过,到博客找了一下没有。做过的东西要记录很重要的。不然就是浪费时间。

对于gunicorn和uwsgi的选择,主要看个人喜好。gunicorn配置简单点。但是如果用nginx的话,用uwsgi好一点,nginx兼容了uwsgi。

阅读全文>>