머신러닝을 활용한 빅데이터 분석 #1

분석 Suicide Rates Overview 1985 to 2016 

Suicide Rates Data를 csv형태로 취득한 후, json변환을 거쳐 메세지큐를 통해 Druid에 저장하고 Machine Learning으로 분석 가공한 후, 시각화처리를 수행합니다.


분석에 필요한 솔루션
http://kafka.apache.org/
https://nifi.apache.org/
http://druid.io/
https://scikit-learn.org/
https://superset.incubator.apache.org/



#1 Start Druid

./bin/supervise -c quickstart/tutorial/conf/tutorial-cluster.conf
**Druid 의 경우, zookeeper의 선행 시작이 필수.

#2 Start Kafka broker



./bin/kafka-server-start.sh config/server.properties

#3 Start Nifi


./bin/nifi.sh start



댓글

이 블로그의 인기 게시물

error You have $NVM_DIR set to "/root/.nvm", but that directory does not exist. Check your profile files and environment.

linux mint install xrdp

centos 6.x yum update problem making ssl connection