머신러닝을 활용한 빅데이터 분석 #1

분석 Suicide Rates Overview 1985 to 2016 

Suicide Rates Data를 csv형태로 취득한 후, json변환을 거쳐 메세지큐를 통해 Druid에 저장하고 Machine Learning으로 분석 가공한 후, 시각화처리를 수행합니다.


분석에 필요한 솔루션
http://kafka.apache.org/
https://nifi.apache.org/
http://druid.io/
https://scikit-learn.org/
https://superset.incubator.apache.org/



#1 Start Druid

./bin/supervise -c quickstart/tutorial/conf/tutorial-cluster.conf
**Druid 의 경우, zookeeper의 선행 시작이 필수.

#2 Start Kafka broker



./bin/kafka-server-start.sh config/server.properties

#3 Start Nifi


./bin/nifi.sh start



댓글

이 블로그의 인기 게시물

[!] CDN: trunk URL couldn't be downloaded: https://cdn.cocoapods.org/CocoaPods-version.yml Response: URL using bad/illegal format or missing URL

starcraft map

Data Analysis with Superset - boardless chart