빅데이터
-
Scala IDE & Spark 연동빅데이터 2019. 8. 29. 01:04
1. Scala IDE 설치 1 ) Scala IDE 주소 : http://scala-ide.org/download/sdk.html 2 ) Download IDE 2. Maven 으로 Scala 와 Spark 실행 1 ) Flle - New - Scala Project 2 ) Project name : sparkSample - Next > 3 ) Libraries Tab - Scala Library container - Edit ... 4 ) Fixed Scala Library container : 2.11.8 - Finish 5 ) 스칼라 라이브러리 컨테이너가 2.11.8 로 바뀐 것을 확인 후 Finish 6 ) sparkSample 프로젝트에 마우스 오른쪽 클릭 후 Configure - Conver..
-
phoenix 실행빅데이터 2019. 8. 29. 01:00
cd /usr/hdp/2.6.3.0-235/phoenix/bin ./sqlline.py 192.168.1.101:2181:/hbase-unsecure CREATE TABLE Company (COMPANY_ID INTEGER PRIMARY KEY, NAME VARCHAR(225)); CREATE TABLE Com (COMPANY_ID INTEGER PRIMARY KEY, COMPANY_NAME VARCHAR(225)); !tables UPSERT INTO Company VALUES(1, 'Microsoft’); INSERT INTO Company VALUES(4, 'Microsoft4’); UPSERT INTO Com VALUES(1, 'Microsoft'); SELECT * FROM Company; !q..
-
SandBox in Oracle VirtualBox빅데이터 2019. 8. 29. 00:53
VirtualBox 최소 버전 : 4.2 이상 Hardware : 64-bit OS ( Window OR MAC ) 1 ) 샌드박스 다운 ( .OVA) http://hortonworks.com/downloads/#sandbox Linux 종류 : Centos 6.7 2 ) Download for virtual box 3 ) HDP_2.4_virtualbox_v3 4 ) 파일 - 가상 시스템 가져오기 5 ) 가져올 가상 시스템 선택 6 ) 환경 세팅 - RAM ( 4GB or 8GB ) 최소 4 GB 이상 7 ) 선택하고 시작을 하게 되면 먼저 샌드박스 환경 세팅을 해주는 작업을 자동으로 한다. 8 ) 샌드박스 환경세팅 완료
-
Sqoop빅데이터 2019. 8. 29. 00:51
Sqoop은 2009년 첫 버전이 나온 후 2012년에 Apache Top Level Project가 되어 지속 발전 중이다. 현재 Apache Sqoop은 두 가지 버전으로 발전되고 있는데, Sqoop1 이라 불리는 클라이언트 방식과 Sqoop2라 불리는 기존 Sqoop1방식에 추가로 Server side 방식이 추가된 버전이다. sqoop1 과 sqoop2 비교 Sqoop1과 Sqoop2의 가장 큰 변화는 서버 방식의 추가라 할 수 있으며, Sqoop1에서 불편했던 JDBC Driver를 서버 한 곳에만 설치하면 되는 등 편의성이 높아 진점, 그리고, HTTP REST를 활용하여 보다 더 Apache Oozie와 integration 이 용이해 진 점이라 할 수 있다.