zeppelin에 jdbc interpreter 설정하기(apache hive 기준)
IT기술/hadoop family2021. 1. 15. 23:45
2019-12-20 작성
기본설정
- cloudera 5.16.2
- kerberos enabled security hadoop
사실 일반 하둡에서 interpreter는 거의 가이드가 하라는 대로 하면 된다.
http://zeppelin.apache.org/docs/0.8.2/interpreter/jdbc.html
(웬만한 jdbc interpreter는 이걸 보고 하길 바란다)
INTERPRETER 추가
1. 먼저 zeppelin에 접속 후 interpreter 메뉴에서 create를 클릭한다.
2. interpreter 이름을 정하고 group는 jdbc로 설정한다.
3. interpreter 관련한 설정을 한다. apache hive를 기준으로 설명하면, 다음과 같이 properties를 입력한다.
Properties
Name | Value |
default.driver | org.apache.hive.jdbc.HiveDriver |
default.url | jdbc:hive2://localhost:10000 |
default.user | hive_user |
default.password | hive_password |
default.proxy.user.property | Example value: hive.server2.proxy.user |
Dependencies
Artifact | Excludes |
org.apache.hive:hive-jdbc:0.14.0 | |
org.apache.hadoop:hadoop-common:2.6.0 |
hive url은 설치 서버에서 접속 가능하도록 수정해주고, dependencies도 version을 수정해준다.
이때 dependencies는 jar 파일을 다음 경로에 넣어야 한다.
$ZEPPELIN_HOME/interpreter/jdbc/
가이드에서는 jar 파일을 다운 받을 수 있는 페이지( Maven Repository : org.apache.hive:hive-jdbc)를 안내하고 있다. cloudera 기준으로는 다음 명령으로 파일을 복사할 수 있다.
cp /opt/cloudera/parcels/CDH/jars/hive-jdbc* $ZEPPELIN_HOME/interpreter/jdbc/
cp /opt/cloudera/parcels/CDH/jars/hadoop-common* $ZEPPELIN_HOME/interpreter/jdbc/
그 다음 zeppelin을 재시작하면 기본 적인 것은 끝이다.
계속 추가 예정..
'IT기술 > hadoop family' 카테고리의 다른 글
Hive Authorization Configuration 권한 설정 (0) | 2021.01.17 |
---|---|
hive에서 json포맷 기반으로 데이터 가져오기 위한 설정 (0) | 2021.01.16 |
apache zeppelin 설치하고 hadoop kerberos 연동하기 (0) | 2021.01.15 |
hadoop security distcp 시 SIMPLE authentication error(distcp hadoop secure insecure) (0) | 2021.01.15 |
pyspark parquet file 읽어오기 (0) | 2021.01.15 |
댓글()