DataStage 클라이언트 툴 설치시 포함된 프로그램들을 활용하면 몇몇 유용한 기능들을 활용할 수 있습니다.
Job 정보 테이블에 저장하기 (Folder path, SQL문, Job 생성/최종수정일시 등 )
Job 별로 저장된 쿼리문 확인을 위해 일일이 job을 열어보지 않고 테이블에서 확인 할 수 있다면
영향도 파악 등에서 훨씬 수월할 거 같습니다.
이를 위한, 2가지 방법
1. Job Xml export 하여 쿼리문 테이블에 저장
dsexport, dsjob 등의 명령을 활용하기 위해,
클라이언트 툴 설치경로 아래에 \Clients\Classic 으로 이동
dsjob
Job 및 Sequence Name 목록 출력
dsjob -domain domain명:port -user ID -password PW -server domain명 -ljobs project명
dsexport
Job을 xml로 export 하여 지정한 경로에 파일로 떨궈준다.
(클라이언트 툴에서 export 시 XML타입으로 지정했을 때의 결과 파일과 같음)
dsexport.exe /D=Host명:port /H=Host명 /U=loginID /P=Password /JOB=JOB명 /XML /NODEPENDENTS project명 export파일경로명.xml
- /NODEPENDENTS 옵션 없으면 해당 job에서 사용하는 루틴 소스까지 포함하여 export 됨
- /XML 옵션 사용시 job명은 필수
XML파일을 열어보면 쿼리문의 경우 추가로 별도의 XML구조로 감싸져 있음 (11.x 버젼부터 바뀌었다고함)
이를 파싱하면 JOB 수정일시, 경로, SQL문 등을 얻을 수 있다.
쿼리문이 포함된 XML은 해당 스테이지의 커넥션 타입에 따라 태그명이 살짝 다름
단점: xml 파일을 일괄로 내려받을 수 없고(Job name 파라미터 필수), 위의 dsjob 명령어로 얻은 job name list를 활용하면 모든 Job들에 대해 export 가능하지만 JOB 1개 export에 15초 이상 소요됨
참고:
2. meta 테이블 활용
DataStage 서버에 구축되어 있는 metaDB (DB2)를 활용하면 훨씬 빠르고 간편하게 활용가능
DataStage 정보를 갖는 xmeta,
콘솔에서 사용하는 정보를 갖는 dsodb
라는 두개의 DB가 존재함
이 중, xmeta 내에 존재하는
1) DATASTAGEX_DSJOBDEF
2) DATASTAGEX_DSPARAMETERVAL
테이블 들을 활용하여 쿼리를 통해 Job 기본정보 및 SQL 일괄 추출 가능
여기서도 SQL은 XML포맷으로 2)번 테이블의 VALUEEXPRESSION_XMETA 컬럼에 저장되어 있음.
또한, meta DB에서 위 정보 추출하기 위한 쿼리에서 생성일시 / 수정일시 조건을 통해
최근 수정된 job 정보만 추출 가능
'학습장 > Data Engineering' 카테고리의 다른 글
pyspark groupBy 샘플코드 (0) | 2021.03.01 |
---|---|
Sqoop ETL (0) | 2021.02.21 |
Hadoop 설치(2) (0) | 2021.01.10 |
Cloudera 활용한 Hadoop 설치 (0) | 2021.01.10 |
Hadoop에 대하여.. (0) | 2021.01.10 |
댓글