본문 바로가기
학습장/Data Engineering

DataStage Job Xml export

by daedoo_ 2021. 1. 17.

DataStage 클라이언트 툴 설치시 포함된 프로그램들을 활용하면 몇몇 유용한 기능들을 활용할 수 있습니다.

 

Job 정보 테이블에 저장하기 (Folder path, SQL문, Job 생성/최종수정일시 등 )

Job 별로 저장된 쿼리문 확인을 위해 일일이 job을 열어보지 않고 테이블에서 확인 할 수 있다면 

영향도 파악 등에서 훨씬 수월할 거 같습니다.

 

이를 위한, 2가지 방법

 

1. Job Xml export 하여 쿼리문 테이블에 저장 

dsexport, dsjob 등의 명령을 활용하기 위해,

클라이언트 툴 설치경로 아래에 \Clients\Classic  으로 이동

 

dsjob

Job 및 Sequence Name 목록 출력

 

dsjob -domain domain명:port -user ID -password PW -server domain명 -ljobs project명

 

dsexport 

Job을 xml로 export 하여 지정한 경로에 파일로 떨궈준다.

(클라이언트 툴에서 export 시 XML타입으로 지정했을 때의 결과 파일과 같음)

 

dsexport.exe /D=Host명:port /H=Host명 /U=loginID /P=Password /JOB=JOB명 /XML /NODEPENDENTS project명 export파일경로명.xml

 

  • /NODEPENDENTS 옵션 없으면 해당 job에서 사용하는 루틴 소스까지 포함하여 export 됨
  • /XML 옵션 사용시 job명은 필수

 

 

XML파일을 열어보면 쿼리문의 경우 추가로 별도의 XML구조로 감싸져 있음 (11.x 버젼부터 바뀌었다고함)

이를 파싱하면 JOB 수정일시, 경로, SQL문 등을 얻을 수 있다.

쿼리문이 포함된 XML은 해당 스테이지의 커넥션 타입에 따라 태그명이  살짝 다름

 

단점: xml 파일을 일괄로 내려받을 수 없고(Job name 파라미터 필수), 위의 dsjob 명령어로 얻은 job name list를 활용하면 모든 Job들에 대해 export 가능하지만 JOB 1개 export에 15초 이상 소요됨

 

참고:

https://www.ibm.com/support/knowledgecenter/SSZJPZ_11.7.0/com.ibm.swg.im.iis.ds.cliapi.ref.doc/topics/r_dsvjbref_Listing_Projects_Jobs_Stages_Links_and_Parameters.html

 

 

2. meta 테이블 활용

DataStage 서버에 구축되어 있는 metaDB (DB2)를 활용하면 훨씬 빠르고 간편하게 활용가능

DataStage 정보를 갖는 xmeta,

콘솔에서 사용하는 정보를 갖는 dsodb

라는 두개의 DB가 존재함

 

이 중, xmeta 내에 존재하는 

1) DATASTAGEX_DSJOBDEF

2) DATASTAGEX_DSPARAMETERVAL

테이블 들을 활용하여 쿼리를 통해 Job 기본정보 및 SQL 일괄 추출 가능

여기서도 SQL은 XML포맷으로 2)번 테이블의 VALUEEXPRESSION_XMETA 컬럼에 저장되어 있음.

 

또한, meta DB에서 위 정보 추출하기 위한 쿼리에서 생성일시 / 수정일시 조건을 통해

최근 수정된 job 정보만 추출 가능

 

 

'학습장 > Data Engineering' 카테고리의 다른 글

pyspark groupBy 샘플코드  (0) 2021.03.01
Sqoop ETL  (0) 2021.02.21
Hadoop 설치(2)  (0) 2021.01.10
Cloudera 활용한 Hadoop 설치  (0) 2021.01.10
Hadoop에 대하여..  (0) 2021.01.10

댓글