티스토리 뷰

IT Computer

[ XMl parser ] DOM, SAX

Happiness 2022. 5. 11. 10:48

 

 

XML Parser



xml은 단순한 텍스트포맷으로 웹서비스의 기본 데이터 포맷이라고 할수있습니다.

자체는 단순한 포맷이지만 규칙은 엄격해서 정확한 정보를 빼내기는 쉽지않습니다.

Client는 Server쪽에 요청을 보내고 Server는 Client쪽에 xml을 리턴해주면서 통신함

xml을 쓰는 가장큰 이유는 데이터 교환 및 공유목적의 표준화가 가능하다는 것으로

분야별, 용도별로 각 도메인의 전문가들이 표준안을 작성하면 그것에 맞춰 유효성을 판단합니다.

 

 

구조화된 xml 문서

 

xml을 return 받은 Client의 프로세서는 마크업분석을 하면서 구조화된 정보(xml parser)를 애플리케이션에 넘깁니다.

구조화된 정보는 태그로 이루어져 있으며 시작태그(start tag), 끝태그(end tag), 빈엘리먼트(empty-Element) 세가지종류로 이루어집니다.

 

 

이러한 xml파서는 오류검사, 유효성검증 등을 처리하고 응용프로그램의 인터페이스 역할을 하며 종류는 비검증 파서와 유효성 검증파서 두개로 나뉩니다.   두 parser의 차이는 분법적 오류만 검사하느냐 아니냐입니다. 

비검증 파서(non-validating parser) 유효성 검증 파서 (validating parser)
◎ 문법적인 오류만 검사 (well-formed)
[참고] Explorer에는 비검증용 MSXML 파서와
XSLT 프로세서가 내장

MSMSXML, IBM XML4J, Apache SW

Xerces Java Parser
◎ 또는 별도의 XML 검증기 (validator)

 

 

응용프로그램 개발할때 xml문서에서 parser를 통해 파싱 한후

DOM, SAX과 같은 인터페이스를 거쳐 응용프로그램에 출력됩니다.

응용프로그램이 MS제품일경우 msxml 파서를 자동설치하고

웹 브라우저가 아닌경우에는 별도의 xml파서를 설치해야합니다.

 

 

 

XML을 읽는 과정을 간단하게 요약하자면 

 

1. XML문서 > 문법검사(well-formed) 

2. XML문서+DTD, XSD > 유효성검사(validating:검증)

 

에서 1,2 번과정을 거친후

 

3. DOM Parser일 경우 DOM Tree생성 > Application(응용프로그램) > DOM Calls

4. SAX Parser일 경우 SAX Events 실행 

 

 

 

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함