XML 파서와 웹 크롤러

XML과 HTML

xml html
데이터의 교환을 위해 데이터의 표현을 위해
사용자가 태그 정의 가능 (사전 정의 태그 없음) 이미 정해진 사전 정의 태그 사용
실행 환경에 구애받지 않음 인터넷 웹 환경에서 작동
안드로이드 뷰, svg 등 웹 뷰

html은 데이터의 표현, xml은 데이터의 교환이 목적

질문)) xml과 html의 차이점에 대해 설명하시오

XML 파서

xml 문서의 문자열을 추출해 XML DOM 객체로 파싱하고 해당 객체에서 정보를 추출하는 친구

DOM 파서

https://developer.mozilla.org/ko/docs/Web/API/DOMParser

AST

추상 구문 트리

소스 코드의 구문 구조를 추상적으로 나타낸 트리

https://resources.jointjs.com/demos/rappid/apps/Ast/index.html

토크나이저, 렉서, 파서

https://alalstjr.github.io/java/2019/05/14/Lexer,-Token,-Parsing-개념정리/