먼저
안녕하세요.
지금 제가 하는 프로젝트중에 HTML -> XHTML로 변환해 주고 다시
이것을 XML로 변환하는 프로젝트를 진행중입니다.
실제 나온걸 보면 정확히 HTML을 XHTML로 변환해 주는 converter가 많이
존재하는 것도 아니고 해서 외국 사이트에 있는 HTML -> XHTML 로 변환해 주는 Component를 사용하고 있습니다.
이름은 Tidy라는 콤퍼넌트 입니다. 그중에서 TidyCOM이라는 걸 사용하는데여..
Tidy : http://tidy.sourceforge.net/
TidyCOM : http://perso.wanadoo.fr/ablavier/TidyCOM/
다음과 같이 프로그램을 하였습니다.
procedure TForm1.Button1Click(Sender: TObject);
var
xhtml: WideString;
tidy : TTidyObject;
test: String;
begin
test := '한글 잘 되라...';
tidy := TTidyObject.Create(nil);
tidy.Options.TidyMark := false;
tidy.Options.OutputXml := true;
// tidy.Options.CharEncoding := UTF8;
xhtml := tidy.TidyMemToMem(test);
ShowMessage(xhtml);
end;
근데 한글 출력 부분에 항상 오류가 발생하여서 문서를 읽어 본 결과
CharEncoding에서는 다음과 같은 것만 지원 한다고 합니다.
raw (0)
ascii (1)
latin1 (2)
utf8 (3)
iso2022 (4)
macroman (5)
흠 이런 경우에 한글을 지원하기 위해서는 어떻게 해야 하는지 궁금합니다.
제가 엄청 초보여서
자세히 설명을 해주시면 감사하겠습니다.
ActiveX도 초보인데다가 흠... 이런 경우까지 발생하니 아주 난감합니다.
그럼 모두들 즐거운 하루 되세요.