델파이를 한지 반년밖에 안되는 왕초보입니다.
다국어로 된 워드문서를 다루어야 하는 과제를 받았는데 고양이 소대가리 맏은 격이여서 선배님들의 도움을 바라고 글을 올립니다.
도움을 바라는것은 다음의 두가지 문제입니다.
1. 한글, 중문간체와 같이 여러나라 글로 된 워드문서의 경우 코드페지나 캐릭셋이 단어별로 적용되나요?
2. 문서내의 단어들을 하나씩 읽어서 sqlite DB에 넣어야 하는데 그 단어가 어느나라 글인지 자동적으로 식별해서 읽는 방법이 없나요?
tworddocuments의 words.item(i).text로 읽어 TNT로 보면 모두 ???로 됩니다.
제 컴에는 WindowsXP 중문판을 깔았고 Office2003역시 중문판입니다.
델파이는 7.0을 쓰고 있습니다.
바쁘신 시간을 내서 읽어주신 분들께 인사를 드립니다.
한수 가르쳐주시기를 학수고대합니다.
저는 텍스트 파일에 다국어를 넣고 했는데요, 일단 그걸 스트림으로 받아 TNT에 넘기기 전에
UTF8Decode로 WideString처리를 먼저 했어요.
<!--CodeS-->
...
var
strings : TStringList;
s : WideString;
begin
...
strings := TStringList.Create;
strings.LoadFromStream(stream);
i := 1;
while i < strings.Count do begin
s := UTF8Decode(strings[i]);
....
<!--CodeE-->
워드파일은 글마다 캐릭셋이 지정되고 없는 폰트는 디폴트로 해서요. 잘 안될 수도 있어요.
소스 일부를 올리면 다른 분들의 답변도 받을 수 있을겁니다.