배운 것/SAS

[SAS] 맥(Mac)에서 불러온 데이터에서 한글이 깨져요

MOR1ATY 2021. 10. 28. 21:40

[코드]

 

1
2
3
4
DATA ex1;
INFILE "/home/u59345063/sasuser.v94/DATA(과제 1)/score.txt" encoding='ms-949';
INPUT name$ 1-9 math 14 stat 17 eng 23 kor 26 art 29;
RUN;
cs

 

[결과]

 

 

 

원래는 변수 name의 값들이 전부 깨져서 나왔었는데, encoding='ms-949'를 INFILE 명령어 안에 넣어 줬더니 해결이 됐다. 처음에 인코딩 코드를 'utf-8'로 해봤는데 증상이 해결되지 않았고 다른 인코딩을 해볼까 하는 생각이 들어서 눈에 익은 'ms-949'를 골라봤더니 제대로 출력이 됐다.

 

다만 달라진 건, 이전에는 한글 한 글자당 2byte씩 차지했는데 인코딩을 바꾼 이후에 정상적으로 출력될 때는 3byte씩 차지하게 돼서 INPUT 명령어를 전부 수정해 줘야 했다. (일일이 숫자를 늘려가며 확인해 본 것)

 

SAS를 아주 조금 배운 지금 느끼는 점은, 명령어들이 여태 배웠던 다른 프로그램보다는 직관적이고 간단한 것 같은데 오히려 그래서 불편하고 어려운 부분이 있는 것 같다는 점이다. 물론 더 나은 방법이 있고, 내가 못 찾는 것일 뿐이겠지만 초입의 단계에서는 그렇게 느껴진다.