
대통령 취임사에 담긴 역대 대통령들의 고유한 생각을 엿보고 싶어졌다.
탐색적인 첫걸음으로 역대 대통령들의 취임 연설문을 수집했다. 박정희 전 대통령의 1978년 취임 연설문 이후를 수집 기준으로 했다. 이 작업의 핵심은 각 연설문에 실린 대통령의 고유한 어휘 사용 패턴을 살펴보는 것이다. 고유한 사용 패턴은 전체 집단의 평균적인 사용 수준과 비교해서 분석해야 한다. 예를 들어, “국민” 혹은 “오늘”이라는 단어는 연설문마다 빈번하게 나오는 단어이기 때문에 어떤 연설문에서 자주 나왔다고 해도 전체 평균과의 비교를 통해 고유한 수준을 파악해야 한다.
이런 문제라면 계량언어학 지표 가운데 하나인 PMI(pointwise mutual information)를 활용하면 유용하다. 일반식은 다음과 같다.
log p(w | s) – log p(w)
특정 텍스트(s)에서 특정 단어(w)가 나올 확률의 로그 값에 해당 단어가 나올 전반적인 확률의 로그값을 빼주는 것이다. 요약하자면 이 값이 클수록 해당 텍스트에서의 쓰임이 고유성이 높다는 것을 의미한다.
이 지표를 응용하면서 여기서 더 나아가 대통령 연설문의 짝을 통해 두 대통령 간 확률적으로 높은 수준으로 공유하는 키워드가 무엇인지도 알고 싶어졌다. 분석 결과를 깔끔하게 보기 위해서 한 연설문에 2번 이상 등장한 단어만 포함했으며, 의존 명사와 연설 날짜나 “제0대 대통령”과 같은 특정 시기를 나타내는 단어는 제외했다.
오른쪽 그림은 문재인 대통령(가로축)과 노무현 대통령(세로축)의 취임 연설문 분석 결과다. 문재인 대통령의 경우 취임 연설문이 짧으므로 분석량이 좀 적은 편이다. 문재인 대통령의 경우 당선 확정 소식이 나온 후 광화문에서 있었던 연설과 공식 취임연설문을 결합했다. 그림에서 주황색은 전체 연설문 가운데서 노무현 대통령만이 유의미한 수준으로 고유하게 활용한 단어를 나타내고 있다. 주요 단어를 뽑으면 다음과 같다.
– 노무현 대통령 고유 키워드 :
[지방 – 변방 – 혁신 – 대륙 – 유럽연합 – 핵무기 … …]
파란색은 문재인 후보의 연설에서 고유하게 쓰이는 단어다. 주로 다음과 같은 단어다.
– 문재인 대통령 고유 키워드 :
[광화문 – 문재인 – 인사 – 후보들 – 나라다움… …]
두 대통령이 모두 쓰면서 동시에 고유성을 지니고 있는 어휘(두 대통령의 고유한 공유 키워드)는 다음과 같다.
– 문재인&노무현 대통령 공통 고유 키워드 :
[원칙-통합]
마찬가지로 박근혜 전대통령과 박정희 전대통령의 결과를 요약하면 다음과 같다.
– 박정희 대통령 고유 키워드 :
[중화학 – 자주성 – 분발 – 방위 – 농촌 – 자립… …]
– 박근혜 대통령 고유 키워드 :
[신뢰프로세스 – 행복시대 – 창조경제 – 경제민주화 – 경제부흥… …]
– 박정희&박근혜 대통령 공통 고유 키워드 :
[국력 – 헌신]
위 결과에서 드러난 패턴은 여러 가지 해석이 가능하다. 흥미로운 점은 문재인 대통령의 경우 고유 어휘가 적은데, 이는 연설문 자체가 짧은 것도 있지만, 그만큼 흔히 쓰는 쉬운 단어를 택한다는 것을 의미한다. 그리고 자신의 연설을 국민에 대한 “인사”라고 표현하는 점이나 역대 대통령들과 달리 자신과 경쟁한 후보들에 대한 언급이 있는 것이 인상적이다. 또한 자신의 이름을 스스로 부르는 특징이 있다. 어휘 사용과 관련해서 대비되는 것이 박근혜 전 대통령인데, 나름의 독특한 어휘를 많이 쓰고 있음을 알 수 있다.
여기서 드러나는 단어 사용의 패턴이 이들 대통령의 국정 운영 방향과 어떤 연관성이 있는지 추가로 살펴보는 작업을 한다면 흥미로운 아이디어를 얻을지도 모르겠다.

댓글 남기기