인공지능 Agents 활용 연습 01: 개념과 인물 탐색

LLM 모델을 연쇄적으로 활용하여 나의 학습에 활용하는 방법을 몇 가지 고민하고 있다. 연습 삼아서 어떤 개념(예, 불평등)을 입력하면 그와 관련된 핵심 인물(학자, 작가, 사회운동가 등 포함)들을 추출하고 관련된 하위 개념을 중심으로 그들의 관련성을 도출해서 다양한 통찰을 얻게 해주는 작업을 하나 자동화해봤다. 나름 그 과정을 도식화해봤다.

이 과정은 크게 세 개의 파트로 나눠지는데, A파트는 키워드를 받고 관련 개념을 도출하고 이를 중심으로 다시 관련된 학자를 함께 추출하는 과정이다. LLM 특성상 질의 때마다 결과가 달라지는 점을 고려해서 5,000번의 반복을 통해서 가장 많이 도출되는 관련어를 정리했다(여기서는 빈출 상위 400개 관련어를 선택). 5,000번을 시도한 이유는 이즈음 되니 새로운 관련어가 더이상 나오지 않았기 때문이다. 사실 이 과정에는 세부적으로 네 개의 에이전트가 과정을 평가하고 피드백 과정을 통해 결과를 다듬는 프로세스가 포함되어 있다.

그림의 A파트 제일 오른쪽에 결과를 산점도로 축약했는데, 가로축은 질의 과정에서 출현한 인물의 빈도를 세로축은 연관 네트워크 구조에서 인물의 중심성을 의미한다. 여기서는 포착된 2,110 명 중에서 핵심 인물(산점도의 우상단)로 아마티아 센과 벨 훅스가 두드러지게 보인다. 이외에도 피에르 브루디외, 패트리샤 힐 콜린스, 조지프 스티그글리츠, 주디스 버틀러, 코넬 웨스트, 칼 막스, 마이클 센델, 마사 누스바움 등이 두 지표 기준으로 최고 핵심 인물로 나타났다. A단계의 끝은 관련어와 인물의 연관구조가 담겨있는 데이터를 D/B화하는 것이다.

B파트는 주요 인물 가운데 관심 있는 사람을 정하면 그를 중심으로 어떤 관련어, 인물과 연관성이 높은지 추출하는 과정이다. 막대그래프는 다른 인물과의 연관성 지표(특정 관련어를 중심으로 얼마나 자주 짝이 되는지를 중심으로)를 보여주고, 연이어 있는 워드클라우드는 관련어의 중요도 분포를 보여준다. 아마티아 센을 관심인물로 지정하니 벨 훅스와의 관련성이 가장 높게 나왔고, 센의 주요 관련어로는 social norm, democracy, capability approach, climate change, inequality indices 등이 눈에 띈다.

아마티아 센과 가장 내용적 유사성이 높은 인물인 벨 훅스도 비슷하게 분석하고 그 결과를 다시 에이전트에게 전달했다. 여기서는 두 인물의 주제 유사성과 차이를 도식화하게 했다. 이게 마지막 단계인 C이다. 이 두 인물은 각각 다른 영역에 서 있지만, 억압 구조/사회적 규범과 불평등의 관계라는 측면에서 높은 공통성을 보이고 있다. 센의 <자유로서의 발전>은 일단 읽었으니, 아직 읽지 못한 벨 훅스의 <올 어바웃 러브>를 읽어야겠다. 생각을 넘나드는 크로스텍스트의 즐거움이 벌써 예상된다. 마지막 단계는 다양한 방식으로 인사이트를 추출할 수 있을 것이다. 그 이전 단계인 B 또한 새로운 방법을 고민할 수 있을 것이다.

내가 잘 모르는 분야(혹은, 잘 안다고 착각하고 있는 분야에 대한 실력 테스트용?)에 대한 시작 지점으로 참고가 될 만한 자동화 과정으로 보인다. 물론, 이런 toy project가 늘 그러하듯 다른 꿍꿍이(?)도 있다. 삶의 위험 예측이라든지, 공공 서비스 추천이라든지 하는 보다 큰 문제에 인공지능이 어떤 방식으로 활용될 수 있을 것인가에 대한 통찰을 얻기 위한 목적이 있는 것이다. 내가 그 가능성을 확신하지 못하면 누구에게 조언하기도 어렵기 때문이다.

댓글 남기기

워드프레스닷컴에서 웹사이트 또는 블로그 만들기

위로 ↑