GIST '인간처럼 사고하는 보행자 경로 예측 AI' 개발

광주 / 장진우
발행 2024-06-19 06:33

AI대학원 전해곤 교수 연구팀, 거대언어모델 기술 활용
세계 최고 권위 컴퓨터 비전 국제학술대회서 19일 발표

광주과학기술원(지스트·GIST)은 AI대학원 전해곤 교수 연구팀이 거대언어모델(LLM) 기술을 활용해 인간의 사고를 모방한 프로세스로 정확한 보행자 경로를 예측하는 알고리즘을 개발했다고 18일 밝혔다.

이번 연구 성과는 보행자의 안전을 확보해야 하는 자율주행 시스템의 보행자 회피 기술과 서비스 로보틱스 분야에 활용될 수 있을 것으로 기대된다.

지금까지 인공지능을 활용해 보행자의 미래 경로를 예측하는 방법론에서는 인간의 행동 역학을 수치 회귀 기법을 통해 보행자의 위치를 모델링해 보행 가능 경로와 최종 도착지를 예측했다.

이 방식은 오직 숫자만을 이용해 가장 가능성 있는 위치를 예측하므로 인간의 사고를 대변하기에는 한계가 있다.

이를 해결하기 위해 연구팀은 거대언어모델이 가진 방대한 양의 지식을 접목해 보행자의 현재 상태와 주변 사람과의 사회적 관계를 인간처럼 분석함으로써 훨씬 더 인간의 사고와 유사하게 미래 보행 계획을 예측하는 기술을 개발했다.

챗GPT로 잘 알려진 거대언어모델(Large Language Model, LLM)은 인공지능의 한 종류로, 방대한 양의 텍스트 데이터를 학습해 인간의 언어를 이해하고 생성할 수 있는 능력을 갖춘 딥러닝 기반의 모델이다.

이번 연구에서는 거대언어모델이 갖는 높은 수준의 언어 이해와 생성 능력을 활용해 인공지능이 보행 방향 및 도착지 예상, 보행자들의 집단 형성, 충돌 가능성 회피, 선행-후행 정리 등 인간의 인지와 사회적 추론(Social Reasoning)을 할 수 있게끔 개발했다.

특히 숫자만으로 인공지능이 어떠한 사유로 행동을 예측했는지 판단하는 기존 방법론과 달리 언어모델이 직접적으로 사회적 추론 결과를 대화로 알려줄 수 있다는 점이 이번 연구의 가장 큰 장점이다.

이번 연구 성과로 거대언어모델이 문자라는 한계에서 벗어나 인간의 물리적인 행동 역학을 직접적으로 예측할 수 있게 되었는데 글의 문법과 흐름을 패턴으로 인식하는 언어모델은 보행자의 한 걸음 한 걸음을 일종의 패턴으로 인지해 다음에 발 디딜 위치를 예측한다.

전해곤 교수는 “이번 연구 성과는 거대언어모델이 인간의 사고방식을 모사해 사회적 관계성을 추론하며, 인간의 행동 역학을 배워 미래 동작을 예측했다는 데 학술적 의의가 크다”며 “거대언어모델이 문자에서 더 나아가 물리 역학적 추론까지 가능하게 되면 인공 일반 지능(AGI)으로의 기술 확장과 실용화를 앞당길 것으로 기대된다”고 말했다.

전 교수가 지도하고 배인환 박사과정생이 수행한 이번 연구는 인공지능 분야 세계 최고 권위의 국제 학술대회인 ‘CVPR(Computer Vision and Pattern Recognition Conference)’에서 오는19일 발표될 예정이다.