UNIST 연구…메모리·검색 준비 시간 줄이고 인식 성능 높여

연구 그림
사용자가 텍스트로 특정 물체를 지정하면 라이트스플랫이 해당 물체를 3D 공간에서 선택하고 편집하는 모습. [울산과학기술원 제공. 재판매 및 DB 금지]
(울산=연합뉴스) 김용태 기자 = 증강현실(AR) 화면이나 로봇이 보는 3차원 공간에서 사용자가 입력한 텍스트를 통해 물체를 찾아내는 인공지능(AI) 기술이 나왔다.
울산과학기술원(UNIST) 인공지능대학원 주경돈 교수팀은 사용자가 입력한 말이나 문장을 통해 AI가 3D 공간 속 대상을 찾아내는 '오픈어휘 기반 3D 공간 인식 기술'인 '라이트스플랫'(LightSplat)을 개발했다고 8일 밝혔다.
로봇이나 증강현실 기술에서는 카메라로 들어온 2D 이미지를 기계가 인식할 수 있는 위치·색·투명도 정보를 가진 작은 점 입자(가우시안)들이 모인 3D 공간으로 복원한다.
3D 공간 인식은 이렇게 복원된 공간에서 어떤 물체가 어디에 있고, 어느 영역을 차지하는지를 찾는 기술이다.
연구팀이 개발한 기술은 사용자가 입력한 자연어를 기반으로 3D 공간에서 대상을 찾아내는 오픈어휘 3D 공간 인식 기술이다.
의자, 책상, 문처럼 미리 정해진 범주의 물체만 찾는 방식과 달리 '흰색 소파', '라면 위 달걀' 등 더 구체적이고 다양한 표현을 통해 원하는 대상을 찾을 수 있다.
신기해서 가져와봄
기사전문
https://www.yna.co.kr/view/AKR20260608130400057?input=tw