
구글은 베이징대학교 연구진과 6일(현지시간) 출판 수준의 학술 도식과 그래프를 자동으로 만들어주는 다중 에이전트 AI 프레임워크 ‘페이퍼바나나(PaperBanana)’를 온라인 아카이브에 공개했다.
연구진에 따르면 논문용 일러스트레이션 제작은 정확성, 가독성, 미적 완성도를 동시에 요구해 자동화가 가장 어려운 영역 중 하나였다. 이전에 AI 생성 논문을 가려낼 때 가장 많이 지적됐던 것이 이미지였다. 그림이 어색하거나, 세부 내용이 잘못된 경우가 빈번해 연구 내용의 신뢰도를 크게 떨어뜨렸다.
페이퍼바나나는 구글의 '나노바나나 프로' 등 최신 비전-언어 모델(VLM)과 이미지 생성 모델을 결합하고, 여러 전문 에이전트를 협업하는 방식으로 이 문제를 해결했다.
단일 프롬프트에 의존하지 않고, 기획부터 시각화, 자기 검증까지 전 과정을 단계적으로 수행하는 것이 특징이다.
https://www.aitimes.com/news/articleView.html?idxno=206553