AI 신뢰성 향상과 효율성 증대 연구
MIT-IBM Watson AI Lab 여름 프로그램의 첫 학생들 5명이 AI의 유용성과 배포를 증진하기 위한 다양한 연구에 매진하고 있습니다. 이들은 신뢰성 있는 모델을 만드는 데 집중하며, AI의 안전성, 추론 효율성, 다중 모달 데이터 및 지식 기반 추론 분야에서 작업을 수행하고 있습니다. 이러한 연구의 결과는 AI 시스템의 신뢰성과 효율성을 높여 실제 기업 및 과학 응용 분야에서의 활용 가능성을 넓히고 있습니다.
AI 신뢰성 향상: 내부 구조를 활용한 모델 해석
AI 모델의 신뢰성을 향상시키기 위한 연구는 매우 중요합니다. MIT 수학 대학원생 안드레이 브리우킨(Andrey Bryutkin)은 이러한 신뢰성을 강화하기 위해 문제 내의 내부 구조를 사이언스하여 더 안정적인 솔루션을 연구하고 있습니다. 그는 시스템을 지배하는 방정식과 보존 법칙을 찾아내어 이를 활용할 수 있는 방법을 탐구하고 있습니다. 브리우킨은 IBM의 베로니카 토스트와 MIT의 마르제흐 가세미 교수와 협력하여 대규모 학습 모델(LLM)의 행동을 상세히 조사했습니다. 이들은 클래식한 소규모 피드포워드 신경망인 프로브를 활용하여 LLM의 신뢰할 수 없는 답변을 구별하는 방법을 개발했습니다. 이런 검증 체계는 안전한/위험한 프롬프트와 질문-답변 작업을 통해 프로브의 신뢰성을 측정하고, 데이터의 예측이 어려운 분야를 식별하는 데 큰 도움이 됩니다. 이렇게 정교해진 프로브는 AI 시스템의 신뢰성을 높이는 핵심 요소로, IBM의 그라나이트 가디언 모델과 같은 중요한 데이터 응용에 특히 중요합니다.효율성 증대: 모델의 계산 자원 낭비 최소화
효율성은 AI 모델의 성능을 극대화하는 데 필수적입니다. MIT EECS 대학원생 송린(Yang)은 긴 입력 텍스트 처리와 시퀀스의 실시간 변화를 다루면서 모델의 응답의 시기와 완전성을 중요시합니다. 그는 LLM의 구조적 한계를 극복하고 다음 세대 언어 모델 아키텍처를 연구하고 있습니다. 송린은 Rameswar Panda와 Yoon Kim과 함께 LLM의 연산 복잡성을 줄이기 위한 혁신적인 방법을 모색했습니다. 이들은 소프트맥스 주의 메커니즘의 대안으로 선형 주의를 채택했으며, 이를 통해 긴 시퀀스 모델링의 계산 복잡성을 줄였습니다. 또한, 동적 반사 위치 인코딩을 사용하여 시퀀스 정보의 이해도를 높여, 모델이 더 복잡한 문제를 더욱 효율적으로 해결하도록 하고 있습니다. 이러한 혁신들은 AI의 응답 속도와 포괄성을 향상시킬 뿐 아니라, 실제 환경에서의 적용 가능성을 높여줍니다.다중 모달 추론: 비주얼 데이터 이해의 진화
AI가 비주얼 데이터를 이해하는 능력을 강화하는 것도 중요한 연구 주제입니다. EECS 대학원생 요바나 곤디치(Jovana Kondic)는 데이터 시각화를 위한 오픈소스 합성 차트 데이터셋을 만드는 프로젝트를 진행하고 있습니다. 이는 AI가 시각적 정보를 효과적으로 해석하여 비즈니스 및 과학적인 응용 프로그램에 필요한 정확한 분석을 제공하는 데 중점을 두고 있습니다. 그녀는 VLM(비전-언어 모델)을 활용하여 시각적으로 복잡한 차트를 이해할 수 있는 시스템을 개발했습니다. 이 시스템은 사용자로부터 차트 설명을 받아 초기 Python 프로그램을 생성하고, 이후 그 코드를 반복적으로 개선하여 목적에 맞는 차트를 생성합니다. 이렇게 생성된 데이터셋은 20만 개 이상의 고유한 차트와 코드 쌍을 포함하고 있으며, 금융 및 과학 보고서와 같이 복잡한 데이터 시각화 작업의 효율성을 높이는 데 기여하고 있습니다.결론적으로, MIT-IBM 팀의 이 프로젝트들은 AI 분야에서 신뢰성, 효율성 및 다중 모달 추론이라는 핵심 도전을 극복하기 위한 노력을 보여주고 있습니다. 이들의 연구는 실질적이고 기술적으로 정교한 AI 모델을 만들어내며, 실제 기업과 과학적 응용에서의 가능성을 더욱 넓히고 있습니다. 앞으로 AI의 연구 및 개발 분야에서 이러한 연구 결과를 지속적으로 발전시키고 활용해 나가는 것이 중요한 다음 단계가 될 것입니다.