본문 바로가기

오픈AI는 텍스트를 동영상으로 변환해주는 인공지능(AI) 시스템인 소라(Sora)를 공개했습니다.

 

오픈AI 바로가기

동영상 생성 기능

소라는 사용자가 입력한 텍스트를 기반으로 최대 1분 길이의 동영상을 생성해줍니다. 이 AI 모델은 여러 캐릭터, 특정 유형의 동작, 복잡한 장면을 생성할 수 있으며, 프롬프트를 정확하게 해석하여 생생한 감정을 표현하는 매력적인 캐릭터를 만들 수 있습니다.

 

오픈AI 홈페이지 동영상 생성
오픈AI 홈페이지 동영상 생성

 


또한 소라는 언어에 대한 깊은 이해를 갖고 있어 프롬프트에서 요청한 내용뿐만 아니라 실제 세계에 사물이 어떻게 존재하는지도 이해합니다. 이처럼 소라는 텍스트만으로 동영상을 생성하고 기존 이미지를 동영상으로 확장하거나 누락된 프레임을 채울 수 있습니다. 오픈AI는 소라를 사용할 수 있는 창작자를 제한하고 안전성을 평가한 후 제품에 통합할 계획입니다.

 

소라는 시각적 품질이 좋고 프롬프트의 내용에 충실한 그림을 그려준다고 평가받고 있습니다

 

 

이미지 생성 기능

Sora는 이미지 생성도 가능합니다. 우리는 한 프레임의 시간적 범위를 갖는 공간 그리드에 가우스 노이즈 패치를 배열하여 이를 수행합니다. 이 모델은 최대 2048x2048 해상도까지 다양한 크기의 이미지를 생성할 수 있습니다.

 

오픈AI 홈페이지 이미지 생성
오픈AI 홈페이지 이미지 생성

 

 

 

새로운 시뮬레이션 기능

Sora는 물리적 세계에서 사람, 동물 및 환경의 일부 측면을 시뮬레이션할 수 있습니다. 이러한 속성은 3D, 개체 등에 대한 명시적인 귀납적 편견 없이 나타납니다. 이는 순전히 규모의 현상입니다. 3D 일관성. Sora는 역동적인 카메라 움직임으로 비디오를 생성할 수 있습니다. 카메라가 이동하고 회전하면 사람과 장면 요소가 3차원 공간에서 일관되게 움직입니다.

오픈AI 홈페이지 시물레이션 장면