'비전언어' 태그의 글 목록

[2024년 8월21일] 생성형 인공지능(AI)을 넘어서 : VLM(Vision-Language Model)

위의 그림은 VLM의 간단한 예시로써, 개와 고양이 이미지와 몇 가지 프롬프트를 전달하여 입력 이미지에 대한 가장 가능성 있는 프롬프트를 얻어내는 내용입니다. 이런 예측을 하려면 모델은 입력 이미지와 텍스트 프롬프트를 모두 이해해야 합니다. 이것이 VLM의 장점입니다. VLM은 "Vision-Language Model"의 약자입니다. VLM은 컴퓨터 비전과 자연어 처리를 결합한 인공지능 모델로 시각적 정보(예: 이미지, 비디오)와 텍스트 데이터를 함께 처리할 수 있는 능력을 갖추고 있습니다. 즉 비전-언어 모델(VLM)은 이미지와 자연어 텍스트를 모두 처리할 수 있는 인공지능 모델입니다. 이러한 모델들은 이미지 설명 생성, 이미지-텍스트 검색, 멀티 모달 학습 등 다양한 응용 분야에서 사용됩니다. 결국 ..

인공지능(AI)/인공지능 동향 2024.08.21

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

비전언어 1

티스토리툴바