안녕하세요, 독자 여러분. 오랜만에 글을 작성하게 되었습니다.
최근 생성형 인공지능 프로젝트를 진행하고 학회에서 세미나 발표를 하면서 변화의 흐름을 체감하고 있습니다. 독자분이 이 글을 읽는 시점에도 이미 다른 변화가 찾아왔을 것이라 생각합니다. 이제 인공지능을 모르고는 살아갈 수 없는 시대임을 느끼고 있습니다. 세미나에서 진행한 내용의 일부를 뽑아 이번에는 블로그 글로 공유하고자 합니다.
자연어 처리 분야의 발전으로 우리는 인공지능을 통해 무궁무진한 가능성을 탐색할 수 있는 시대에 살고 있습니다. 생성형 AI가 가져온 인공지능의 발전은 정형 데이터뿐만 아니라 비정형 데이터를 포함한 다양한 형태의 데이터를 분석하고 이해하는 능력을 제공하며, 이는 우리의 생활과 비즈니스에 큰 변화를 가져오고 있습니다.
OpenAI사에서 GPT-4를 홍보하면서 시작한 아래 'balloon fly image'의 충격적인 사건은 이제 새롭지도 않습니다.
더 나아가 몇 가지 질문을 더해보면, 생성형 AI는 물리학의 원리까지 고려하면서 답변을 하고 있습니다. 이는 AI 시스템이 단순한 데이터 처리를 넘어, 과학적 원리와 복잡한 개념을 이해하고 적용할 수 있는 수준에 도달했음을 보여줍니다.
이러한 발전은 AI가 더욱 정교하고 정확한 해답을 제시할 수 있게 되었음을 의미합니다. 예를 들어, 공학적 문제 해결이나 과학 연구에서 AI는 물리 법칙을 고려한 시뮬레이션을 수행하거나, 복잡한 자연 현상을 모델링하는 데 도움을 줄 수 있습니다.
이는 AI가 단순한 도구를 넘어 지식 기반의 조력자로 진화하고 있음을 보여주는 중요한 지표입니다.
LLM(Large Language Models, 대형 언어 모델) 기반의 다양한 생성형 AI 솔루션들이 앞다투어 시장에 나오면서 그 경쟁이 치열해지고 있습니다. 이대로 가다가는 거대 생성형 AI 기업의 종속성으로부터 탈피하지 못할까 걱정과 염려도 있습니다. 하지만 다행스럽게도 메타가 지난 2024년 7월 23일 라마(LLaMA) 3.1을 출시하면서 오픈 소스 시장도 더욱 발전하고 있습니다. 이는 AI 기술 민주화와 종속되지 않는 IT 기술 혁신 가속화에 큰 시사점을 던집니다.
트랜스포머의 혁명으로 불리었던 LLM의 기반 아키텍처는 멀티 모달로 더욱 발전했고, 다양한 이미지 생성, 비디오 생성, 음악 생성 등의 AI가 상품화되어 나오고 있습니다. 멀티 모달 AI 기능은 이미지를 이해하고 답변하는 능력에서 더 나아가 텍스트, 오디오, 비디오 등 다양한 형태의 데이터를 처리할 수 있는 능력을 제공합니다.
영화, 드라마, 음악 감상 등을 하면서 출연한 배우나 가수를 보고 좋아했지만, 결국 그걸 보고, 듣고, 좋아했던 자신만이 사람이었다는 것을 알면 허망하기까지 합니다.
글로벌 생성형 AI 시장은 주로 미국 기업들이 주도하고 있습니다. OpenAI, Microsoft, Alphabet(Google), Amazon(AWS), NVIDIA 등의 기업들이 주요 플레이어로 활동하고 있으며, 이들은 각각 자신만의 경쟁력 있는 AI 제품을 제공하고 있습니다.
이러한 기업들의 선도적 역할은 AI 기술 발전에 큰 기여를 하고 있지만, 동시에 시장 집중과 기술 종속성에 대한 우려도 제기되고 있습니다. 이들 기업은 막대한 자본력과 우수한 인재를 바탕으로 AI 기술의 혁신을 이끌고 있으며, 각자의 강점을 살린 독특한 AI 솔루션을 개발하여 시장을 선도하고 있습니다.
그러나 이러한 상황은 AI 기술의 다양성과 접근성 측면에서 양날의 검이 될 수 있습니다. 한편으로는 빠른 기술 발전을 이끌지만, 다른 한편으로는 소수 기업에 의한 시장 독점 우려를 낳고 있습니다. 앞서 말씀드린 것처럼 대안으로 오픈소스 AI가 주목받고 있으며 이는 기술의 균형 있는 발전과 민주화에 핵심 역할을 할 것으로 보입니다.
Gartner Hype Cycle에 따르면 생성형 AI는 현재 기대의 정점에 도달한 상태입니다. 이 생성형 AI의 기술이 가트너가 제시한 하이프 사이클처럼 꺼지면서 정착할지, 아니면 새로운 패러다임으로 바뀔지는 현재로써는 지켜보는 수밖에 없습니다. 이러한 불확실성에도 불구하고, 생성형 AI는 이미 모든 비즈니스에 큰 영향을 미치고 있습니다. 이 기술은 인간의 작업을 자동화하고 고객 및 직원 경험을 향상시키는 데 중요한 역할을 하고 있습니다.
이 생성형 AI는 모든 비즈니스에 큰 영향을 미치며, 인간의 작업을 자동화하고 고객 및 직원 경험을 향상시키는 데 중요한 역할을 하고 있습니다. 생성형 AI의 발전은 단순히 기술적 진보를 넘어 우리 사회와 경제 구조에 근본적인 변화를 가져올 가능성이 있습니다. 업무 방식의 혁신, 새로운 비즈니스 모델의 등장, 그리고 인간과 기계의 협업 방식 변화 등 다양한 측면에서 그 영향력이 나타나고 있습니다.
현재 생성형 AI 기술의 트렌드는 크게 세 가지로 요약될 수 있습니다: 멀티 모달 AI 모델, 자율 에이전트, 그리고 작은 언어 모델(SLM)입니다.
멀티 모달 AI는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 입력을 처리할 수 있는 능력을 갖춘 모델입니다. 이는 AI가 인간의 복합적인 정보 처리 방식에 한 걸음 더 가까워졌음을 의미합니다.
자율 에이전트는 인간의 직접적인 개입 없이도 주어진 목표를 달성할 수 있는 시스템을 말합니다. 이는 AI의 자율성과 문제 해결 능력이 한층 더 발전했음을 보여줍니다.
작은 언어 모델(SLM)은 적은 수의 파라미터를 사용하여 효율적으로 작동하는 모델을 의미합니다. 이는 AI 기술의 접근성과 실용성을 높이는 데 중요한 역할을 합니다. 이는 우리가 가진 모바일 기기나 노트북에서도 네트워크 통신 없이 쉽게 자신만의 인공지능 비서를 만들 수 있다는 것을 의미합니다.
궁극적으로 이렇게 발달하는 인공지능 기술은 인간 수준의 지능을 구현할 수 있는 범용 인공지능(AGI, Artificial General Intelligence)을 향해 나아가고 있습니다. 더 나아가, 인간이 가진 오감(시각, 청각, 후각, 미각, 촉각)까지도 인간과 같은 수준 이상으로 프로그램과 하드웨어의 결합을 통해 구현될 것으로 예상됩니다.
이쯤에서 1984년 12월 22일에 개봉한 영화 터미네이터를 떠올리면 그 상상력에 새삼 놀라게 됩니다. 현재 전 세계 거대 기업들은 인공지능이 탑재된 로봇들을 상용화하고 있습니다.
이러한 인간을 대체하는 기술로 발전함에 따라 우리는 온라인 세상뿐만 아니라 오프라인에서도 인간과 기계를 구분하지 못할 수도 있습니다.
그러나 기술의 발전에 두려움을 갖지 말고, 적극적으로 대처해서 좀 더 나은 세상을 만들었으면 합니다. 이는 매우 중요한 관점입니다. 기술 발전은 우리에게 새로운 기회와 가능성을 제공하며, 이를 어떻게 활용하느냐에 따라 우리 삶의 질을 크게 향상시킬 수 있습니다.
당장 인간은 전기 충전이 필요한 것이 아니라, 배가 고프면 밥을 먹어야 합니다. 여기서 인간과 기계의 근본적인 차이를 잘 보여줍니다. 우리의 기본적인 욕구와 생활 방식은 여전히 변함없이 중요합니다.
그래서 오늘 저녁을 뭘 먹을까 고민하고 LLM에게 물어보니, 다음과 같이 답이 나옵니다. 이는 AI 기술이 우리의 일상적인 결정에도 도움을 줄 수 있음을 보여줍니다. 하지만 동시에, 이런 간단한 선택에서조차 AI의 도움을 받는 것이 우리 삶에 어떤 영향을 미칠지에 대해서도 생각해 볼 필요가 있습니다.
생성형 AI가 추천한 음식은 모로코의 전통 요리 타진(Tajine)입니다. 이 요리는 특유의 뚜껑이 있는 점토 냄비 타진(Tajine)을 사용해 고기, 채소, 향신료 등을 넣고 천천히 조리하는 방식으로 만들어지며 다양한 재료와 향신료의 조합으로 특유의 풍미를 선사합니다.
기계는 여행이 필요 없지만 인간인 저로서는 휴식도 필요하기 때문에 조만간 모로코 여행을 가서 이 요리를 직접 먹어볼 예정입니다. 이는 AI와 인간의 근본적인 차이를 다시 한번 상기시켜 줍니다. 인간에게는 여행과 같은 경험, 새로운 문화와 음식을 직접 체험하는 것이 중요한 삶의 일부이기 때문입니다.
끝으로 생성형 AI 기술을 접목해 최근 유튜브 채널을 개설해 이것저것 재미난 것을 만들어 올리면서 운영하고 있습니다. 이는 AI 기술을 창의적으로 활용하는 좋은 예시입니다. 머리가 아플 때 가끔씩 해당 유튜브 링크를 타고 오셔서 감상해 주시면 감사하겠습니다. (블로그 사이트에 접속하면 헤드 부분에 나오는 링크입니다.)
'인공지능(AI) > 생성형 인공지능(Generative AI)' 카테고리의 다른 글
[유튜브 구독자 전용] Text to Image 프롬프트, 최적화 파이썬 코드 외 (0) | 2024.08.25 |
---|---|
Text-to-Image Prompt Guide - 올킬?! (0) | 2024.08.24 |