Generative AI

최근에 생성형 AI(Generative AI)에 대한 세간의 관심이 높아지고 있습니다.

그리고 이런 관심의 영향인지 SNS를 보면 ChatGPT를 잘 사용하는 방법이나 이에 대한 결과물에 대한 내용, 그리고 실제 결과물을 공유하는 내용들을 많이 보게 됩니다.

그리고 AI와 관련된 다양한 서비스들이 공개되고 있습니다.

AI 관련 서비스들에 대해서는 아래 글을 참고해 보시기 바랍니다.

 AI 관련 새로운 서비스 모음

ChatGPT를 언급해 드렸기에 생성형 AI가 무엇인지 대강은 느낌이 오셨겠지만, 그래도 생성형 AI가 무엇인지 말씀드리겠습니다.

생성형 AI(Generative AI)란?

간단히 말하면 생성형 AI란 사람이 AI에게 특정 입력(프롬프트)을 통해 어떤 것을 만들어 달라고 요구하면 그 요구에 맞춰서 결과를 만들어주는 인공지능을 말합니다.

* 프롬프트: 생성형 AI에서 AI로부터 응답을 받기 위한 입력값

예를 들어, 다음과 같이 ‘부장님께 올릴 ChatGPT 관련 보고서를 써 줘!’라는 요구를 하면 AI가 이 요구에 맞는 결과를 제공해 주는 것입니다.

ChatGPT 결과

AI로부터 좋은 결과물을 얻기 위해서는 위에서 설명드린 입력값인 프롬프트가 중요합니다. 좋은 입력이 있어야 좋은 결과가 나올테니까 말이죠.

프롬프트가 중요하기에 심지어는 ‘프롬프트 엔지니어’라는 직업에 대한 뉴스도 나오고 있습니다.

 생성형 AI 시대, 챗GPT 조련사 ‘프롬프트 엔지니어’ 뜬다

즉, 좋은 질문(입력, 프롬프트)이 있어야 좋은 결과가 나올 수 있기에, 좋은 질문을 할 수 있는 사람에 대한 요구가 벌써 생겨나기 시작한 것입니다. 결국 답은 AI가 쉽게 제공해 줄 수 있으니 질문이 중요해진 세상이 된 것이죠. 바로 생성형 AI로 인해서 말이죠.

그럼 생성형 AI로 무엇을 만들 수 있을까요?

그럼 이렇게 각광받고 있는 생성형 AI를 활용하면 정말 다양한 것을 할 수 있습니다.

ChatGPT, Bard 등과 같이 텍스트를 통해 글을 생성하거나, DALL-E, Midjourney 등과 같이 텍스트를 통해 이미지를 생성할 수 있습니다. 또는 딥브레인 AI, Synthesia 등과 같이 텍스트를 통해 동영상도 생성할 수도 있습니다.

이 외에도 웹 사이트, 게임, 음악, 앱, 음성 등도 생성할 수 있습니다. 물론 이 중에서 아직 개발 중이기에 당장 서비스를 제공해 줄 수 없는 영역도 있지만 말이죠.

그리고 프롬프트(입력값)가 꼭 텍스트일 필요는 없습니다. 텍스트에서 이미지, 이미지에서 텍스트, 이미지 + 텍스트에서 이미지, 음성에서 이미지, 음성에서 영상, 영상에서 이미지 등 입력과 출력이 다양한 형태로 적용될 수 있습니다.
그리고 이렇게 다양한 입력과 출력이 가능하기에 다양한 방식의 서비스가 될 수 있고 말이죠.

예를 들어, 시각 장애인을 위해 영상이나 이미지를 음성으로 설명해 주는 서비스를 할 수도 있고, 청각 장애인을 위해서 음성을 텍스트로 제공해 주는 서비스를 해 줄 수도 있는 것이죠. 그리고 언젠가 말로 앱이나 게임을 만들 수도 있게 되지 않을까 하는 생각도 듭니다.

그럼 생성형 AI를 통해 실제로 어떤 형태의 서비스들이 제공될까요?

시각적 콘텐츠

1. 이미지 생성 및 변환
이미지 생성을 위한 생성형 AI는 일반적으로 텍스트를 이미지로 변환해 줍니다. 사용자가 원하는 이미지를 설명하는 텍스트를 입력하면 AI가 이미지를 생성해 주는 것입니다. 또는 기존 이미지를 다른 형태로 변환해 줄 수도 있습니다. 관련해서 가능한 사항은 다음과 같습니다.

  • 이미지 완성: AI를 통해 배경 생성, 누락된 픽셀 채우기, 찢어진 사진 보정과 같은 이미지의 누락된 부분을 생성할 수 있습니다.
  • 사진-이미지 변환: 이미지를 사진으로, 또는 사진을 이미지로 변환할 수 있습니다.
  • 이미지 조작: 기존 이미지의 개체를 유지하면서 스타일, 조명, 색상, 형태 등을 수정하거나 변경할 수 있습니다.
  • 이미지 해상도 수정: 낮은 해상도의 이미지를 세부 특징을 유지한 상태로 높은 해상도로 변경할 수 있습니다.

그리고 이런 서비스에는 Midjourney나 DALL-E 등이 있습니다.

2. 동영상 생성

생성형 AI를 통해 효율적이고 유연하게 동영상을 생성하여 동영상 제작 프로세스를 단순화할 수 있습니다. 이를 통해 동영상 구성, 특수 효과 추가, 애니메이션 등과 같은 작업을 자동화할 수 있습니다. 그리고 처음부터 동영상을 제작하거나, 동영상 수정, 해상도 및 완성도 향상에도 활용할 수 있습니다. 관련해서 가능한 사항은 다음과 같습니다.

  • 동영상 예측: 동영상의 다음 프레임을 예측하여 자동으로 생성할 수 있습니다. 움직이는 장면같은 경우에 활용될 수 있습니다. 시간적/공간적 요소를 기반으로 해당 정보의 다음 프레임을 자동으로 만들어 주는 것이죠.
  • 동영상 스타일 변경: 다른 동영상의 스타일이나 참조 이미지를 통해 새로운 동영상 스타일을 적용할 수 있습니다.

3. 3D 생성

생성형 AI를 사용하여 3D 이미지를 만들 수 있습니다. 수동으로는 불가능할 수 있는 상세한 모양을 만드는 데 활용하거나, 3D 프린팅, 3D 스캐닝, 가상 현실 등과 같은 3D 기반 작업의 효율을 향상시킬 수도 있습니다.

소리

1. 음악 생성

생성형 AI를 사용하여 새로운 음악을 만들 수 있습니다. 음악 패턴과 스타일을 학습하여 새로운 음악을 생성해 낼 수 있는 것입니다. 하지만, 이에 대한 저작권 침해 문제라는 넘어야 할 장벽이 있습니다.

2. 텍스트-음성 변환(Text-to-speech; TTS)

텍스트를 통해 사실적인 음성 오디오를 생성할 수 있습니다. 그리고 생성된 음성에 특성을 추가할 수도 있습니다. 예를 들어 텍스트로 생성되는 음성에 미국 배우인 톰 그루즈의 음성 스타일을 적용할 수 있는 것입니다.

3. 음성-음성 변환(Speech-to-speech; STS)

기존 오디오 파일을 사용하여 새로운 음성을 생성합니다. 게임 및 영화 산업에서 이 음성-음선 변환을 활용하여 쉽고 빠르게 다양한 음성을 생성해 낼 수 있습니다.

텍스트

ChatGPT처럼 다양한 텍스트를 생성해 낼 수 있습니다.

1. 글 작성

이야기, 노래 가사, 시 또는 소설을 쓰는 데 활용할 수 있습니다.

2. 상담

AI 챗봇처럼 사용자의 문의에 자동으로 응답하고 자연스러운 대화를 유지할 수 있습니다.

3. 번역

텍스트를 한 언어에서 다른 언어로 빠르게 번역할 수 있습니다.

4. 마케팅 및 광고

제품 설명, 광고 문구, 소셜 미디어 홍보용 콘텐츠 및 캐치프레이즈와 같은 마케팅 및 광고 콘텐츠를 생성할 수 있습니다.

코딩

자동으로 프로그램 코드를 생성할 수 있어 소프트웨어 개발에 활용할 수 있습니다. 물론 아직은 완전한 프로그램을 만들 수는 없겠지만, 그래도 업무 효율에 도움을 줄 수 있다는 생각이 듭니다. 그리고 음성과 결합한다면 음성으로 프로그램을 만들 수도 있게 될 수도 있구요.

1. 코드 생성

텍스트를 통해 코드를 생성할 수 있습니다.

2. 테스트 케이스 생성

코드를 분석하여 소프트웨어 테스트 케이스를 생성하는 데 활용할 수도 있습니다.

3. 버그 수정

코드의 버그를 식별하고 수정하는 데 활용할 수도 있습니다.

이 외에도 최근 Google Workspace나 MS Copilot의 기능에서처럼 작성한 글에 스타일(정중한 글, 친근한 글 등)을 적용하는 등의 방법으로도 활용할 수 있습니다. 정말 무궁무진한 분야라는 생각이 듭니다.

그렇기에 생성형 AI의 활용에 대해서 많은 생각이 필요한 시기가 아닐까 하는 생각도 듭니다.

오늘은 생성형 AI에 대한 이런저런 내용을 공유해 드렸습니다.

생성형 AI에 대해 정리하다 보니 서비스에 대한 내용보다 이 생각이 더 마음에 와 닿더라구요.

‘올바른 해답은 AI가 더 빨리 잘 제공해 줄 수 있기에, 이제 사람이 할 일은 바로 올바른 질문을 하는 것이다.’

 

클라우드나 SaaS와 관련하여 다른 궁금한 점이 있으시면 언제든지 저희에게 문의해 주세요.

저희에게는 클라우드에 대한 다양한 정보와 경험, 그리고 도구가 있습니다.

 OpsNow에 문의하기