nice price 자세히보기

AI 첫경험 1개월 후기 (완료)

[ AI ] AI를 활용한 콘텐츠 생성 용어 TTS, TTI, TTM, ITM, ITV가 무엇일까

13층 농부 2025. 5. 19. 10:43
반응형

AI를 조금씩 알아가고 있는데 쉽지 않다는 걸 느낀다.

일단, 용어가 너무 많고 AI 툴이라는 것들도 너무 많다.

오늘은 변환, 생성과 관련된 단어들 몇 가지들을 정리해본다. 

 

...

 

주요 AI 콘텐츠 제작 기술 용어

  1. TTS (Text-to-Speech): 텍스트를 음성으로 변환. 예: AI 내레이터, 오디오북, 가상 비서 음성.
  2. TTI (Text-to-Image): 텍스트 설명으로 이미지 생성. 예: “푸른 산 위의 성” → AI가 이미지 생성.
  3. TTM (Text-to-Music): 텍스트로 음악 생성. 예: “신나는 EDM” → AI가 음악 제작.
  4. ITM (Image-to-Music): 이미지 기반 음악 생성. 예: 일몰 사진 → 잔잔한 배경 음악 생성.
  5. TTV (Text-to-Video): 텍스트로 영상 생성. 예: “우주선 발사 장면” → AI가 짧은 영상 제작.
  6. ITT (Image-to-Text): 이미지에서 텍스트 추출 또는 설명 생성. 예: 사진 속 객체 설명, OCR(광학 문자 인식).
  7. VTT (Video-to-Text): 영상에서 텍스트 생성. 예: 영상 자막 자동 생성, 장면 설명.
  8. STT (Speech-to-Text): 음성을 텍스트로 변환. 예: 음성 메모를 텍스트로 변환, 실시간 자막.
  9. ITI (Image-to-Image): 이미지를 다른 스타일로 변환. 예: 사진을 만화 스타일로 변경.
  10. VTV (Video-to-Video): 영상 스타일 변환 또는 편집. 예: 영상을 흑백으로 변환, 특정 효과 추가.
  11. STM (Speech-to-Music): 음성 입력으로 음악 생성. 예: 말하는 톤이나 감정을 기반으로 음악 제작(아직 초기 단계).
  12. MTT (Music-to-Text): 음악을 분석해 텍스트 설명 생성. 예: 음악의 장르, 분위기 설명.
  13. MTI (Music-to-Image): 음악 기반 이미지 생성. 예: 음악의 리듬이나 분위기를 시각화.
  14. VTM (Video-to-Music): 영상 기반 음악 생성. 예: 영상의 분위기에 맞는 배경 음악 생성.

추가 설명

  • 위 기술들은 딥러닝(특히 GAN, 트랜스포머 모델 등)을 활용하며, 생성형 AI의 발전으로 점점 정교해지고 있다고 한다.
  • 응용 분야는 마케팅(광고 콘텐츠 제작), 엔터테인먼트(영화, 게임), 교육(학습 자료 생성), 예술(창작 지원) 등.
  • 유튜브 크리에이터가 TTV로 빠르게 영상 초안을 만들거나, 광고 회사에서 TTI로 맞춤 이미지를 제작하는 게 가능해진다.
  • 일부 기술(STM, MTT, MTI 등)은 아직 연구 단계거나 상용화 초기지만, 잠재력이 크다고들 한다.

 

위 내용을 좀 더 보기 좋게, 그리고 실제 어떤 AI를 사용해서 만드는지도 사례를 표로 정리해본다.

 

...

일단은 대강 어떻게 만들어진 용어들인지는 알겠다.

텍스트, 이미지, 비디오, 뮤직, 스피치...

이 형태들 간에 전환/생성을 약어로 표현한 거구나. 

이런 것들이 AI로 간단하게(?) 가능하다니, 참 놀랍다. 

어렵지 않게 만든다는데, 나도 하나씩 만들어봐야겠다. 

 

 

[ AI ] Grok 3과 ChatGPT의 주요 차이점

요즘 AI가 발전하는 것도 그렇지만점차 사용 범위도 넓어지고, 잘 사용하는 사람들도 많아지고 있다. ​나는 AI 몇 가지의 이름만 들어봤지 뭐가 뭔지 잘 모르기 때문에,조금씩 알아 가면서 내 일

journal4071.tistory.com

 

반응형