반응형
AI를 조금씩 알아가고 있는데 쉽지 않다는 걸 느낀다.
일단, 용어가 너무 많고 AI 툴이라는 것들도 너무 많다.
오늘은 변환, 생성과 관련된 단어들 몇 가지들을 정리해본다.
...
주요 AI 콘텐츠 제작 기술 용어
- TTS (Text-to-Speech): 텍스트를 음성으로 변환. 예: AI 내레이터, 오디오북, 가상 비서 음성.
- TTI (Text-to-Image): 텍스트 설명으로 이미지 생성. 예: “푸른 산 위의 성” → AI가 이미지 생성.
- TTM (Text-to-Music): 텍스트로 음악 생성. 예: “신나는 EDM” → AI가 음악 제작.
- ITM (Image-to-Music): 이미지 기반 음악 생성. 예: 일몰 사진 → 잔잔한 배경 음악 생성.
- TTV (Text-to-Video): 텍스트로 영상 생성. 예: “우주선 발사 장면” → AI가 짧은 영상 제작.
- ITT (Image-to-Text): 이미지에서 텍스트 추출 또는 설명 생성. 예: 사진 속 객체 설명, OCR(광학 문자 인식).
- VTT (Video-to-Text): 영상에서 텍스트 생성. 예: 영상 자막 자동 생성, 장면 설명.
- STT (Speech-to-Text): 음성을 텍스트로 변환. 예: 음성 메모를 텍스트로 변환, 실시간 자막.
- ITI (Image-to-Image): 이미지를 다른 스타일로 변환. 예: 사진을 만화 스타일로 변경.
- VTV (Video-to-Video): 영상 스타일 변환 또는 편집. 예: 영상을 흑백으로 변환, 특정 효과 추가.
- STM (Speech-to-Music): 음성 입력으로 음악 생성. 예: 말하는 톤이나 감정을 기반으로 음악 제작(아직 초기 단계).
- MTT (Music-to-Text): 음악을 분석해 텍스트 설명 생성. 예: 음악의 장르, 분위기 설명.
- MTI (Music-to-Image): 음악 기반 이미지 생성. 예: 음악의 리듬이나 분위기를 시각화.
- VTM (Video-to-Music): 영상 기반 음악 생성. 예: 영상의 분위기에 맞는 배경 음악 생성.
추가 설명
- 위 기술들은 딥러닝(특히 GAN, 트랜스포머 모델 등)을 활용하며, 생성형 AI의 발전으로 점점 정교해지고 있다고 한다.
- 응용 분야는 마케팅(광고 콘텐츠 제작), 엔터테인먼트(영화, 게임), 교육(학습 자료 생성), 예술(창작 지원) 등.
- 유튜브 크리에이터가 TTV로 빠르게 영상 초안을 만들거나, 광고 회사에서 TTI로 맞춤 이미지를 제작하는 게 가능해진다.
- 일부 기술(STM, MTT, MTI 등)은 아직 연구 단계거나 상용화 초기지만, 잠재력이 크다고들 한다.
위 내용을 좀 더 보기 좋게, 그리고 실제 어떤 AI를 사용해서 만드는지도 사례를 표로 정리해본다.

...
일단은 대강 어떻게 만들어진 용어들인지는 알겠다.
텍스트, 이미지, 비디오, 뮤직, 스피치...
이 형태들 간에 전환/생성을 약어로 표현한 거구나.
이런 것들이 AI로 간단하게(?) 가능하다니, 참 놀랍다.
어렵지 않게 만든다는데, 나도 하나씩 만들어봐야겠다.
[ AI ] Grok 3과 ChatGPT의 주요 차이점
요즘 AI가 발전하는 것도 그렇지만점차 사용 범위도 넓어지고, 잘 사용하는 사람들도 많아지고 있다. 나는 AI 몇 가지의 이름만 들어봤지 뭐가 뭔지 잘 모르기 때문에,조금씩 알아 가면서 내 일
journal4071.tistory.com
반응형
'AI 첫경험 1개월 후기 (완료)' 카테고리의 다른 글
| [ AI ] AI로 5분 만에 유튜브 쇼츠 만드는 방법: 초보자도 가능! (2) | 2025.05.20 |
|---|---|
| [ AI ] AI 툴을 사람들이 얼마나 많이 쓰고 있을까? AI 시장 현황 (6) | 2025.05.20 |
| [ AI ] 텍스트로 그림을 뚝딱! 이미지 생성 AI로 창의력 UP! (2) | 2025.05.19 |
| [ AI ] AI를 활용한 유튜브 쇼츠 영상 제작의 방법과 전략 (8) | 2025.05.15 |
| [ AI ] Grok 3과 ChatGPT의 주요 차이점 (4) | 2025.05.15 |