GPT-4o (챗GPT-4 옴니) 의 출현
ChatGPT-4o가 바로 어제 공개되었습니다. ChatGPT-4o와 ChatGPT -3.5에게 같은 프롬프트로 요청하고 답변을 비교해보았습니다.
ChatGPT-4o는 OpenAI 공식 사이트에서 많은 사례와 데모 영상을 확인하실 수 있습니다.
영화 허(Her)는 2013년 개봉되었는데요, 저의 책 <챗GPT 리터러시를 만나다>에서도 언급했듯이 챗GPT가 말을 할 수 있다면 이런 모습이 아닐까 상상하곤 했습니다. 그런데 지금 공개된 ChatGPT-4o는 영화 허(Her)의 OS 사만다와 비슷합니다.
ChatGPT-4o 공개 소식으로 전세계가 들썩였는데요, 유료버전 ChatGPT-4를 사용하시는 분들은 지금 바로 확인하실 수 있습니다. 공식 사이트의 데모 영상에서 보듯이 영화 속 그녀처럼 실시간으로 대화가 가능하며 감정도 공감하며 노래도 합니다.
ChatGPT-3.5 무료버전 사용자인 경우는 일부 사용자에게 무료로 사용할 수 있도록 열린 것으로 알려졌습니다. 확인해보니 제 무료 계정에서는 아직 ChatGPT-4o가 적용되지 않았습니다.
ChatGPT-4o와 ChatGPT -3.5에게 같은 프롬프트로 요청하고 답변을 비교해보았습니다. ChatGPT-4o가 ChatGPT-3.5 보다 맥락을 훨씬 더 잘 이해하고, 답변도 마크업 언어로 구조적으로 더 보기좋게, 그리고 더 정확하고 빠르게 답변합니다.
GPT-4o 사용법
어제 옴니 버전이 공개되고 오늘은 ChatGPT UI가 바뀌었습니다. 프롬프트 입력창 위에 예시 질문들을 보여주네요.
ChatGPT-4o 사용법은 기존과 동일합니다. 좌측 상단의 GPT 버전 선택에서 GPT-4o를 선택하시고 똑같이 대화하면 됩니다. ChatGPT UI가 개선되면서 메뉴에서 임시채팅이 추가된 것을 확인하실 수 있습니다. 임시채팅을 선택해보면 검색되거나 학습되지 않는 채팅이라고 합니다.
GPT-4o 이미지 생성 개선
OpenAI의 공식 사이트에는 보이스 챗(음성 대화) 뿐만 아니라 이미지 생성 기능도 공개되었는데요, 공개된 프롬프트로 직접 AI 이미지 생성을 해보았습니다.
1) 텍스트 표현 개선
GPT-4o에서는 텍스트도 이미지에 아주 잘 보여주고 있습니다. 이제까지 AI 이미지 생성에서 아쉬웠던 점이 텍스트 표현이었는데요, 지금 보시는 것처럼 정확하게 잘 표현해줍니다.
OpenAI 공식 사이트의 AI 이미지 생성기능 설명
직접 확인해본 AI 이미지 생성 프롬프트
2) 일관된 캐릭터 이미지 생성
ChatGPT-4o 이미지 생성의 또다른 개선점은 일관된 캐릭터 이미지 생성입니다.
지금까지 AI 이미지 생성에서 또 한 가지 아쉬운 점은 일관된 캐릭터 이미지 생성이었습니다. 미드저니가 얼마전 일관된 캐릭터 이미지 생성법을 업데이트 했지만, ChatGPT 에서는 아직 어려웠는데요, 이번에 개선된 것입니다.
AI가 생성한 캐릭터에 이름을 부여하고 이 이름을 유지하면서 캐릭터의 동작이나 복장을 수정할 수 있습니다. 이번 개선으로 ChatGPT-4o로 동화책 쓰기나 웹툰 만들기 등이 훨씬 수월해지고, 이들로 다양한 콘텐츠들이 쏟아져 나올 것으로 보입니다.
GPT-3.5와 답변 비교하기
ChatGPT-4o와 ChatGPT-3.5에게 같은 질문을 하고 답변을 비교해보았습니다.
ChatGPT-3.5 의 답변
ChatGPT-4o 의 답변
ChatGPT-4o이 보다 구조적인 형식으로 상세한 답변을 잘 해주는 것을 확인할 수 있습니다. 답변 속도도 당연히 빠릅니다. 간단한 요청을 해보았지만 데이터 분석이나 코딩 등의 업무 활용에는 훨씬 더 생산성이 높아질 것으로 보입니다.
이미지의 텍스트를 추출하는 OCR 기능도 매우 정확해졌으며, 동영상 분석 기능도 추가되었으니 진정한 멀티모달 AI라고 할 수 있습니다.
GPT-4o 음성 기능
ChatGPT 앱에서 보이스 챗 기능은 ChatGPT3.5 버전에서도 있었습니다. 데모 영상에서 대화 중간에 끼어들기가 가능하다고 했는데요, 보이스챗 기능에서 중단 버튼은 본래 있었던 것으로 ChatGPT-4o의 기능은 아닙니다. ChatGPT-4o에서 끼어들기 기능은 아마도 버튼 없이 대화만으로 가능하도록 업데이트 될 것으로 보입니다.
GPT-4o의 실시간 음성이 아니더라도 ChatGPT-3.5 의 보이스챗 기능만으로도 매우 훌륭합니다. 음성인식률이 아주 좋고, 한국어 영어를 섞어서 대화가 가능하여 영어 공부에도 효율적입니다. 저는 주로 운전 중 서베이가 필요한 경우 사용하는데요, 운전 중 사용가능하다는 것은 그만큼 음성 인식이 뛰어나나는 뜻입니다. 여러분도 한번 사용해보세요.
참고할만한 글
2 thoughts on “GPT-4o 와 GPT-3.5 답변 비교하기, 일관된 AI 이미지 생성 가능”
Comments are closed.