그것을 믿으려면 말해야 합니다. ChatGPT의 환상적인 음성-텍스트 기능입니다. 가장 잘 알려진 일부 음성-텍스트 앱보다 훨씬 더 부드럽고 정확한 것으로 입증되었습니다.
Google의 음성 입력은 제가 수년 간 가끔씩 사용해 온 도구입니다. SwiftKey 키보드 앱과 Google의 자체 휴대전화용 Gboard 키보드가 함께 제공됩니다. 한동안은 좋았지만(사실 평균 이상) 이제는 그렇지 않습니다. ChatGPT는 경쟁에서 앞서 나갔고 결과는 매우 매끄러웠습니다.
Google의 음성 입력을 사용해 본 적이 있다면 텍스트에 구두점을 추가할 때마다 '쉼표' 또는 '마침표'를 큰 소리로 말하는 것이 얼마나 어색한지 아실 것입니다. ChatGPT에서는 필요하지 않습니다. 친구와 대화하는 것처럼 자연스럽게 말할 수 있으며, 예상되는 위치에 구두점을 쉽게 추가할 수 있습니다.
이것은 큰 차이를 만듭니다. 예를 들어 다음 문장을 생각해 보세요. “저는 슈퍼마켓에 가서 사과, 오렌지, 수박, 배, 체리를 사고 싶어요.” Google의 음성 입력을 사용하여 받아쓰려면 "...사과 쉼표 오렌지 쉼표 수박 쉼표 배 쉼표와 체리"라고 말해야 합니다. '쉼표'라는 단어를 다섯 번 반복하는 것은 투박하고 부자연스럽습니다.
ChatGPT는 고급 신경망인 WhisperAI 덕분에 음성을 텍스트로 변환하는 놀라운 작업을 수행합니다. OpenAI는 이 기술을 유용한 애플리케이션으로 개발하려는 사람들을 대상으로 오픈 소스 모델로 출시했습니다. 이는 우리에게 중요한 난점을 제시합니다. ChatGPT의 음성-텍스트 기능은 아직 음성 입력 키보드와 같은 기능에 통합되지 않았습니다.
그럼에도 불구하고 저는 제 작업 흐름에서 항상 이 기능을 사용하기 시작했습니다. Google의 음성 입력은 내 키보드에서 쉽게 접근할 수 있음에도 불구하고 실수를 수정하는 데 많은 시간을 낭비하게 됩니다. 어느 순간 나는 내 말을 더 잘 알아들을 수 있도록 자동녹음전화나 컴퓨터 음성처럼 짧은 부분으로 말하기 시작했습니다.
그래서 저는 작은 해결 방법으로 ChatGPT의 음성 텍스트 변환 기능을 즐겁게 사용하고 있습니다. 결국에는 자연스럽게 말할 수 있게 해주는 것 외에도 훨씬 더 많은 시간과 노력을 절약할 수 있을 것입니다.
ChatGPT는 Android, iPhone, macOS(M1 이상)에서 사용할 수 있습니다.
Windows 컴퓨터를 사용하는 경우 2024년 말에 ChatGPT용 데스크톱 앱이 출시될 예정입니다.
나는 펜과 종이를 사용하여 기사에 대한 메모를 작성합니다. 아이러니하게도 이는 기술 작가에게 매우 낮은 수준의 접근 방식입니다! 나는 그것을 즐기지만, 그것이 나에게 어떤 쓸모가 있으려면 결국에는 그 단어들을 디지털 형식으로 만들어야 합니다.
제가 아이디어를 옮기기에 가장 선호하는 곳은 메모 앱입니다. 예를 들어 Google Keep은 온라인과 기기 간에 메모를 자동으로 동기화하므로 좋습니다. 아니면 내 생각을 장기간 보관할 수 있는 새로운 방법인 Obsidian이 있습니다. 장기적으로는 편의성을 높이기 위해 모든 기기에서 작동하는 메모 작성 앱을 목표로 하는 것이 가장 좋습니다.
내 프로세스는 간단합니다. ChatGPT를 열고 마이크 버튼을 누른 다음 말하기를 시작하세요. 그런 다음 중지를 눌러 오디오를 텍스트로 변환하세요. 마지막으로 텍스트를 복사하여 메모 작성 앱에 붙여넣습니다.
내 데스크톱에서도 동일한 프로세스를 따릅니다. 앱은 모바일 버전과 거의 동일해 보이기 때문에 녹음을 시작하려면 마이크 버튼을 누르고 녹음이 끝나면 체크 버튼을 누르기만 하면 됩니다. 그런 다음 Word 문서나 이메일 등 필요한 위치에 텍스트를 복사할 수 있습니다.
때로는 ChatGPT에 직접 전사 기록을 남겨두는 것이 좋습니다. 이 경우, 복사된 텍스트 바로 앞에 "댓글 금지:" 줄을 추가한 다음 Enter 키를 눌러 ChatGPT의 대화 피드에 추가할 수 있습니다. 이렇게 하면 ChatGPT가 장황한 답변으로 응답하는 것을 방지할 수 있으며 텍스트 변환 기록을 유지하는 이점도 있습니다.
ChatGPT에는 음성을 텍스트로 변환하는 것 외에도 할 수 있는 일이 많기 때문에 가지고 다니기 좋은 다목적 앱입니다.
이 음성-텍스트 AI 모델이 음성 입력 앱이나 전사 도구에 적용되기까지는 그리 오래 걸리지 않을 것입니다. 그때까지는 ChatGPT를 사용하여 메모 작성, 브레인스토밍 또는 받아쓰기 부분에 대해 깨끗하고 정확한 전사를 생성할 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3