인공지능이 나를 대체할까?
내 정체성은 기술을 활용해 문제를 풀어내는 엔지니어라는 것에 있다.
그동안은 삶 속의 문제를 풀어내고, 그 기록들을 이곳에 담았다면 오늘은 정말 기술에 관한 이야기를 하려고 한다.
Whisper
오늘은 오랜만에 기술에 관한 글을 준비했다. 이번에는 오픈 AI의 Whisper, Whisper.cpp 그리고 Apple의 Core ML에 대한 이야기를 해볼까 한다!
Whisper: 오픈 AI의 STT 기술
요즘에 ChatGPT처럼 AI에 대한 이야기들이 상당히 뜨겁다. 그 중에서도 특히 주목받고 있는 기술이 있는데, 바로 오픈 AI에서 만든 Whisper라는 인공지능이다. Whisper는 음성을 텍스트로 변환하는 STT(Speech To Text) 기술을 활용하고 있다. 그런데 Whisper라는 이름을 듣고 바로 속삭이는 소리를 생각하시는 분들이 계실 수도 있을까? Whisper가 속삭이는 소리를 듣고 텍스트로 변환해줄 수 있을까? 아마 그럴 것 같다!
Whisper.cpp: C++로 포팅된 Whisper
Whisper를 다른 컴퓨터에서도 사용할 수 있도록 하는 Whisper.cpp라는 프로젝트가 있다. 이 프로젝트는 Whisper를 C++로 포팅한 것으로, 다양한 플랫폼에서 Whisper를 활용할 수 있게 해줍니다. 그런데 C++로 포팅한다는 것이 무슨 뜻일까? 간단하게 말하면, Whisper가 여행을 가서 다른 컴퓨터에서도 살 수 있게 된 것이다!
Core ML: Apple의 머신러닝 프레임워크
또한, 애플 실리콘에서도 Whisper를 활용할 수 있도록 Core ML을 사용하는 구현체도 있다. Core ML은 애플이 개발한 머신러닝 프레임워크로, iOS, macOS 등에서 머신러닝 모델을 쉽게 통합할 수 있게 해준다.
마치며
오늘은 Whisper, Whisper.cpp, 그리고 Core ML에 대해 간단히 알아보았다. 이러한 기술들을 활용하면 우리의 애플리케이션은 더욱 다양한 방식으로 사용자와 소통할 수 있게 될 것이다. 그런데 이 모든 기술들을 알아보고 나니, 이런 기술들을 사용해서 어떤 멋진 애플리케이션을 만들 수 있을지 상상이 가득 차오른다. 아마 여러분들도 그렇겠지?!
감사합니다. 그리고 다음에 또 만나요!
자비스가 나타났다
눈치챘으려나?
위의 글은 약간의 수정을 거치긴 했지만 ChatGPT 가 써줬다.
위에서 잘 설명해 줬지만, 내 음성을 텍스트로 바꿔주는 Whisper (속삭이다)라는 매우 성능이 뛰어난 인공지능 모델을 https://github.com/ggerganov/whisper.cpp 의 CoreML 구현체를 통해 맥에서 실행할 수 있다는, 다소 기술적인 이야기이다.
날먹 블로거가 되어보겠습니다
Whisper를 써보자
내 맥북에서 실행시켜 보다가 재밌는 생각이 들어서, openai, whisper ai, whisper.cpp
정도의 키워드만 갖고서 혼자서 떠들어댔다. (유튜브에서 자막을 켜면 whisper 가 시간별로 인식한 자막을 볼 수 있다)
그 음성을 Whisper 한테 넘겨서 대본 형태로 바꿨다.
안녕하세요
오늘은 제가 뭔가 그동안 블로그에서 철학이나 이런 것들에 대한 이야기만 한 것 같아서
또 제 블로그의 정체성은 또 저의 정체성은 엔지니어라는 것에 있기 때문에
오랜만에 기술에 관한 글을 써보려고 이렇게 준비를 하고 있습니다
요즘에 채 집히나 gpt 같은 어떤 ai 에 대한 이야기들이 상당히 뜨겁고 그런 상황인데 오늘은 조금 재미있는 기술을 갖고 왔습니다
바로 오픈 ai 에서 만든 위스퍼라는 인공지능인데요
쉽게 생각을 하면 stt 라고 말을 하는데 speech to text 라고 말을 하면
그거를 이제 글자로 바꿔주는 그런 인공지능들을 말합니다
흔히 생각할 수 있는 것은 그 구글에서 만든 유튜브의 자동 자막 기능이라던가 아니면 클로바 노트
혹은 이제 여러분들의 키보드에 달려있는 실시간으로 인식되는 그런 음성 인식 기능들도 그런 것들의 한 예시가 될 수 있겠는데요
아마 아시겠지만 굉장히 정확도가 사실은 높지 않고 뭔가 중요한 키워드들이나 그런 것들에 대해서는 사실은 좀 잘 알아듣지 못하는 그런 모습들을 보입니다
그리고 또 이제 뭔가 역동적인 상황에서는 잘 인식하지 못한다던가 이렇게 배경음악이 있으면 그걸 잘 걸러내주지 못한다는 그런 문제점들이 있는데요
위스퍼를 사용하는 방법들에 대해서 이야기를 한번 해보면 좋을 것 같아서 오늘 글을 준비를 했습니다
그래서 위스퍼를 사용하려고 하면 사실은 제약 조건이 좀 있어요
바로 엔비디아 그래픽 카드를 가지고 있어야 된다는 겁니다
엔비디아 rtx 3000번 때 이상의 그래픽 카드를 갖고 있어야 사용이 가능하다라고 이야기를 하는데
재미있게도 그리고 감사하게도 이거를 다른 컴퓨터에서도 사용할 수 있도록 위스퍼를 cpp 라는 게 있어요
위스퍼를 c++ 로 포팅을 해 둔 그런 프로젝트인데
정말 감사하게도 또 누군가가 이거를 이제 애플 실리콘 들에서 잘 작동할 수 있도록
코어 ML을 활용하는 구현체도 또 같이 올려져 있더라고요
그래서 오늘은 이것들에 대해서 다뤄보고 어떻게 하면 잘 사용할 수 있을지에 대해서 이야기를 해보려고 합니다
도와줘요 ChatGPT!
ChatGPT 한테 이렇게 말했다. (영어로 적은걸 한국어로 번역해 둔 것이고, 원본이 궁금하면 이곳으로.)
내 음성 녹음의 텍스트 버전을 같이 보내.
네가 마크다운을 사용해서 한국어 블로그 글로 만들어줬으면 좋겠어.아래는 나의 요구사항이야:
1. 'whisper', 'whisper.cpp', 'coreml' 기술의 상세한 내용을 위해 구글에서 검색해
2. 상세한 내용을 더하면서, 글을 자연스럽게 해 주되, 읽기 깔끔하도록 해줘.
3. 글은 내가 작성한 것 같은 느낌이어야 해. 내 블로그 링크를 줄 테니, 읽고서 내 스타일로 작성해 줘.
4. 한국어로, 마크다운을 사용해서 작성해 줘. heading이나 이탈릭체 같은 것들 말이야.
꽤 놀랐다. 구글에 검색하고, 내 블로그를 몇 번 뒤지더니 약간 어색하고 딱딱하지만 쓸만한 결과가 나와서, 글을 더 다듬어달라고 부탁하고, 그 뒤에 유머를 좀 넣어달라고 했다. 물론 재미있는 유머는 안 섞인듯하다. 위의 글은 그렇게 10분도 안 돼서 얻은 결과다.
솔직히 퀄리티는 부족하지만, 여기서 몇 번 더 다듬고 자료조사를 시키면 기술적으로 의미 있는 소개글이나 입문서를 만들 수 있겠다는 생각이 들었다.
AI의 결과물이 퀄리티가 부족해도, 사람은 꽤 잘 알아먹으니까 사실 큰 문제가 안될 거라 생각한다.
그러니까 이 글은..
- 키워드 몇 개만 떠올리고
- 녹음기 앞에서 떠든 뒤에
- ChatGPT 한테 써달라고 해서 쓴 글이다.
자비스가 나타났다.
2023년 5월의 인공지능들은 이미 내 말도 잘 알아듣고, 인터넷을 뒤지거나 다른 프로그램을 사용할 줄도 알며, 그 결과를 글자들로 요약해 줄 수도 있다.
그래서 나 이제 대체되는 거야?
우리 회사가 리뷰와 관련된 제품을 만들고 있기 때문에, 얼마 전에 이런 이야기를 들었는데:
ChatGPT의 등장으로 글자 리뷰의 신뢰성은 이미 망가진 것 같다.
동영상 리뷰가 아직은 유일한 것 같다 (5년 남은 것 같다)
라는 이야기를 들었다.
매우 동의한다. 그러다 이런 생각이 들었다.
생성형 AI들이 동영상까지 진출하는 그날이 온다면, 인터넷의 콘텐츠들이 진심으로 다른 사람들에게 다가갈 수 있을까?
구글이 가짜 이미지들을 검출해 내겠다고 하지만,
인간 수준의 인공의 지능을 만들어내는 게 AI 개발의 목표인데,
그게 검출이 불가능해지는 어느 순간이 분명히 오지 않을까?
이 순간이 되었을 때 나와 이 블로그는 어떤 의미를 가질까?
나를 대체하지 않을까 하는, 요즘 다른 사람들이 하고 있는 막연한 두려움에 대해 내가 내린 결론.
내가 나로서 유일하고, 가치 있으면 된다!
조금 풀어서 이야기해볼까?
그저 학교 공부에 충실하고, 옳고 그름만을 이야기하도록 훈련받으며 자라온 공산품으로 생산되는 대신
나의 생각들을 나의 재료들로 의미 있게 담아내고
세상에 의미 있는 결과물들을 내어 사람들을 돕고
나라는 사람이 가치 있어지면 된다
라는 생각이 들었다.
그럴듯하게 적긴 했는데 내가 대단한 사람이 되어야 한다는 뜻이다.
방구석 폐인 그저머쓱;; 이
우리의 경제는 이렇게 변화해야 합니다. ~~~
라는 식의 아무리 훌륭한 분석을 인터넷에 올려도 사람들이 관심을 갖지 않지만
I will keep supporting Dogecoin
— Elon Musk (@elonmusk) June 19, 2022
테슬라를 만들고 우주에 가려는 일론 머스크가 트위터에 올리는 "Doge 만세"가 사람들에게 더 많이 도달한다.
그렇다.
어쩌면 메시지들을 너무 쉽게 만들 수 있음으로 인해
역설적으로 메신저가 중요해지는 시대가 오지 않을까 한다.
그 시대에는 대체할 수 없는 가치를 가진 메신저가 되어있는 내가 있을 것이다.
어떻게 하면 세상을 바꾸고, 대체할 수 없는 메신저가 되어있을까?
이 글을 읽고 있는 여러분들은 그 시대에는 어떤 모습일까?
'Computer Science' 카테고리의 다른 글
그래서 주석을 달라고요 달지 말라고요? (0) | 2023.02.06 |
---|---|
jest-puppeteer 를 사용하면 커버리지 측정이 안된다! (0) | 2022.01.13 |
멋있는 사람 훔쳐보기: Tiangolo (FastAPI 개발자) (0) | 2021.09.11 |
Django 를 하는데 Signal 이 왔다! (Signal 관련 유의 사항) (0) | 2021.09.01 |
Pytest 관련 짧은 팁 (0) | 2021.08.26 |