'OpenAI'에 해당되는 글 2건

  1. 2023.06.22 한국어는 AI가 인식하기 좋을까?
  2. 2023.02.06 OpenAI ChatGPT 연결오류
IT이야기2023. 6. 22. 09:09

한국은 IT강국일까 아닐까 한다면 대체로 한국사람들은 IT강국이 아니다는 것을 잘 알고 있을것 같다. 세계 최고의 인터넷 속도는 이미 일찍 이뤘지만 그것으로 뭘 할지 생각이 없어으니, 그러면서 인터넷은 포탈, 지식인, 인테넷 뱅킹 처럼 한국적이고 폐쇄적인 서비스만 많아졌는데...

한국어는 디지털시대에 너무 잘 만든 언어라 생각이 된다. 우리 주변국인 중국과 일본언어를 보면 더욱 그러하다. 세종대왕께서 디지털 시대를 예상하시고 이것으로 대대후손이 인터넷 기술강국으로 우뚝 서서 많은 풍요를 누리라고 해 주신건데... 이미 초기 디지털 시기와 인터넷 시기에 한국어는 인구비율에도 못미치는 인기를 얻고 있고. AI 서비스가 막 시작하는 지금, 더욱 뒤쳐지지 않을까 우려된다. 그 다음에 올 새로운 wave에는 인구가 반으로 줄어가고 있을터라 다른 방법은 없을텐데...

OpenAI가 만든 Whisper모델을 보고 있으니, 인식률이 너무 좋아 기가막인데, 영어, 스페니쉬가 인식이 잘되는 건 그렇다고 쳐도, 일본어도 상위 6위인데 한국어는 저 바닥이라니... 내가 한국 사람이라 그런것 만은 아니고 한국어는 딱딱 끊어지니 한국어 인식은 영어에 비해서 엄청 쉽겠다 생각하고 그렇다고 전문가들에게 들은것 같은데. 인구수가 적은것 만으로 해석할수는 없고, 한국은 갈라파고스되어 있고 인구도 적은 한국어를 지원해서 얻는게 없어서 노오력(training)을 안하고 있는거 아닐지. 한국은 AI시대에서도 또 뒤쳐지고 뒤만 따라가는 운명일런지... 

openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision (github.com)

 

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

Robust Speech Recognition via Large-Scale Weak Supervision - GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

github.com

 

오류률이라 낮을 수록 좋음.

Posted by 쁘레드
IT이야기2023. 2. 6. 14:10

아마도 사용자수와 사용량, query는 exponential 하게 증가하는데 현재 사용하는 MS(Microsoft) Azure 클라우드가 못따라가는 것 같음. Azure가 할수 있다고 해도 비용이 너무 많아서 감당이 안되는 상황인것 같음.

MS가 투자도 더 많이하고 현재 MS오피스나 다른 서비스에도 다 추가하려고 하는데, 이 많은 비용을 어떻게 나중에라도 pay off할수 있을지가 핵심일 것으로 보입니다. 몇년내에는 이것으로 돈을 벌수는 없을듯.

 

Update: Server blown up, Running maximum capacity.

Posted by 쁘레드