IT이야기2023. 6. 22. 09:09

한국은 IT강국일까 아닐까 한다면 대체로 한국사람들은 IT강국이 아니다는 것을 잘 알고 있을것 같다. 세계 최고의 인터넷 속도는 이미 일찍 이뤘지만 그것으로 뭘 할지 생각이 없어으니, 그러면서 인터넷은 포탈, 지식인, 인테넷 뱅킹 처럼 한국적이고 폐쇄적인 서비스만 많아졌는데...

한국어는 디지털시대에 너무 잘 만든 언어라 생각이 된다. 우리 주변국인 중국과 일본언어를 보면 더욱 그러하다. 세종대왕께서 디지털 시대를 예상하시고 이것으로 대대후손이 인터넷 기술강국으로 우뚝 서서 많은 풍요를 누리라고 해 주신건데... 이미 초기 디지털 시기와 인터넷 시기에 한국어는 인구비율에도 못미치는 인기를 얻고 있고. AI 서비스가 막 시작하는 지금, 더욱 뒤쳐지지 않을까 우려된다. 그 다음에 올 새로운 wave에는 인구가 반으로 줄어가고 있을터라 다른 방법은 없을텐데...

OpenAI가 만든 Whisper모델을 보고 있으니, 인식률이 너무 좋아 기가막인데, 영어, 스페니쉬가 인식이 잘되는 건 그렇다고 쳐도, 일본어도 상위 6위인데 한국어는 저 바닥이라니... 내가 한국 사람이라 그런것 만은 아니고 한국어는 딱딱 끊어지니 한국어 인식은 영어에 비해서 엄청 쉽겠다 생각하고 그렇다고 전문가들에게 들은것 같은데. 인구수가 적은것 만으로 해석할수는 없고, 한국은 갈라파고스되어 있고 인구도 적은 한국어를 지원해서 얻는게 없어서 노오력(training)을 안하고 있는거 아닐지. 한국은 AI시대에서도 또 뒤쳐지고 뒤만 따라가는 운명일런지... 

openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision (github.com)

 

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

Robust Speech Recognition via Large-Scale Weak Supervision - GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

github.com

 

오류률이라 낮을 수록 좋음.

Posted by 쁘레드