'models'에 해당되는 글 1건

  1. 2024.06.25 Coding AI model - Deepseek-V2
IT이야기2024. 6. 25. 02:53

AI가 coding을 도와주는 모델은 나날이 발전하고 있는데요, 예전에 코딩 AI모델 리스트를 여기서 볼수 있다고 정리했는데요.

https://orunson.tistory.com/entry/Python-AI-programming-helper

 

파이썬 Python AI programming helper

Python programming에 도움줄 AI programming helper는 어떤것이 좋을까. 잘 테스트해서 리스트를 계속 업데이트하고 있다13B LosslessMegaCoder15B WizardCoder2.8B Phi-26.8B Magicoder-S-DShttps://huggingface.co/spaces/mike-ravkine/ca

orunson.tistory.com

 

지금 리스트를 다시 확인하니,

LLama 3 Instruct도 좋고

DeepSeek-Coder-V2-Lite-Instruct 가 들어와 있습니다. DeepSeek에 대해서 좀 더 알아보니,

 

DeepSeek-V2

> Today, we’re introducing DeepSeek-V2, a strong Mixture-of-Experts (MoE) language model

중국회사라고 소개하고 있네요

> DeepSeek (深度求索), founded in 2023, is a Chinese company dedicated to making AGI a reality.

상당히 작은 parameter숫자로도 높은 성능을 낼수 있다는 주장입니다. 코드 model도 괜찮은 편이라고 합니다.

https://huggingface.co/deepseek-ai/DeepSeek-V2

 

deepseek-ai/DeepSeek-V2 · Hugging Face

Model Download | Evaluation Results | Model Architecture | API Platform | License | Citation Paper Link👁️ DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model 1. Introduction Today, we’re introducing DeepSeek-V2, a stro

huggingface.co

 

 

'IT이야기' 카테고리의 다른 글

Intel 역사상 최악의 날  (0) 2024.08.03
Why Databricks is using AMD GPUs  (0) 2024.07.25
nVidia 매일 매달 역사를 새로 씁니다  (0) 2024.06.08
AMD AI PC and Computex 2024  (0) 2024.06.03
nVidia AMD AI 가속기 HBM 일정정리표  (0) 2024.05.30
Posted by 쁘레드