IT이야기2024. 9. 1. 04:20

검색 증강 생성 한국말도 어렵구만.

-----------------

https://www.datanet.co.kr/news/articleView.html?idxno=193548

RAG, LLM 정확도 높이는 도구
환각현상이 생기는 이유는 AI가 학습한 정보를 조합해 답을 꺼낼 때 때 왜곡이 생기기 때문이다. 그래서 검색 범위를 좁혀 거짓된 답이 나올 수 있는 가능성을 줄이는 검색 증강 생성(RAG)이 주목받고 있다. RAG는 사전 학습된 대규모 언어모델과 외부 검색 또는 검색 메커니즘을 결합한 기술이다. 

RAG는 ▲검색기(Retriever) ▲생성기(Generator) ▲증강 방법(Augmentation Method)의 세가지 주요 구성요소로 이뤄진다.

검색기는 대규모 데이터 집합에서 정보를 찾아 텍스트 생성을 위한 데이터를 준비한다. 특정 분야 전문지식이나 사실 확인이 필요한 부분에서 검색 기능은 특히 중요하다. LLM의 일반 지식과 현재 맥락에서 정확한 정보의 차이를 해결하기 위해 정확한 의미론적 표현을 추출하고, 사용자 질의와 검색 대상 문서에서 일치된 데이터를 찾는다. 검색 결과를 기반으로 최종 답변을 도출하는 생성기와, 생성기의 답변에 추가 정보를 더하는 증강방법으로 정확한 답변을 내놓는다. 
-----------------

RAG(Retrieval-Augmented Generation)는 대규모 언어 모델의 출력을 최적화하여 응답을 생성하기 전에 학습 데이터 소스 외부의 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스입니다.

RAG stands for Retrieval-Augmented Generation. It’s a technique in natural language processing (NLP) that combines the strengths of retrieval-based and generation-based models. Here’s a breakdown of how it works and its applications:

  1. Retrieval: The system first searches through an external dataset or document collection to find relevant pieces of information based on the input query1.
  2. Augmentation: The retrieved information is then used to enhance the input query, providing additional context and details1.
  3. Generation: Finally, the augmented input is used to generate a more informative, accurate, and contextually relevant response1.

RAG is particularly useful for tasks that require understanding and synthesizing information from large knowledge bases, such as:

In the article you mentioned, the author is likely referring to how different language models perform in these RAG-specific tasks. Cohere’s Command-R seems to have impressed them with its ability to ground prompts and provide useful insights from source documents.

--------------

https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/

 

RAG란? - 검색 증강 생성 AI 설명 - AWS

시맨틱 검색은 방대한 외부 지식 소스를 LLM 애플리케이션에 추가하려는 조직의 RAG 결과를 향상시킵니다. 오늘날의 기업은 매뉴얼, FAQ, 연구 보고서, 고객 서비스 가이드, 인사 관리 문서 리포지

aws.amazon.com

 

-----------------

Cohere.ai prompting document

https://docs.cohere.com/docs/prompting-command-r

Posted by 쁘레드
IT이야기2024. 8. 19. 09:28

AI시대 다시 주목받는 AMD Radeon RX 7900 XTX 24GB

AMD 라데온 Radeon은 원래 성장형 그래픽카드로 유명한데, 벌써 출시된지 2년이 다되어 가기도 해서 이미 성장(?)도 많이 했지만 외장 그래픽카드중에 24GB 메모리를 가진것을 찾기가 너무 어렵다 보니 다시 주목을 받고 있습니다. AI 추론용으로 쓰려면 GPU memory에 model을 올려놓고 써야하는데 24GB가 갖는 강점은 너무 강합니다. 속도가 조금 느린것은 참을 수 있지만, 돌릴 수 없는 것은 못참지요.

Ebay중고가를 살펴보니 800불 정도에 구매할수 있네요. 그래서 가격벙어도 잘되고 있습니다.

AI시대 주목받는 EPYC CPU

AI 모델을 돌리려면 GPU만 가능할거라 생각하지만 AMD는 64/128 코어를 가진 EPYC을 오래전부터 만들어왔습니다. 시스템 메모리가 DDR4/DDR5이지만 대체로 EPYC은 최소 64GB부터 256GB까지 큰 메모리를 갖춘 시스템이 많습니다. 상대적으로 큰 AI모델을 시스템 메모리에 올리고 chatgpt같은 app을 돌리면 속도는 물론 GPU로 돌렸을때 보다 느리지만 모델이 크다보니 상당히 quality있는 답을 얻을 수 있습니다. 그리고 강력한 CPU thread가 많다보니 생각보다는 느리지도 않습니다. 소비자용 GPU 로는 24GB가 max이지만 system memory는 5-10배는 더 크기 때문에 못돌리는 모델도 돌려볼 수 있습니다. 80GB 사이즈 되는 모델을 돌려보고 오, 결과가 상당히 좋은데 했습니다. 돌릴 system이 있다면 한번 돌려보시길 강추.

Posted by 쁘레드
경제이야기/Stock2024. 8. 1. 05:01

AMD가 Data Center매출 호조와 guidance를 높인것에 힘입어 전체 반도체 주가를 견인하는 역할을 했습니다. 그러나 정작 본인은 NVidia에 비해 주목을 덜 받는 웃픈일이 생겼습니다. ㅋㅋㅋㅋ

장중에는 AMD는 상승분을 다 반납하고 2%대도 있었고 그 와중에 NVidia는 계속 +10%로 폭등중.

AMD정도가 이렇게 좋다면 NVidia는 얼마나 더 좋을까 이렇게 사고가 흘러가는것 같음.

Posted by 쁘레드
IT이야기2024. 7. 25. 03:52

AI Data 기업인 databricks에서는 저렴한 솔루션은 AMD GPU를 통해서 제공하고 있습니다. 물론 대부분은 NVidia GPU를 사용할수 밖에 없지만 작년 6월에 AMD솔류션을 써왔던 MosaicML을 인수하면서 가격대비 성능을 중시하는 고객을 위한 시장을 미리 생각했던것 같습니다. 작년에 읽은 기사인데 지금보니 더 의미가 있는것 같습니다. 시장을 잘 읽고 있는것 같습니다.

----------------

데이터브릭스와 AMD 파트너십: 데이터브릭스는 대규모 언어 모델(LLM) 학습을 위해 MI250과 같은 AMD GPU를 사용하는 AMD와 파트너십을 맺었습니다. 이 파트너십은 상당한 성능 향상을 가져왔습니다.
소프트웨어 혁신: AMD의 ROCm 소프트웨어 플랫폼은 OpenAI Triton 컴파일러에 대한 상당한 업그레이드와 기여를 통해 성공의 핵심 요소로 부각되고 있습니다.
성능 향상: 데이터브릭스는 ROCm 5.7 및 플래시어텐션-2와 함께 트레이닝 성능을 1.13배 향상시켰으며, GPU 클러스터를 통해 강력한 확장성을 입증했습니다.
향후 전망: 데이터브릭스 및 기타 기업들은 AI 트레이닝 능력을 더욱 향상시킬 것으로 기대되는 AMD의 MI300X GPU의 출시를 고대하고 있습니다.

-----------------

Why Databricks is Using AMD GPUs
https://analyticsindiamag.com/ai-origins-evolution/why-databricks-is-using-amd-gpus/

Posted by 쁘레드
IT이야기2024. 6. 25. 02:53

AI가 coding을 도와주는 모델은 나날이 발전하고 있는데요, 예전에 코딩 AI모델 리스트를 여기서 볼수 있다고 정리했는데요.

https://orunson.tistory.com/entry/Python-AI-programming-helper

 

파이썬 Python AI programming helper

Python programming에 도움줄 AI programming helper는 어떤것이 좋을까. 잘 테스트해서 리스트를 계속 업데이트하고 있다13B LosslessMegaCoder15B WizardCoder2.8B Phi-26.8B Magicoder-S-DShttps://huggingface.co/spaces/mike-ravkine/ca

orunson.tistory.com

 

지금 리스트를 다시 확인하니,

LLama 3 Instruct도 좋고

DeepSeek-Coder-V2-Lite-Instruct 가 들어와 있습니다. DeepSeek에 대해서 좀 더 알아보니,

 

DeepSeek-V2

> Today, we’re introducing DeepSeek-V2, a strong Mixture-of-Experts (MoE) language model

중국회사라고 소개하고 있네요

> DeepSeek (深度求索), founded in 2023, is a Chinese company dedicated to making AGI a reality.

상당히 작은 parameter숫자로도 높은 성능을 낼수 있다는 주장입니다. 코드 model도 괜찮은 편이라고 합니다.

https://huggingface.co/deepseek-ai/DeepSeek-V2

 

deepseek-ai/DeepSeek-V2 · Hugging Face

Model Download | Evaluation Results | Model Architecture | API Platform | License | Citation Paper Link👁️ DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-Experts Language Model 1. Introduction Today, we’re introducing DeepSeek-V2, a stro

huggingface.co

 

 

'IT이야기' 카테고리의 다른 글

Intel 역사상 최악의 날  (0) 2024.08.03
Why Databricks is using AMD GPUs  (0) 2024.07.25
nVidia 매일 매달 역사를 새로 씁니다  (0) 2024.06.08
AMD AI PC and Computex 2024  (0) 2024.06.03
nVidia AMD AI 가속기 HBM 일정정리표  (0) 2024.05.30
Posted by 쁘레드
IT이야기2024. 5. 30. 12:49
Posted by 쁘레드
IT이야기2024. 3. 13. 05:38

Transformer framework/architecture 덕에 AI가 사람이 사용할만한 진전을 이루었는데, Transformer를 대체하고 AI evolution을 이끌 architecture  는 뭐가 있는지 물어보니.

Pathways를 가장 먼저 꼽니다. 이것도 구글이 만들고 있으니 장단점을 잘 알고 잘 보안할수도 있을듯. 그런데 모든 AI 모델이 transformer로 train되고 있으니, 더 좋을 것을 만들어 내더라도 전환하는데 시간이 많이 걸릴듯.

  1. Pathways by Google AI: This architecture focuses on building a single model capable of thousands of tasks by utilizing a flexible foundation and modular components. It tackles the issue of specialized models by enabling a more general-purpose approach (https://blog.google/technology/ai/introducing-pathways-next-generation-ai-architecture/).
  2. Generative AI Frameworks: These frameworks like Langchain focus on Generative AI models that create entirely new content. They leverage large language models (LLMs) like me and go beyond pattern recognition in data, aiming for a deeper understanding (https://www.analyticsvidhya.com/blog/2023/04/what-is-generative-ai/).
  3. AIfES for Edge AI: This framework targets specifically edge AI, where processing happens on devices themselves. AIfES aims for better hardware integration and flexibility to handle the evolving needs of on-device AI (https://pubmed.ncbi.nlm.nih.gov/38236682/).

-----------

  1. Pathways: Google Research is working on a next-generation AI architecture called Pathways. Unlike current models that specialize in individual tasks, Pathways aims to handle thousands or even millions of tasks simultaneously. Rather than training each model from scratch for a specific problem, Pathways synthesizes existing strengths and adapts to new tasks quickly. This architecture reflects a better understanding of the world and has the potential to tackle complex challenges we face today.
  2. Mamba: While the Transformer remains dominant, there are contenders like Mamba. Mamba achieves five times higher throughput than Transformers due to its recurrent nature. However, it’s essential to note that the Transformer is unlikely to relinquish its throne anytime soon, especially given the recent successes of language models like ChatGPT and Gemini, which build upon the Transformer’s foundation.
  3. BASED
Posted by 쁘레드
IT이야기2024. 1. 25. 01:22

https://www.ml6.eu/blogpost/unlocking-the-secrets-of-life-ai-protein-models-demystified

 

#AIinBiology #ProteinEngineering #AIProteinModels #DrugDesign #StructurePrediction #FunctionAnalysis #ArtificialIntelligence #Pr

This blogpost is aimed at those who want to understand how artificial intelligence is being implemented in the field of biology, specifically with regard to proteins. We give a brief overview of what proteins are, their characteristics and the applications

www.ml6.eu

거대 기업들의 역활을 잘 정리한것 같다

  • Google의 Deepmind는 DeepX, Alpahfold
  • Meta의 ESM
  • Microsoft의 MIF-ST

MS의 protein sequence model은 github에 PyTorch, python opensource로 공개도 되어 있다

https://github.com/microsoft/protein-sequence-models

 

GitHub - microsoft/protein-sequence-models

Contribute to microsoft/protein-sequence-models development by creating an account on GitHub.

github.com

이 리포트를 만든 사람이 다니는 회사도 상당히 재미있다. Business solution을 E2E로 지원한다고 하는데 사람 숫자는 많지 않고 machine learning과 AI관련 솔루션 정도를 소개하는 수준 정도로 일을 하는것 같다. 오피스는 독일 베를린(Berlin)과 네델란드 암스테르담(Amsterdam).

 

Posted by 쁘레드
IT이야기2024. 1. 3. 07:23

Python programming에 도움줄 AI programming helper는 어떤것이 좋을까. 잘 테스트해서 리스트를 계속 업데이트하고 있다

  • 13B LosslessMegaCoder
  • 15B WizardCoder
  • 2.8B Phi-2
  • 6.8B Magicoder-S-DS

https://huggingface.co/spaces/mike-ravkine/can-ai-code-results

 

Can Ai Code Results - a Hugging Face Space by mike-ravkine

 

huggingface.co

 

Posted by 쁘레드
IT이야기2023. 12. 6. 07:46

AI로 비디오 에디팅을 좀더 쉽게 해주는 프로그램을 찾고 있는중. 당연히 적당한 돈을 지불할 의양이 있는데, 요구사항은

  1. Auto crop
    1. 16:9로 찍은 비디오를 인스타그램 용으로 1:1 또는 vertical하게 쉽게 변경해 줄것. 사람이 있으면 object를 track해주면 좋겠음
  2. 4K Upscaling
  3. Image Stabilization 적용
  4. 화려한 color 보정
  5. de-noise
  6. 중간에 silence있는 것 자동제거
  7. (Optional) Caption 지원

Topaz AI툴이 광고를 많이 하는데, Bing과 Bard 추천리스트에는 없음

----------------

Bing

There are several AI-based video editing software available in the market. Some of the popular ones are:

Kapwing: Kapwing offers a range of AI-powered video editing tools that can help you edit, trim, and enhance your videos with ease. You can generate videos just from typing or automatically remove silence and background noise in a single click. Kapwing’s AI tools are free to get started, easy to use, and simple for anyone to learn. The best part is, they exist right in your browser, so no complicated downloads or setup are required to start 1.

Adobe Premiere Rush: Adobe Premiere Rush is a great video editor app that has several advantages in today’s world of instant video sharing on social networks. It is a free AI-based video editing software that can help you create professional-looking videos in minutes 2.

KeyFrames Studio: KeyFrames Studio is another AI-based video editing software that can help you create stunning videos with ease. It offers a range of features such as automatic video editing, video stabilization, and more 3.

Pictory.ai: Pictory.ai is an AI-based video editing software that can help you create engaging videos with ease. It offers a range of features such as automatic video editing, video stabilization, and more 3.

Munch: Munch is an AI-based video editing software that can help you create stunning videos with ease. It offers a range of features such as automatic video editing, video stabilization, and more 3.

----------------

Bard

Sure, here’s a list of some popular AI-powered video editors:

  • Synthesia: This online tool uses AI to create hyper-realistic talking avatars that can lip-sync to any script you provide. It’s perfect for creating explainer videos, product demos, and even YouTube intros.
  •  
  • Lumen5: This AI-powered video editor uses your existing content, like blog posts or articles, to automatically generate video scripts and storyboards. It’s a great way to quickly create professional-looking videos without having to start from scratch.
  • Descript: This AI-powered video editor allows you to edit your videos by simply editing the script. You can add or remove words, change the order of sentences, and even adjust the intonation of the speaker’s voice.
  • Kapwing: This free online video editor offers a variety of AI-powered features, including auto-cropping, background removal, and green screen effects. It’s a great option for creating short social media videos.
  • Adobe Premiere Pro: This industry-standard video editor now offers a number of AI-powered features, such as automatic speech recognition, scene detection, and color correction. It’s a great option for professional video editors who want to save time and improve their workflow.
  • Wondershare Filmora: This popular video editor offers a few AI-powered features, such as smart video trimming and AI music composer. It’s a good option for beginners who want to try out AI editing without having to learn a new tool.
Posted by 쁘레드