검색 증강 생성 한국말도 어렵구만.
-----------------
https://www.datanet.co.kr/news/articleView.html?idxno=193548
RAG, LLM 정확도 높이는 도구
환각현상이 생기는 이유는 AI가 학습한 정보를 조합해 답을 꺼낼 때 때 왜곡이 생기기 때문이다. 그래서 검색 범위를 좁혀 거짓된 답이 나올 수 있는 가능성을 줄이는 검색 증강 생성(RAG)이 주목받고 있다. RAG는 사전 학습된 대규모 언어모델과 외부 검색 또는 검색 메커니즘을 결합한 기술이다.
RAG는 ▲검색기(Retriever) ▲생성기(Generator) ▲증강 방법(Augmentation Method)의 세가지 주요 구성요소로 이뤄진다.
검색기는 대규모 데이터 집합에서 정보를 찾아 텍스트 생성을 위한 데이터를 준비한다. 특정 분야 전문지식이나 사실 확인이 필요한 부분에서 검색 기능은 특히 중요하다. LLM의 일반 지식과 현재 맥락에서 정확한 정보의 차이를 해결하기 위해 정확한 의미론적 표현을 추출하고, 사용자 질의와 검색 대상 문서에서 일치된 데이터를 찾는다. 검색 결과를 기반으로 최종 답변을 도출하는 생성기와, 생성기의 답변에 추가 정보를 더하는 증강방법으로 정확한 답변을 내놓는다.
-----------------
RAG(Retrieval-Augmented Generation)는 대규모 언어 모델의 출력을 최적화하여 응답을 생성하기 전에 학습 데이터 소스 외부의 신뢰할 수 있는 지식 베이스를 참조하도록 하는 프로세스입니다.
RAG stands for Retrieval-Augmented Generation. It’s a technique in natural language processing (NLP) that combines the strengths of retrieval-based and generation-based models. Here’s a breakdown of how it works and its applications:
- Retrieval: The system first searches through an external dataset or document collection to find relevant pieces of information based on the input query1.
- Augmentation: The retrieved information is then used to enhance the input query, providing additional context and details1.
- Generation: Finally, the augmented input is used to generate a more informative, accurate, and contextually relevant response1.
RAG is particularly useful for tasks that require understanding and synthesizing information from large knowledge bases, such as:
- Question Answering: Providing precise answers by retrieving relevant information and generating a coherent response2.
- Text Summarization: Summarizing long documents by retrieving key points and generating concise summaries3.
- Dialogue Systems: Enhancing chatbot responses by retrieving relevant context and generating more accurate replies2.
In the article you mentioned, the author is likely referring to how different language models perform in these RAG-specific tasks. Cohere’s Command-R seems to have impressed them with its ability to ground prompts and provide useful insights from source documents.
--------------
https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/
-----------------
Cohere.ai prompting document
'IT이야기' 카테고리의 다른 글
Intel - AMD - nVidia data center 매출 (0) | 2024.09.03 |
---|---|
Fedora - CentOS Stream - Redhat (0) | 2024.08.27 |
AI시대 다시 주목받는 AMD 라데온 24GB 그래픽카드, AMD EPYC CPU (0) | 2024.08.19 |
Docusign 도큐사인 같은 전자서명 회사 (0) | 2024.08.19 |
Intel 역사상 최악의 날 (0) | 2024.08.03 |