728x90
반응형

2024년 6월 기준으로 작성
 

LLM(Large Language Model) 개념
  • LLM개념
(Google)
주어진 프롬프트에 대해 인간과 유사한 응답을 생성하기 위해 방대한 양의 텍스트 데이터로 훈련된 고급 AI 모델
입니다. 이러한 모델들은 인간 언어를 이해하고 생성하는 등 다양한 작업에서 뛰어납니다. 이로 인해 다양한 응용 분야에서 매우 가치 있는 도구로 사용될 수 있습니다.

(AI와 LLM)

AI > 머신러닝 > 인공 신경망 > 딥러닝 > Gen AI > LLM 
  • 대규모 언어모델에 대한 조(A Survey of Large Language Models)  (https://arxiv.org/)

A Survey of Large Language Models

Language is essentially a complex, intricate system of human expressions governed by grammatical rules. It poses a significant challenge to develop capable AI algorithms for comprehending and grasping a language. As a major approach, language modeling has

arxiv.org

2303.18223v13-A Survey of Large Language Models
5.40MB

 

  • 최근 몇 년 동안의 대규모 언어 모델의 통계

-  사전 훈련 데이터 규모(토큰 수 또는 저장소 크기), 하드웨어 리소스 비용
- Publicly Available(공개) / Closed Source(비공개) /Pre-train Data Scale(사전훈련 데이터 규모) / RLHF(인간 피드백을 통한 강화 학습)

https://arxiv.org/

 

  • LLM 모델 종류  (노랑색은 공개, 오픈소스)
https://arxiv.org/

 

  • OpenAI (GPT 발전 기준)
https://arxiv.org/

 

구분파라미터 규모비고(허깅페이스 모델 예시)
LLM(Language Model)700억개 이상 (70B)https://huggingface.co/meta-llama/Meta-Llama-3-70B-Instruct/tree/main

meta-llama/Meta-Llama-3-70B-Instruct
SLM(Small Language Model)70억개 이하 (7B)https://huggingface.co/meta-llama/LlamaGuard-7b

meta-llama/LlamaGuard-7b

 

  • 오픈소스와 프라이빗 모델의 MMLU 벤치마크 정확도 추이(사진 = 아크인베스트)
https://www.ark-invest.com/

 

  • 인공지능의 영역
https://www.threads.net/@travelinganna/post/C7KqiMFuhiX
  • 여러가지 유형의 AI모델
https://gaiinsights.com/blog/10-types-of-generative-ai
  • 국가별 AI기업 
애널리틱스 인사이트

 

Open Ko-LLM Leaderboard - a Hugging Face Space by upstage

huggingface.co

 
 

LLM 생성과정  (추가 편집 예정)
  1. 데이터 수집 및 준비
  2. 모델 설계
  3. 모델 학습
  4. 평가 및 검증
  5. 배포 및 유지보수

 

LLM 관련 용어
  • 토큰화(tokenization) : 텍스트를 작은 단위로 나누는 과정 (I am a boy!) I, am, a, boy!
  • 정규화(표준화) : eat, eats, ate, eating --> eat으로 표준화화
  • 모델의 실행 성능과 효율성을 향상을 위신경망의 가중치(weight)와 활성화 함수(activation function) 출력을 더 작은 비트 수로 표현하도록 변환하는 기술을 말한다.
LLM 활용 방법

 

  • 파인튜닝 : 

 
 

  • RAG(Rettieval-Augmented Generation) : 

 
수정중
2024.6.12
 
 
 
 
 
 

728x90
반응형
LIST

+ Recent posts