1) LLM의 정의
- Large Language Model = 대규모 언어 모델
- "Large"는 수십억~수천억 개의 파라미터를 가진다는 의미
- 사람처럼 자연스러운 언어 이해와 생성 가능
2) 작동 원리
LLM은 딥러닝(특히 Transformer 구조) 기반으로 동작합니다. 기본 원리는 간단히 말해 다음에 올 단어를 확률적으로 예측하는 것입니다.
예시:
- 입력: "오늘 날씨가"
- 출력: "맑습니다" (가장 확률 높은 단어 선택)
즉, 문맥(Context)을 이해하고 가장 적절한 단어와 문장을 이어 나가는 방식입니다.
3) 대표적인 LLM 사례
- GPT 시리즈 (OpenAI) → GPT-3.5, GPT-4, GPT-5
- LLaMA (Meta)
- Gemini (Google DeepMind)
- Claude (Anthropic)
- Mistral, Falcon (오픈소스 모델들)
4) LLM의 한계
- 환각(Hallucination): 사실처럼 보이지만 틀린 답변 생성
- 비용 문제: 훈련과 운영에 GPU 자원 많이 필요
- 편향성: 학습 데이터에 따라 특정 의견이나 시각 편중 가능
- 보안/윤리 문제: 개인정보 노출, 저작권 이슈
'Etc' 카테고리의 다른 글
| AI Agent란 (0) | 2026.03.01 |
|---|---|
| 버전락 (0) | 2026.02.01 |
| Lock에 대해서 (0) | 2026.01.25 |
| 검색형 ai 도구 - Perplexity (0) | 2026.01.25 |
| 코드가드 가 뭐지? (1) | 2026.01.18 |