LLM 최종 수정일 2026-06-19 01:20 조회수 6
대시보드

LLM

기본 정보

  • 명칭: LLM
  • 영문명: Large Language Model
  • 한글명: 대규모 언어 모델
  • 분류: 생성형 인공지능(Generative AI)
  • 주요 용도: 자연어 이해 및 생성
  • 관련 주제: #LLM #AI #NLP #Transformer #생성형AI

개요

LLM(Large Language Model)은 대량의 텍스트 데이터를 학습하여 사람처럼 언어를 이해하고 생성하는 인공지능 모델이다.

질문에 답하거나, 문서를 요약하고, 번역하며, 프로그래밍 코드를 작성하거나 분석하는 등 다양한 자연어 처리 작업을 수행할 수 있다.

최근에는 검색, 업무 자동화, AI 비서, 코드 생성, 데이터 분석 등 다양한 분야에서 핵심 기술로 활용되고 있다.


LLM 구조

대량의 텍스트 데이터

↓

학습(Training)

↓

Transformer 모델

↓

LLM

↓

질문 입력(Prompt)

↓

추론(Inference)

↓

답변 생성

동작 과정

사용자 질문

↓

Prompt 분석

↓

Token 변환

↓

Transformer 계산

↓

다음 Token 예측

↓

문장 생성

↓

최종 답변

LLM은 문장을 이해하는 것이 아니라 다음에 올 가능성이 높은 토큰(Token)을 예측하는 방식으로 동작한다.


주요 특징

  • 자연어 이해
  • 자연어 생성
  • 코드 생성
  • 문서 요약
  • 번역
  • 질의응답
  • 문맥(Context) 이해
  • 멀티모달 확장 가능

핵심 구성 요소

Token

문장을 작은 단위로 나눈 조각이다.

예시

안녕하세요

↓

안녕

+

하세요

모델은 토큰 단위로 입력과 출력을 처리한다.


Prompt

사용자가 모델에 입력하는 명령이나 질문이다.

예시

Python으로 계산기 만들어줘.

Prompt의 품질에 따라 답변 결과가 크게 달라질 수 있다.


Context

현재 대화나 입력 문서 등 모델이 참고하는 정보이다.

Context가 길수록 더 복잡한 작업을 수행할 수 있다.


Inference

학습된 모델이 새로운 입력에 대해 답을 생성하는 과정을 의미한다.


Transformer 구조

Input

↓

Embedding

↓

Attention

↓

Feed Forward

↓

Output

현대 LLM 대부분은 Transformer 아키텍처를 기반으로 한다.


Self-Attention

문장 안에서 단어 간의 관계를 계산하는 핵심 메커니즘이다.

예시

철수는 학교에 갔다.

그는 공부를 했다.

↓

"그는"

=

"철수"

문맥을 파악하는 데 중요한 역할을 한다.


학습 과정

인터넷 문서

↓

책

↓

논문

↓

코드

↓

사전학습(Pretraining)

↓

미세조정(Fine-tuning)

↓

LLM 완성

대표 활용 분야

  • AI 챗봇
  • 코드 생성
  • 문서 작성
  • 번역
  • 검색
  • 고객 상담
  • 교육
  • 데이터 분석

대표 모델

  • GPT 계열
  • Gemini
  • Claude
  • Llama
  • Mistral
  • Qwen
  • DeepSeek

각 모델은 구조와 학습 방식, 라이선스 정책 등에 차이가 있다.


LLM과 검색 엔진 차이

LLM검색 엔진
답변 생성문서 검색
문맥 이해키워드 중심
자연스러운 대화링크 제공 중심
창의적 생성 가능기존 정보 제공

LLM과 머신러닝 비교

머신러닝LLM
특정 작업 중심범용 언어 처리
데이터별 모델 구축하나의 모델로 다양한 작업 수행
입력·출력 제한자연어 기반 인터페이스
기능별 개발 필요프롬프트만으로 작업 가능

장점

  • 자연스러운 대화 가능
  • 다양한 작업 수행
  • 코드 생성 지원
  • 생산성 향상
  • 문서 요약 및 분석 가능
  • 자동화에 활용 가능

단점

  • 잘못된 정보를 생성할 수 있음(Hallucination)
  • 최신 정보가 항상 반영되는 것은 아님
  • 추론 비용이 높음
  • 긴 문맥에서는 성능 저하 가능
  • 학습 데이터 편향의 영향을 받을 수 있음

RAG와 관계

사용자 질문

↓

검색(Retrieval)

↓

관련 문서

↓

LLM

↓

정확한 답변 생성

RAG(Retrieval-Augmented Generation)는 외부 지식을 함께 활용하여 답변 정확도를 높이는 기법이다.


AI 에이전트와 관계

사용자

↓

LLM

↓

Agent

↓

Tool

↓

API

↓

Database

↓

실행 결과

LLM은 AI 에이전트의 핵심 추론 엔진으로 활용된다.


실무 메모

실무에서는 다음과 같은 방식이 권장된다.

  • 명확한 Prompt 작성
  • RAG와 함께 활용하여 최신 정보 보강
  • Function Calling 또는 Tool Calling 적용
  • 출력 형식을 JSON 등으로 제한
  • 민감한 데이터는 별도 보호
  • 프롬프트 인젝션 방어 고려
  • 토큰 사용량 모니터링
  • 캐싱(Cache) 전략 적용
  • 응답 검증 로직 추가
  • 사용자 피드백 기반 지속 개선

LLM과 함께 사용하는 기술


대표 개발 도구 및 프레임워크

  • Hugging Face Transformers
  • LangChain
  • LlamaIndex
  • Ollama
  • vLLM
  • LM Studio

관련 문서


출처

  • Attention Is All You Need (Transformer 논문)
  • Hugging Face 공식 문서
  • Google Machine Learning Glossary