본문 바로가기
웹개발/IT 사전

[AI]LLM(Large Language Model)

by 지구별 여행자 임탱 2024. 3. 25.
728x90

LLM(Large Language Model)은 대규모 언어 모델을 의미합니다. 이러한 모델들은 대량의 텍스트 데이터를 학습하여, 자연어 이해(Natural Language Understanding, NLU) 및 자연어 생성(Natural Language Generation, NLG)과 같은 다양한 자연어 처리 작업을 수행할 수 있습니다. LLM은 인공 지능(AI) 및 기계 학습(ML) 분야에서 중요한 발전을 이끌어내고 있으며, 특히 딥러닝 기술에 기반하여 구축됩니다.

특징 및 기능
  - 대규모 데이터 학습: LLM은 인터넷에서 수집한 방대한 양의 텍스트 데이터를 학습합니다. 이 데이터에는 웹사이트, 책, 기사 등 다양한 소스의 텍스트가 포함됩니다.
  - 언어 이해 및 생성: 학습된 데이터를 바탕으로, LLM은 주어진 텍스트의 의미를 이해하고, 새로운 텍스트를 생성할 수 있습니다. 예를 들어, 질문에 대한 답변을 생성하거나, 주어진 문장을 다른 언어로 번역하는 작업을 수행할 수 있습니다.
  - 다양한 언어 및 도메인 지원: 대규모 언어 모델은 다양한 언어와 전문 분야에 대한 정보를 포함하고 있어, 여러 언어 및 도메인에 걸쳐 유연하게 작업을 수행할 수 있습니다.
  - 자기 지도 학습(Self-Supervised Learning): 대부분의 LLM은 자기 지도 학습 방식으로 훈련됩니다. 즉, 레이블이 지정되지 않은 데이터를 사용하여 스스로 학습하는 방식입니다. 이는 모델이 문맥을 기반으로 단어나 문장의 다음 부분을 예측하도록 학습함으로써 가능해집니다.


대표적인 예
  - GPT 시리즈(Generative Pre-trained Transformer): OpenAI에 의해 개발된 GPT 시리즈는 대표적인 LLM 중 하나입니다. GPT-3는 특히 그 규모와 성능으로 주목받았습니다.
  - BERT(Bidirectional Encoder Representations from Transformers): 구글에 의해 개발된 BERT는 텍스트의 양방향적인 문맥을 이해하는 데 초점을 맞춘 모델입니다. 이 모델은 특히 자연어 이해 작업에서 뛰어난 성능을 보입니다.

 

LLM은 주어진 프롬프트에 대해 인간과 유사한 응답을 생성하기 위해 방대한 양의 텍스트 데이터로 훈련된 고급 AI모델입니다.

 

'웹개발 > IT 사전' 카테고리의 다른 글

프롬프트 엔지니어  (0) 2024.03.26
애자일 방법론  (0) 2024.03.26
정보보호  (0) 2024.03.21
스마트 워크  (0) 2024.03.21
[웹 이론]절대경로와 상대경로  (0) 2024.03.07