용어집

언어 모델링

언어 모델링이 고급 기술을 통해 텍스트 생성, 기계 번역, 음성 인식과 같은 NLP 및 AI 애플리케이션을 어떻게 지원하는지 알아보세요.

YOLO 모델을 Ultralytics HUB로 간단히
훈련

자세히 알아보기

언어 모델링은 인공 지능(AI)자연어 처리(NLP)의 기본 작업입니다. 언어 모델링의 주요 목표는 인간의 언어를 이해하고, 생성하고, 예측할 수 있는 시스템을 구축하는 것입니다. 언어 모델의 핵심은 방대한 양의 텍스트 데이터를 기반으로 단어(또는 문자 또는 토큰) 시퀀스의 확률 분포를 학습하는 것입니다. 이를 통해 모델은 특정 문장이나 구문이 자연스럽게 발생할 가능성을 판단하여 다양한 언어 관련 작업을 효과적으로 수행할 수 있습니다. 이는 가상 비서부터 정교한 텍스트 편집기에 이르기까지 많은 최신 AI 애플리케이션을 구동하는 초석 기술입니다.

언어 모델링의 작동 방식

언어 모델은 학습된 텍스트 데이터의 패턴, 문법, 문맥 관계를 분석하여 작동합니다. 초기 접근 방식은 앞의 'n'개의 단어를 기반으로 한 단어의 확률을 계산하는 n-그램과 같은 통계적 방법에 의존했습니다. 이러한 방법은 유용하지만, 장거리 종속성과 더 깊은 의미적 의미를 포착하는 데 어려움을 겪는 경우가 많았습니다.

딥 러닝(DL) 의 등장으로 언어 모델링이 크게 발전했습니다. 다음과 같은 신경망(NN) 아키텍처가 크게 발전했습니다:

이러한 신경 모델은 일반적으로 다음과 같은 프레임워크를 사용하여 학습됩니다. PyTorch 또는 TensorFlow 와 같은 프레임워크를 사용하여 대규모 텍스트 코퍼스를 학습하고, 역전파 등의 기법을 통해 복잡한 언어적 특징을 학습합니다.

언어 모델링의 응용

단어 시퀀스를 예측하고 이해하는 능력은 언어 모델링을 매우 다양하게 활용할 수 있게 해줍니다. 다음은 몇 가지 주요 애플리케이션입니다:

  • 예측 텍스트 및 자동 완성: 스마트폰 키보드가 다음 단어를 제안하거나 검색 엔진이 검색어를 완성할 때 언어 모델이 작동하여 지금까지 입력된 내용을 바탕으로 가장 가능성이 높은 연속 문장을 예측합니다. 이는 Google 스마트 컴포즈와 같은 도구에서 볼 수 있듯이 사용자 경험과 타이핑 속도를 향상시킵니다.
  • 기계 번역: Google 번역과 같은 도구는 종종 시퀀스 간 모델을 기반으로 하는 정교한 언어 모델을 사용하여 언어 간 텍스트를 정확하고 유창하게 번역합니다. 이 모델은 언어 간의 정렬을 학습하고 의미와 문법 구조를 보존하는 번역을 생성합니다. 자세한 내용은 기계 번역 용어집 항목을 참조하세요.
  • 음성 인식: 음성 언어를 텍스트로 변환하려면 오디오 입력에 해당하는 가장 가능성이 높은 단어의 순서를 예측해야 하며, 이를 통해 Apple의 Siri와 같은 기술을 구동합니다.
  • 텍스트 생성: 기사, 요약, 대화 시스템(챗봇) 및 창의적인 글쓰기를 위한 사람과 유사한 텍스트 생성.
  • 감정 분석: 텍스트에 표현된 감정 어조(긍정, 부정, 중립)를 파악하는 것으로, 고객 리뷰나 소셜 미디어 분석에 자주 사용됩니다.
  • 질문 답변: 앨런 인공지능 연구소에서 개발한 시스템처럼 자연어로 제기된 질문을 이해하고 주어진 맥락이나 지식 기반에 따라 적절한 답변을 제공합니다.

관련 개념

언어 모델링과 관련 용어를 구분하는 것이 도움이 됩니다:

모두 보기
OSZAR »