지금 꼭! 알아야 할 주요 AI 용어 총정리

이 글은 기업이 어떤 방향으로 AI를 도입하고 비즈니스를 성장시켜야 할지 판단할 수 있는 좋은 길잡이가 될 거예요. 최근 가장 주목받는 AI 용어를 정리하고, 이를 어떻게 비즈니스 자산으로 전환할 수 있는지 살펴볼게요.
Sep 23, 2025
지금 꼭! 알아야 할 주요 AI 용어 총정리

AI 기술이 걷잡을 수 없이 빠르게 성장하면서, 매일 같이 쏟아지는 AI 관련 뉴스와 용어들을 쫓아가기 버거울 때가 있죠. 하지만 기업의 의사결정자라면, 범람하는 기술 속에서 의미 있는 정보를 선택하고, 이를 어떻게 비즈니스 가치로 연결할지 파악하는 게 매우 중요해요.

지금 꼭! 알아야 할 주요 AI 용어 모음집 -중급편-

1️⃣ AI Model 🤖

AI 모델은 인공지능이 데이터를 학습하고 문제를 해결하기 위해 만들어진 구조를 뜻해요. 초기에는 단순히 텍스트를 처리하는 언어 모델을 중심으로 발전했지만, 지금은 규모와 형태가 점차 복잡하게 진화하고 있어요.

1) LLM (Large Language Model, 거대 언어 모델)

LLM은 AI 모델 대중화를 이끈 주인공이에요. 방대한 텍스트 데이터를 학습해 인간처럼 자연어를 이해하고 생성하는 AI 모델이죠.

그 중에서도 탁월한 성능을 보이는 GPT, Claude, Gemini 같은 모델들을 Frontier Model(프론티어 모델)이라고 일컫는데요. 이들은 분석, 요약, 코드 작성 등 다방면에서 뛰어난 성능을 자랑해요.

📌 대표적인 LLM 서비스

🔸 ChatGPT (OpenAI): 콘텐츠 제작, 코드 작성, 글쓰기 등 다양한 영역에 활용

🔸 Gemini (Google): 이미지와 텍스트가 결합된 멀티모달, 이미지 처리에 강점

🔸 Claude (Anthropic): 코드 작성, 디버깅, 기술 문서 정리 등 코딩에 특화

🔸 LLaMA (Meta): 오픈 소스로만 제공, 기업 맞춤형 커스터마이징 가능

여기서 중요한 점은 LLM이 무조건 크기만 해서 좋은 게 아니라는 거예요. 뛰어난 성능을 뒷받침하기 위해 막대한 비용과 자원이 필요하거든요. 이를 보완하기 위해 등장한 것이 바로 SLM이에요.

2) SLM (Small Language Model, 소형 언어 모델)

SLM은 LLM을 경량화한 모델로, 특정 도메인이나 제한된 환경에 최적화되었어요. 기업은 모든 초거대 모델 대신 SLM을 활용하여 비용 절감과 보안 강화, 온프레미스 운영 등에 이점을 가질 수 있어요. 회사 내부 문서, 매출 자료 등 특정 데이터에 특화된 작업을 수행하는 데에 주로 사용돼요.

3) VLM (Vision Language Model, 비전-언어 모델)

그러나 명석한 LLM에도 치명적인 단점이 있으니, 바로 픽셀로 구성된 시각 정보를 해석하는 능력이 부족하다는 거예요. 이를 극복하기 위해 텍스트와 이미지를 동시에 이해하고 생성하는 VLM의 중요성이 증가했어요. 이미지나 영상 등의 비언어적 정보를 해석함으로써 LLM의 한계를 보완하는 핵심 기술로 주목받아요.

Polaris Office의 AI NOVA는 다양한 LLM과 VLM을 실제 업무에 적용한 대표 사례예요. 텍스트 명령 처리부터 이미지, 표, 프레젠테이션 자료, 음성까지 다양한 형식의 입력 데이터를 이해하고 결합해 업무 맥락을 파악해요. LLM을 기반으로 문서를 작성하고, 표 데이터와 이미지 자료를 동시에 해석해 슬라이드 초안을 생성할 수도 있어요.

폴라리스 오피스 AI NOVA 바로가기
폴라리스 오피스 AI NOVA 바로가기

4) Fine tuning ⚒️

AI 모델을 단순히 학습된 상태 그대로 쓰는 것만으로는 기업마다 다른 환경을 충분히 반영하기 어려워요. 업무 특성에 맞게 다시 학습시키고 조정하는 파인 튜닝 과정을 통해 AI의 신뢰도를 높일 수 있어요.

👉 LoRA (Low-Rank Adaptation)

거대 언어 모델(LLM)을 그대로 쓰기엔 비용이 부담되고, 자사 환경에 맞지 않는 경우가 많아요. 이를 위해 LoRA는 모델 전체를 다시 학습시키는 것이 아니라, 필요한 일부 파라미터만 조정해 비용과 시간을 절약하여 맞춤형 AI를 만드는 기술이에요.

👉 RLHF (Reinforcement Learning from Human Feedback)

AI 모델이 항상 ‘사람이 원하는 방식’으로 대답하는 건 아니에요. RLHF는 사람의 피드백을 기반으로 모델의 응답 품질과 일관성을 강화하는 과정이에요. 모델이 인간의 지시를 더 잘 따르고, 안전한 응답을 생성할 수 있도록 조정해요.


2️⃣ RAG (Retrieval-Augmented Generation) 📲

LLM은 학습 이후의 새로운 정보에는 접근하지 못하기 때문에 답변의 최신성이 떨어지거나, 진위여부가 불분명할 수 있어요. 이를 보완하기 위해 외부 DB나 검색 시스템에서 관련 자료를 불러와 답변에 반영하는 RAG가 주목받고 있어요.

1) Vector Store (벡터 스토어)

먼저, RAG가 동작하려면 데이터를 저장하고 검색할 장소가 필요해요. 이때 쓰이는 것이 바로 벡터 스토어 인데요. 문서나 이미지같은 비정형 데이터를 컴퓨터가 이해할 수 있는 숫자의 배열(=벡터)로 변환하여 저장하는 곳이에요.

2) Embedding Model (임베딩 모델)

그렇다면 텍스트나 이미지 데이터를 어떻게 벡터로 바꿀 수 있는 걸까요? 바로 임베딩 모델이 그 과정을 담당하게 돼요. 데이터를 수치화하고 연관성이 높은 단어들을 거리순으로 배열하여 컴퓨터가 단어나 문장의 의미를 이해하고, 유사성을 판단할 수 있게 돼요.

3) Reranker Model (리랭커 모델)

LLM의 주요 특성 중 하나는 앞부분에 있는 정보를 더 잘 반영한다는 거예요. 그래서 RAG이 전달하는 문서의 순서를 결정하는 것도 매우 중요한데요. 리랭커는 Vector Store에서 검색된 후보 문서를 정밀하게 검사해서 가장 중요하다고 생각하는 문서를 최상단에 배치해 RAG의 검색 품질을 높이는 역할을 해요.

📌 Rag의 종류

점점 복잡해지는 데이터와 사용자 요구사항에 맞추어 RAG 역시 아래 네가지 방식으로 발전하고 있어요.

🔸 Native RAG: 질문과 관련된 정보를 문서에서 검색하여, 해당 정보를 LLM의 응답 생성에 참고하는 가장 기본적인 형태

🔸 Advanced RAG: 검색의 효율성, 정확도를 높이기 위해 하이브리드 검색(벡터+키워드), 메타데이터 활용

🔸 Modular RAG: 복잡한 Advanced RAG의 단점 보완, 임베딩, 검색, 리랭킹, 응답 생성 등을 모듈화하여 간편한 유지보수와 구조 확장

🔸 Agentic RAG: Rag에 AI 에이전트를 통합해 보다 정교한 검색과 답변 생성, 에이전트가 자율적으로 계획을 세우고 추론하여 최적의 결과 제공

사실 RAG의 기본은 👉 정확하고 좋은 데이터가 반드시 전제되어야 한다👈는 점이에요.

정확한 문서의 데이터화가 선행되어야, 임베딩의 정확도 역시 올라가겠죠. 즉, 문서를 데이터화하는 Parser의 성능이 RAG의 품질을 좌우해요.

DataInsight 자세히 알아보기

Polaris AI DataInsight는 다양한 포맷의 문서에서 텍스트·이미지·표·차트 등의 데이터를 추출해 구조화해요. 대량의 문서를 빠르고 정확하게 정리해 RAG 시스템의 기반 데이터로 바로 활용할 수 있어요.

Polars AI DataInsight 바로가기

3️⃣ AI Agent 🧚

LLM과 RAG가 주어진 문제에 대한 이해와 답변에 충실했다면, AI 에이전트는 ‘스스로 목표를 세우고 문제를 해결하는 주체’로 진화해요. AI 에이전트는 LLM을 기반으로 함수 호출, 외부 툴 활용, 타 에이전트 협업 등 여러 방면으로 획기적인 혁신을 보여주고 있어요.

1) Function Calling ☎️

Function Calling은 AI가 특정 함수(API)를 직접 호출해 기능을 실행할 수 있도록 하는 기술이에요. AI가 직접 캘린더 API를 호출해 일정을 추가하거나, 기상청 API를 호출해 날씨 데이터를 가져오기도 해요. 이 기능 덕분에 AI는 단순한 대화형 챗봇에 그치지 않고, 실제 업무를 수행하는 주체로 발전하고 있어요.

2) Agent Tools 💼

Fuction Calling이 단일 기능을 실행한다면, Agent Tools는 여러 기능을 상황에 맞게 조합해 활용하는 방식이에요. ‘지난달 매출 데이터를 영어로 요약해줘’ 라는 요청에 CRM 툴과 번역, 요약 도구를 각각 실행할 수 있죠. AI Agent가 스스로 도구를 조합해서 복합적인 업무를 수행할 수 있게 되는 거예요.

3) MCP (Model Context Protocol)

여러 Agent Tools를 연결하다 보면, 각 툴마다 그 방식이 달라 많은 혼선이 생기겠죠. MCP는 AI가 다양한 시스템을 일관된 방식으로 활용할 수 있게 하는 표준 통신 규약이에요. 글로벌 AI 기업 Anthropic이 발표한 후 OpenAI 등 주요 글로벌 기업이 채택을 이어가면서 사실상 AI 산업의 공용 언어로 인정받고 있어요. 덕분에 기업은 기존 데이터와 AI 인프라를 안정적이고 유연하게 확장할 수 있게 되었어요.

4) A2A (Agent to Agent) 👥

A2A는 AI 간의 협업을 의미해요. 단일 에이전트가 모든 일을 처리하는 대신, 각 영역에 특화된 여러 AI 에이전트가 역할을 분담해요. 각 에이전트가 고객 문의를 분류와 DB 조회, 답변 작성을 나누어서 진행하는 거예요. 이렇게 분업 구조가 갖춰지면 AI는 더 큰 확장성과 안정성을 얻게 돼요.


AI 혁신이 굴지의 과제로 떠오르는 지금, 중요한 것은 기술의 이름을 아는 데서 그치지 않고 각 용어가 의미하는 가치와 활용 가능성을 이해하는 거예요.

오늘 정리한 10가지 용어는 유행처럼 스쳐 지나가는 개념이 아니라, 앞으로 기업이 기술을 도입하고 활용하는 과정에서 반드시 이해해야 할 기본 지식에 가까워요. 각 개념이 갖는 의미를 명확히 이해하고 활용 전략을 수립한다면, AI를 단순한 기술 자산이 아니라 기업의 새로운 성장 엔진으로 전환할 수 있을 거예요.

AI 기술이 걷잡을 수 없이 빠르게 성장하면서, 매일 같이 쏟아지는 AI 관련 뉴스와 용어들을 쫓아가기 버거울 때가 있죠. 하지만 기업의 의사결정자라면, 범람하는 기술 속에서 의미 있는 정보를 선택하고, 이를 어떻게 비즈니스 가치로 연결할지 파악하는 게 매우 중요해요.

1️⃣ AI Model 🤖

AI 모델은 인공지능이 데이터를 학습하고 문제를 해결하기 위해 만들어진 구조를 뜻해요. 초기에는 단순히 텍스트를 처리하는 언어 모델을 중심으로 발전했지만, 지금은 규모와 형태가 점차 복잡하게 진화하고 있어요.

1) LLM (Large Language Model, 거대 언어 모델)

LLM은 AI 모델 대중화를 이끈 주인공이에요. 방대한 텍스트 데이터를 학습해 인간처럼 자연어를 이해하고 생성하는 AI 모델이죠.

그 중에서도 탁월한 성능을 보이는 GPT, Claude, Gemini 같은 모델들을 Frontier Model(프론티어 모델)이라고 일컫는데요. 이들은 분석, 요약, 코드 작성 등 다방면에서 뛰어난 성능을 자랑해요.

📌 대표적인 LLM 서비스

🔸 ChatGPT (OpenAI): 콘텐츠 제작, 코드 작성, 글쓰기 등 다양한 영역에 활용

🔸 Gemini (Google): 이미지와 텍스트가 결합된 멀티모달, 이미지 처리에 강점

🔸 Claude (Anthropic): 코드 작성, 디버깅, 기술 문서 정리 등 코딩에 특화

🔸 LLaMA (Meta): 오픈 소스로만 제공, 기업 맞춤형 커스터마이징 가능

여기서 중요한 점은 LLM이 무조건 크기만 해서 좋은 게 아니라는 거예요. 뛰어난 성능을 뒷받침하기 위해 막대한 비용과 자원이 필요하거든요. 이를 보완하기 위해 등장한 것이 바로 SLM이에요.

2) SLM (Small Language Model, 소형 언어 모델)

SLM은 LLM을 경량화한 모델로, 특정 도메인이나 제한된 환경에 최적화되었어요. 기업은 모든 초거대 모델 대신 SLM을 활용하여 비용 절감과 보안 강화, 온프레미스 운영 등에 이점을 가질 수 있어요. 회사 내부 문서, 매출 자료 등 특정 데이터에 특화된 작업을 수행하는 데에 주로 사용돼요.

3) VLM (Vision Language Model, 비전-언어 모델)

그러나 명석한 LLM에도 치명적인 단점이 있으니, 바로 픽셀로 구성된 시각 정보를 해석하는 능력이 부족하다는 거예요. 이를 극복하기 위해 텍스트와 이미지를 동시에 이해하고 생성하는 VLM의 중요성이 증가했어요. 이미지나 영상 등의 비언어적 정보를 해석함으로써 LLM의 한계를 보완하는 핵심 기술로 주목받아요.

Polaris Office의 AI NOVA는 다양한 LLM과 VLM을 실제 업무에 적용한 대표 사례예요. 텍스트 명령 처리부터 이미지, 표, 프레젠테이션 자료, 음성까지 다양한 형식의 입력 데이터를 이해하고 결합해 업무 맥락을 파악해요. LLM을 기반으로 문서를 작성하고, 표 데이터와 이미지 자료를 동시에 해석해 슬라이드 초안을 생성할 수도 있어요.

>>Polaris Office AI NOVA 바로가기

4) Fine tuning ⚒️

AI 모델을 단순히 학습된 상태 그대로 쓰는 것만으로는 기업마다 다른 환경을 충분히 반영하기 어려워요. 업무 특성에 맞게 다시 학습시키고 조정하는 파인 튜닝 과정을 통해 AI의 신뢰도를 높일 수 있어요.

👉 LoRA (Low-Rank Adaptation)

거대 언어 모델(LLM)을 그대로 쓰기엔 비용이 부담되고, 자사 환경에 맞지 않는 경우가 많아요. 이를 위해 LoRA는 모델 전체를 다시 학습시키는 것이 아니라, 필요한 일부 파라미터만 조정해 비용과 시간을 절약하여 맞춤형 AI를 만드는 기술이에요.

👉 RLHF (Reinforcement Learning from Human Feedback)

AI 모델이 항상 ‘사람이 원하는 방식’으로 대답하는 건 아니에요. RLHF는 사람의 피드백을 기반으로 모델의 응답 품질과 일관성을 강화하는 과정이에요. 모델이 인간의 지시를 더 잘 따르고, 안전한 응답을 생성할 수 있도록 조정해요.


2️⃣ RAG (Retrieval-Augmented Generation) 📲

LLM은 학습 이후의 새로운 정보에는 접근하지 못하기 때문에 답변의 최신성이 떨어지거나, 진위여부가 불분명할 수 있어요. 이를 보완하기 위해 외부 DB나 검색 시스템에서 관련 자료를 불러와 답변에 반영하는 RAG가 주목받고 있어요.

1) Vector Store (벡터 스토어)

먼저, RAG가 동작하려면 데이터를 저장하고 검색할 장소가 필요해요. 이때 쓰이는 것이 바로 벡터 스토어 인데요. 문서나 이미지같은 비정형 데이터를 컴퓨터가 이해할 수 있는 숫자의 배열(=벡터)로 변환하여 저장하는 곳이에요.

2) Embedding Model (임베딩 모델)

그렇다면 텍스트나 이미지 데이터를 어떻게 벡터로 바꿀 수 있는 걸까요? 바로 임베딩 모델이 그 과정을 담당하게 돼요. 데이터를 수치화하고 연관성이 높은 단어들을 거리순으로 배열하여 컴퓨터가 단어나 문장의 의미를 이해하고, 유사성을 판단할 수 있게 돼요.

3) Reranker Model (리랭커 모델)

LLM의 주요 특성 중 하나는 앞부분에 있는 정보를 더 잘 반영한다는 거예요. 그래서 RAG이 전달하는 문서의 순서를 결정하는 것도 매우 중요한데요. 리랭커는 Vector Store에서 검색된 후보 문서를 정밀하게 검사해서 가장 중요하다고 생각하는 문서를 최상단에 배치해 RAG의 검색 품질을 높이는 역할을 해요.

📌 Rag의 종류

점점 복잡해지는 데이터와 사용자 요구사항에 맞추어 RAG 역시 아래 네가지 방식으로 발전하고 있어요.

🔸 Native RAG: 질문과 관련된 정보를 문서에서 검색하여, 해당 정보를 LLM의 응답 생성에 참고하는 가장 기본적인 형태

🔸 Advanced RAG: 검색의 효율성, 정확도를 높이기 위해 하이브리드 검색(벡터+키워드), 메타데이터 활용

🔸 Modular RAG: 복잡한 Advanced RAG의 단점 보완, 임베딩, 검색, 리랭킹, 응답 생성 등을 모듈화하여 간편한 유지보수와 구조 확장

🔸 Agentic RAG: Rag에 AI 에이전트를 통합해 보다 정교한 검색과 답변 생성, 에이전트가 자율적으로 계획을 세우고 추론하여 최적의 결과 제공

사실 RAG의 기본은 👉 정확하고 좋은 데이터가 반드시 전제되어야 한다👈는 점이에요.

정확한 문서의 데이터화가 선행되어야, 임베딩의 정확도 역시 올라가겠죠. 즉, 문서를 데이터화하는 Parser의 성능이 RAG의 품질을 좌우해요.

Polaris AI DataInsight는 다양한 포맷의 문서에서 텍스트·이미지·표·차트 등의 데이터를 추출해 구조화해요. 대량의 문서를 빠르고 정확하게 정리해 RAG 시스템의 기반 데이터로 바로 활용할 수 있어요.

>>Polaris AI DataInsight 바로가기


3️⃣ AI Agent 🧚

LLM과 RAG가 주어진 문제에 대한 이해와 답변에 충실했다면, AI 에이전트는 ‘스스로 목표를 세우고 문제를 해결하는 주체’로 진화해요. AI 에이전트는 LLM을 기반으로 함수 호출, 외부 툴 활용, 타 에이전트 협업 등 여러 방면으로 획기적인 혁신을 보여주고 있어요.

1) Function Calling ☎️

Function Calling은 AI가 특정 함수(API)를 직접 호출해 기능을 실행할 수 있도록 하는 기술이에요. AI가 직접 캘린더 API를 호출해 일정을 추가하거나, 기상청 API를 호출해 날씨 데이터를 가져오기도 해요. 이 기능 덕분에 AI는 단순한 대화형 챗봇에 그치지 않고, 실제 업무를 수행하는 주체로 발전하고 있어요.

2) Agent Tools 💼

Fuction Calling이 단일 기능을 실행한다면, Agent Tools는 여러 기능을 상황에 맞게 조합해 활용하는 방식이에요. ‘지난달 매출 데이터를 영어로 요약해줘’ 라는 요청에 CRM 툴과 번역, 요약 도구를 각각 실행할 수 있죠. AI Agent가 스스로 도구를 조합해서 복합적인 업무를 수행할 수 있게 되는 거예요.

3) MCP (Model Context Protocol)

여러 Agent Tools를 연결하다 보면, 각 툴마다 그 방식이 달라 많은 혼선이 생기겠죠. MCP는 AI가 다양한 시스템을 일관된 방식으로 활용할 수 있게 하는 표준 통신 규약이에요. 글로벌 AI 기업 Anthropic이 발표한 후 OpenAI 등 주요 글로벌 기업이 채택을 이어가면서 사실상 AI 산업의 공용 언어로 인정받고 있어요. 덕분에 기업은 기존 데이터와 AI 인프라를 안정적이고 유연하게 확장할 수 있게 되었어요.

4) A2A (Agent to Agent) 👥

A2A는 AI 간의 협업을 의미해요. 단일 에이전트가 모든 일을 처리하는 대신, 각 영역에 특화된 여러 AI 에이전트가 역할을 분담해요. 각 에이전트가 고객 문의를 분류와 DB 조회, 답변 작성을 나누어서 진행하는 거예요. 이렇게 분업 구조가 갖춰지면 AI는 더 큰 확장성과 안정성을 얻게 돼요.


AI 혁신이 굴지의 과제로 떠오르는 지금, 중요한 것은 기술의 이름을 아는 데서 그치지 않고 각 용어가 의미하는 가치와 활용 가능성을 이해하는 거예요.

오늘 정리한 10가지 용어는 유행처럼 스쳐 지나가는 개념이 아니라, 앞으로 기업이 기술을 도입하고 활용하는 과정에서 반드시 이해해야 할 기본 지식에 가까워요. 각 개념이 갖는 의미를 명확히 이해하고 활용 전략을 수립한다면, AI를 단순한 기술 자산이 아니라 기업의 새로운 성장 엔진으로 전환할 수 있을 거예요.

Share article

폴라리스오피스 블로그 for Enterprise