모델 — Core Models

01Embedding

02Reranking

03RAG-Instruct

Embedding Model · 제공 중

의미를 벡터로 투영하는 임베딩 모델

문서와 질의의 의미를 고차원 벡터 공간에 투영해 최적의 관련성을 추출합니다. 한국어 도메인 코퍼스로 학습해 동의어·구어체·전문용어를 폭넓게 포착합니다.

Dimensions

1,024

Max Context

32,768 tok

Languages

English · Korean

Matryoshka

지원

한국어 검색 성능 · nDCG@10 (예시)

Embedding0.72

공개 모델 A0.63

공개 모델 B0.58

* 상세 벤치마크는 모델 성능 리포트를 참고하세요.

python · embeddings.create

from ai_search import Client
client = Client(api_key="sk-...")

resp = client.embeddings.create(
    model="embedding-4",
    input=["요금제 변경 방법을 알려줘"],
)
vec = resp.data[0].embedding  # 1024-d 벡터

Reranking Model · 제공 중

관련도를 정밀 재평가하는 리랭킹 모델

질의–문서 쌍을 함께 읽는 크로스 인코더로 1차 검색 결과를 재평가하여 최상위 정확도를 확보합니다. 실시간 응답에 맞는 지연을 유지합니다.

Type

Cross-encoder

Max Tokens

32,768

Params

0.4B~0.6B

Top-N

최대 100

리랭킹 적용 전후 · Hit@3 (예시)

검색만75.2

+ Reranker80.9

* 리랭킹 결합 시 상위 관련도가 크게 향상됩니다.

python · rerank

resp = client.rerank(
    model="reranker-4",
    query="해외 로밍 데이터 요금",
    documents=candidates,   # 1차 검색 결과
    top_n=5,
)
for r in resp.results:
    print(r.index, r.relevance_score)

RAG-Instruct Model · 제공 중

근거와 추론을 결합하는 생성 모델

검색된 근거와 LLM의 추론을 결합해 환각을 억제하고 논리적인 답변을 생성합니다. 근거에 없는 내용을 지어내지 않고 인용 출처를 함께 제시하도록 정렬되었습니다.

Context

32K tokens

근거 일치율

94%

환각률

2.1%

출력

답변 + 인용

근거 기반 답변 품질 (예시)

근거 일치율94%

인용 정확도91%

환각률(↓)2.1%

python · chat.create (RAG)

resp = client.chat.create(
    model="rag-instruct",
    query="해외에서 데이터 무제한 쓰려면?",
    contexts=retrieved,   # IntelliSearch 검색 결과
)
print(resp.answer)
print(resp.citations)  # 근거 출처

Roadmap · 출시 예정 모델

출시 예정

Embedding Vision

멀티모달 임베딩

텍스트·이미지·도표를 동일한 의미 공간에 임베딩. 문서 속 그림과 표까지 검색 대상으로 확장합니다.

Multimodal · 2종 중 ①

출시 예정

Reranker Vision

멀티모달 리랭커

텍스트·이미지가 혼합된 후보를 함께 이해해 재정렬. Multimodal RAG의 상위 정확도를 담당합니다.

Multimodal · 2종 중 ②

출시 예정

Agentic Model

에이전틱 RAG 특화 모델

복잡한 질문의 분해, 도구 선택, 다단계 추론에 최적화. Agentic RAG의 자율 계획 수립을 구동합니다.

Agentic · 계획·도구호출 특화

검색과 생성의 품질을 결정짓는 모델 레이어

의미를 벡터로 투영하는 임베딩 모델

관련도를 정밀 재평가하는 리랭킹 모델

근거와 추론을 결합하는 생성 모델

멀티모달 임베딩

멀티모달 리랭커

에이전틱 RAG 특화 모델

검색부터 의사결정까지,
하나의 플랫폼으로.

의미를 벡터로 투영하는 임베딩 모델

관련도를 정밀 재평가하는 리랭킹 모델

근거와 추론을 결합하는 생성 모델

멀티모달 임베딩

멀티모달 리랭커

에이전틱 RAG 특화 모델

검색부터 의사결정까지,하나의 플랫폼으로.

검색부터 의사결정까지,
하나의 플랫폼으로.