검색 파이프라인의 각 단계를 담당하는 파운데이션 모델. 한국어에 최적화되어 있으며, 하나의 API로 호출하고 자유롭게 조합할 수 있습니다. 모델 성능 리포트 →
문서와 질의의 의미를 고차원 벡터 공간에 투영해 최적의 관련성을 추출합니다. 한국어 도메인 코퍼스로 학습해 동의어·구어체·전문용어를 폭넓게 포착합니다.
* 상세 벤치마크는 모델 성능 리포트를 참고하세요.
from ai_search import Client
client = Client(api_key="sk-...")
resp = client.embeddings.create(
model="embedding-4",
input=["요금제 변경 방법을 알려줘"],
)
vec = resp.data[0].embedding # 1024-d 벡터
질의–문서 쌍을 함께 읽는 크로스 인코더로 1차 검색 결과를 재평가하여 최상위 정확도를 확보합니다. 실시간 응답에 맞는 지연을 유지합니다.
* 리랭킹 결합 시 상위 관련도가 크게 향상됩니다.
resp = client.rerank(
model="reranker-4",
query="해외 로밍 데이터 요금",
documents=candidates, # 1차 검색 결과
top_n=5,
)
for r in resp.results:
print(r.index, r.relevance_score)
검색된 근거와 LLM의 추론을 결합해 환각을 억제하고 논리적인 답변을 생성합니다. 근거에 없는 내용을 지어내지 않고 인용 출처를 함께 제시하도록 정렬되었습니다.
resp = client.chat.create(
model="rag-instruct",
query="해외에서 데이터 무제한 쓰려면?",
contexts=retrieved, # IntelliSearch 검색 결과
)
print(resp.answer)
print(resp.citations) # 근거 출처
텍스트·이미지·도표를 동일한 의미 공간에 임베딩. 문서 속 그림과 표까지 검색 대상으로 확장합니다.
텍스트·이미지가 혼합된 후보를 함께 이해해 재정렬. Multimodal RAG의 상위 정확도를 담당합니다.
복잡한 질문의 분해, 도구 선택, 다단계 추론에 최적화. Agentic RAG의 자율 계획 수립을 구동합니다.
모델·엔진·지능형 RAG·플랫폼을 동일한 체계로 도입하고, 함께 성과를 설계합니다.