Blog

Engineering & Product Updates

Deep-dives on embedding infrastructure, vector migration, and building reliable AI retrieval systems.

Engineering · June 28, 2026 · 8 min read KO

작은 MoE 하나로 상용 한국어 OCR과 붙어봤다 — 학습은 아직 진행 중

활성 ~0.94B짜리 MoE OCR이 학습 8,000 step(전체 32,000 중) 시점에 Clova·Gemini·Upstage·MinerU·PaddleOCR과 5개 한국어 문서 트랙에서 정면 비교. 읽기순서는 이미 전체 1위, 추론은 4090 한 장으로 5트랙 8분(batch-1 대비 53배).

ocr moe korean benchmark on-device vllm

Engineering · June 20, 2026 · 3 min read KO

AI 상담 1건, 진짜 얼마짜리일까?

답변당 비용이 아니라 '맞은 답변당 비용'으로 봐야 합니다. 우리가 실제로 재봤어요.

rag cost-of-pass retrieval accuracy

RAG Lab · June 15, 2026 · 8 min read KO

비싼 모델보다 8배 싸게, 정확도는 똑같이 — 경리 한 건 0.16원

같은 정답(3/3)을 내는데 비싼 모델은 8배 더 비쌌습니다. 경리 task 1건당 비용을 원 단위로 실측해보니, 정확도는 비싼 모델이 아니라 RAG에서 나왔고, 싼 모델 + RAG + 결정적 커널이면 한 건 0.16원에 사람보다 정확했습니다.

rag-lab agent eval cost-of-pass accounting

Product · June 12, 2026 · 5 min read KO

Discord 봇 토큰과 웹훅 URL은 어디서 가져오나

Discord 개발자 포털에서 봇 토큰을 발급하고, 서버 채널에 웹훅 URL을 만드는 방법을 단계별로 정리합니다.

integration-guide discord bot-token webhook mcp

Product · June 12, 2026 · 6 min read KO

Gmail API OAuth Credentials는 어디서 가져오나

Google Cloud Console에서 Gmail API를 활성화하고, OAuth 2.0 Client ID와 Secret을 발급받는 전 과정을 정리합니다.

integration-guide gmail oauth google-cloud mcp

Product · June 12, 2026 · 5 min read KO

Notion Integration Token과 Database ID는 어디서 가져오나

Notion integration token을 만들고, 연결할 페이지에 권한을 부여한 뒤 데이터베이스 ID를 뽑는 전 과정을 정리합니다.

integration-guide notion integration-token database-id mcp

Product · June 12, 2026 · 5 min read KO

Slack 봇 토큰과 Incoming Webhook URL은 어디서 가져오나

Slack API 앱을 만들고, Bot User OAuth Token과 Incoming Webhook URL을 발급받는 방법을 단계별로 정리합니다.

integration-guide slack bot-token incoming-webhook mcp

Product · June 12, 2026 · 4 min read KO

Telegram 봇 토큰은 어디서 가져오나

Telegram에서 @BotFather로 봇을 만들고, API token을 발급받아 웹훅을 연결하는 방법을 단계별로 정리합니다.

integration-guide telegram bot-token botfather mcp

Engineering · May 13, 2026 · 5 min read KO

왜 요즘 RAG에는 BM25와 그래프가 없어도 벡터는 있어야 하는가

BM25는 단어를 찾고, 그래프는 관계를 따라간다. 하지만 자연어 질문과 문서 표현 사이의 간극을 먼저 메우는 것은 벡터 검색이다.

rag vector-search bm25 graphrag retrieval

Product · May 12, 2026 · 7 min read KO

AI에 넣기 전에 개인정보부터 가려야 합니다

상담 기록, 고객 메모, 내부 문서를 AI에 넣기 전에 이름, 주소, 전화번호, 이메일, 식별번호를 먼저 마스킹해야 하는 이유와 Schift PII Beta의 방향을 정리했습니다.

pii privacy korean ai-workflow

RAG Lab · May 12, 2026 · 7 min read KO

PageIndex와 Schift를 같은 문서로 돌려보며 배운 것

PageIndex OSS와 Schift full path를 같은 질의, 같은 top_k 기준으로 비교했다. 품질, 검색 시간, 추정 비용을 함께 보니 문서 구조 검색을 어디에 넣어야 하는지 분명해졌다.

rag-lab retrieval benchmark pageindex cost

Engineering · May 8, 2026 · 10 min read KO

한국어 Legal RAG에서 PII를 먼저 지우는 이유

공개 Korean PII 모델 두 개와 Schift STRONG v2를 같은 gate에서 비교했다. KDPII도 mapped subset으로 돌려보고, 우리가 이긴 범위와 아직 주장하지 않을 범위를 분리한다.

pii korean legal rag benchmark

Engineering · May 5, 2026 · 7 min read KO

기능이 늘어난 엔진을 더 빠르게 만들기

현재 production engine image와 새 engine build를 같은 amd64 Docker/RPC 조건에서 비교했다. Graph, hybrid keyword, content lookup까지 포함한 실제 RAG workload에서 어떤 변화가 있었는지 기록한다.

rust vector-search benchmark engine

RAG Lab · May 4, 2026 · 14 min read KO

온톨로지가 당신 회사에 필요 없을 가능성이 큰 이유

AI 시대의 의미 인프라라는 말이 자주 빠뜨리는 것들입니다. 온톨로지를 깎아내리려는 글이 아니라, 헷갈리지 않고 결재 전에 확인해야 할 기준을 정리한 글이에요.

ontology graphrag rag vectordb knowledge-graph

RAG Lab · April 26, 2026 · 5 min read KO

왜 RAG에는 decision layer가 필요할까?

검색은 됐는데 답은 흔들리는 순간이 있습니다. 최근 retrieval 뒤에 rerank와 corrective retrieval을 붙이는 방향을 검토하면서, 결국 필요한 것은 더 큰 모델보다 decision layer라는 쪽으로 생각이 정리됐습니다.

rag-lab rag retrieval rerank decision-layer

Engineering · April 9, 2026 · 6 min read KO

RAGBench covidqa: top_k는 7이 sweet spot이었다

Schift retrieval stack으로 RAGBench covidqa를 end-to-end로 돌려 보니, 현재 설정에서는 rerank보다 no-rerank가 낫고 top_k=7이 가장 균형이 좋았다.

rag benchmark retrieval ragbench top-k

Guide · April 9, 2026 · 12 min read KO

Schift가 뭔데?

자료를 넣으면 dirty work를 다 해서 깔끔한 graph-vector DB로 만들어주는 프로덕트입니다.

schift ai-agents rag typescript getting-started

Engineering · April 8, 2026 · 8 min read KO

LongMemEval: RAG 엔진은 답변이 아니라 근거 검색으로 봐야 한다

Schift memory layer가 LongMemEval-S 500문항에서 98.6% Recall@10, 96.6% Recall@5를 기록했습니다. RAG 엔진 평가에서 final answer와 evidence retrieval을 분리해야 하는 이유.

LongMemEval RAG retrieval memory benchmark

Engineering · April 8, 2026 · 7 min read EN

LongMemEval: 96% R@5 with our own stack

We ran the LongMemEval conversation memory benchmark on Schift Engine with our own embedding model. No ChromaDB, no external dependencies. Here's what worked and what didn't.

benchmark retrieval memory vector-search embedding

Engineering · April 5, 2026 · 8 min read EN

RAG Is Not Vector Search

Vector search is step 3 of 8. Here's the full checklist for production RAG -- and what breaks when you skip steps.

rag vector-search retrieval evaluation reranking production

Engineering · March 29, 2026 · 8 min read KO

우리 엔진이 Qdrant보다 8.7배 빠른 이유

Schift 벡터 엔진의 실측 벤치마크를 공개한다. 이기는 곳, 지는 곳 모두 투명하게. Apple M5 Pro, 1M vectors, 1024d 기준으로 Qdrant, FAISS, pgvector와 비교했다.

rust vector-search benchmark qdrant faiss performance

Engineering · March 29, 2026 · 8 min read JP

自作ベクトルエンジンをQdrant・FAISSと比較してみた（1M vectors, 1024d）

Rustで書いたベクトル検索エンジンSchiftのベンチマークを取ってみました。Qdrantに8.7倍勝ち、FAISS Flatには負けます。勝つところも負けるところも全部出します。

rust vector-search benchmark qdrant faiss performance

Engineering · March 29, 2026 · 7 min read JP

pgvectorの限界を1M vectorsで実測してみた話

pgvectorは小規模ベクトル検索に便利だが、どこから専用エンジンが必要になるのか。Rust製エンジン・FAISS・Qdrantと比較しながら、境界線を数字で示します。

pgvector postgres vector-search benchmark rust

Dev Log · March 29, 2026 · 6 min read JP

TypeScriptでAI Agentフレームワークを作っている理由

AI agentツールはPythonばかり。でもproductionアプリはTypeScript。このギャップがつらいので、自分たちで作ることにした話。

typescript ai-agents framework managed-rag developer-experience

Engineering · March 29, 2026 · 7 min read EN

pgvector Is Not a Vector Database (And That's Fine)

pgvector is a solid choice for adding vector search to Postgres at low scale. But when does it stop being enough? We ran the numbers.

pgvector postgres vector-search benchmark rust

Dev Log · March 29, 2026 · 6 min read EN

Why We're Building an AI Agent Framework in TypeScript

The AI agent tooling ecosystem is dominated by Python. But production applications are TypeScript. We think that mismatch has a real cost, and we built something to close it.

typescript ai-agents framework managed-rag developer-experience

Engineering · March 26, 2026 · 5 min read EN

Making SQ8 the Default for New Collections

Why the engine moved to SQ8 as the default storage format — what we measured, what failed, and what we are not doing yet.

rust vector-search quantization benchmark

Engineering · March 26, 2026 · 8 min read KO

FAISS에서 SQ8까지

벡터 검색 엔진의 기본 저장 포맷을 찾기까지. FAISS를 기준선으로 두고 F32, SQ8, SQ4, SQ1, TQ4를 비교한 개발 기록.

rust vector-search quantization benchmark faiss

Engineering · March 26, 2026 · 12 min read KO

HyperbolicRAG를 바로 도입하지 않고, hierarchy-aware retrieval부터 검증하기

HyperbolicRAG의 문제의식은 유효하지만, 먼저 검증할 것은 구조 신호 기반 rerank. dense baseline에서 relation-aware rerank까지의 실험 기록.

retrieval rag hierarchy reranking research

Engineering · March 26, 2026 · 7 min read KO

법률 데이터를 Vector DB로 만들면 얼마나 작아지고 얼마나 빨라질까

한국 법률 코퍼스 기반 벡터 DB 벤치마크. SQ8 압축, 계층 탐색, 본문 조회까지 포함한 전체 파이프라인 성능 기록.

rust vector-search legal benchmark quantization

AI바우처 · March 20, 2026 · 5 min read KO

2026 AI바우처 수요기업 신청 가이드

AI 도입 비용의 최대 80%를 정부가 지원합니다. 신청 자격, 절차, 일정, 비용 구조를 정리했습니다.

ai-voucher government funding

Engineering · March 12, 2026 · 6 min read EN

The Embedding Failover Pattern: Zero Downtime Across Providers

When your embedding provider goes down, your search breaks. Learn the failover pattern that keeps retrieval alive across provider outages using projection matrices.

embedding failover reliability

Case Study · March 10, 2026 · 7 min read EN

Case Study: Cutting Embedding Costs to $0 with Gemini

How a startup paying $1,500/month in OpenAI embedding costs migrated to Gemini Embedding in one afternoon — without re-embedding a single document.

case-study gemini migration cost-optimization

Product · February 28, 2026 · 5 min read EN

Why Vector Migration Matters More Than You Think

Embedding model upgrades silently break production retrieval. Here is why vendor lock-in is a hidden technical debt — and what you can do about it today.

migration vendor-lock-in embeddings