Interview Articles

程序员面试专题库

从岗位、技术栈和面试追问切入，快速找到能直接用于复习、项目表达和查漏补缺的文章。

Java 后端 MySQL Redis RAG Agent 大模型

通用技术面 AI 后端/大模型应用开发 RAG 知识库灰度

知识库更新也要灰度，RAG 不是上传完文档就上线

RAG 知识库更新会影响切分、召回、重排、缓存和引用。把新文档直接全量上线，可能让答案在用户面前变差。

阅读全文

通用技术面 AI 后端/大模型应用开发大模型成本治理

大模型账单突然变高，通常不是模型单价一个原因

大模型成本上涨往往藏在长上下文、重复重试、无效流式输出和缓存失效里。面试里讲成本治理，要能把账单拆回一次请求的真实链路。

阅读全文

通用技术面 AI 后端/大模型应用开发 RAG 证据链

RAG 的引用不是装饰：证据链断了，答案越流畅越危险

RAG 不是把资料塞给模型。真正影响可信度的是每个结论能否追到证据、证据是否匹配问题，以及答错后能否回流修正检索链路。

阅读全文

通用专题 Java/后端开发向量检索工程化

向量检索上线后变差，问题常常出在版本、切分和回滚

向量检索质量不只取决于模型，embedding 版本、切分策略、索引参数、权限过滤和回滚方案都会影响线上效果。

阅读全文

多家公司 AI 后端/大模型应用开发 RAG 重排

RAG 重排为什么重要：召回很多资料，不等于模型会用对

RAG 重排的价值是把真正有用的证据放到前面，但它也会带来延迟和成本，需要按场景取舍。

阅读全文

多家公司 AI 后端/大模型应用开发 Embedding 与检索

Embedding 不是向量化按钮：检索质量从表示空间开始

向量检索质量不只取决于向量数据库，embedding 模型、文本切分、领域词和评估样本都会决定召回效果。

阅读全文

多家公司 AI 后端/大模型应用开发企业 RAG 权限

企业 RAG 最容易翻车的地方：权限过滤必须早于生成

企业 RAG 的权限问题不能交给模型自觉，必须在检索和上下文构造阶段就过滤掉无权限资料。

阅读全文

多家公司 AI 后端/大模型应用开发 RAG 知识库更新

RAG 知识库更新后为什么会变差：切分、版本和缓存的连锁反应

RAG 不只难在首次搭建，知识库持续更新后更考验版本管理、缓存失效、索引一致性和坏例回归。

阅读全文

多家公司 AI 后端 RAG

RAG 评测闭环：比召回率更重要的是坏例能否持续减少

RAG 的评估不能只看召回率，要看证据是否可答、答案是否基于证据、坏例能否持续减少。

阅读全文

多家公司算法工程师 RAG

RAG 坏例分析怎么讲：回答错了到底是哪一层的问题

RAG 回答错了，不一定是模型问题。面试里要按资料、切分、召回、重排和生成分层归因。

阅读全文

多家公司算法工程师 RAG

RAG 面试怎么讲检索召回：切分、召回和重排到底在解决什么

RAG 项目的难点不是把文档塞进向量库，而是让正确资料被召回、排到前面，并在资料不足时拒答。

阅读全文

多家公司算法工程师大模型应用

大模型应用项目怎么讲，才能避免“只是套壳”

大模型应用面试不是炫模型名，而是讲清你如何把不稳定的模型输出变成可用的业务系统。

阅读全文

第 1 / 1 页