4.1 📤 RAG с вашими данными

👩‍🔧 RAG pipeline

 

Какой компонент Langchain используется на этапе извлечения релевантных данных в RAG цепочке?


если корпус на разных языках и на инференсе тоже будет контекст на разных языках
То лучше документы изначально перевести на англ и сделать эмбеддинги
И потом на инференсе сначала переводить на англ и искать по сем поиску
Или есть оптимальнее вариант

@Niyaz_Orazbayev, Если эмбеддинг модель мультиязычная, то переводить не обязательно. Семантически близкие фразы будут иметь схожие эмбеддинги на разных языках.

@Иван_Александров, Благодарю!