если корпус на разных языках и на инференсе тоже будет контекст на разных
языках
То лучше документы изначально перевести на англ и сделать эмбеддинги
И потом на инференсе сначала переводить на англ и искать по сем поиску
Или есть оптимальнее вариант
@Niyaz_Orazbayev, Если эмбеддинг модель мультиязычная,
то переводить не обязательно. Семантически близкие фразы будут иметь
схожие эмбеддинги на разных языках.
если корпус на разных языках и на инференсе тоже будет контекст на разных языках
То лучше документы изначально перевести на англ и сделать эмбеддинги
И потом на инференсе сначала переводить на англ и искать по сем поиску
Или есть оптимальнее вариант
@Niyaz_Orazbayev, Если эмбеддинг модель мультиязычная, то переводить не обязательно. Семантически близкие фразы будут иметь схожие эмбеддинги на разных языках.
@Иван_Александров, Благодарю!