5 июля 2026
Рувики - новая интернет-энциклопедия.
Наш продукт Онлайн-энциклопедия, предоставляющая доступ к миллионам статей, изображений и видеороликов по самым различным темам - от истории и науки до искусства и технологий.
Мы ищем инженера, который сможет определить, что такое хорошая модель для наших продуктов, и разработать инструменты для объективного измерения этого качества. У нас уже есть работающий фреймворк оценки (на базе DeepEval, с несколькими тематическими наборами проверок, LLM-судьями и эталонными датасетами) вы его возглавите, углубите и масштабируете на новые пайплайны, а не начнёте с чистого листа.
Ваша работа напрямую влияет на каждый продукт, который мы выпускаем: именно ваши метрики и проверки решают, стал ли новый промпт или модель лучше или мы вносим регресс. Специфика домена фактчекинг и работа с фактологией, которая дрейфует во времени , поэтому эталонный ответ протухает; устойчивая к этому методология оценки одна из центральных инженерных задач роли.
Обязанности:
Технический стек:
Навыки и знания:
Будет плюсом:
Интересные задачи, крутые кейсы, возможность выйти на новый профессиональный уровень.
100% белая заработная плата, официальное трудоустройство по ТК РФ с первого дня.
Полная занятость, удаленный формат работы.
Пятидневная рабочая неделя, с пн-пт.
Дружный и неравнодушный коллектив профессионалов.
Программа ДМС после успешного прохождения испытательного срока.