1 июля 2026
Чем Вы будете заниматься:
проектировать и реализовывать архитектуру AI агентов на базе MCP (Model Context Protocol) и RAG (Retrieval Augmented Generation), включая микросервисную архитектуру и оркестрацию интеграций;
декомпозировать процессы разработки (код ревью, тестирование, рефакторинг) на агентные задачи и стандартизировать связанные с ними процессы промпт инжиниринг, версионирование, тестирование и валидацию результатов;
формировать и обосновывать выбор технологического стека (Java современные LTS версии, Spring Boot, СУБД, брокеры сообщений, инструменты observability) с учётом целевых показателей (latency p99/p95, безопасность, обработка длительных задач);
руководить кросс функциональной командой (Java разработчики, AI инженеры, аналитики): ставить задачи, контролировать сроки и качество, обеспечивать согласованность подходов;
анализировать узкие места в агентной архитектуре (задержки при работе с LLM, стоимость RAG запросов, стабильность MCP интеграций) и предлагать решения для повышения эффективности и надёжности;
вести архитектурную документацию в общепринятых нотациях (C4, UML, ArchiMate) и отслеживать перспективные технологии (MCP, A2A протоколы, оптимизации RAG) для их внедрения в проекты.
Мы ожидаем, что Вы:
имеете не менее 3 лет архитектурного опыта и от 5 лет коммерческой разработки на Java;
уверенно применяете стек Spring Framework 6+ (Spring Boot, Spring AI, WebFlux/MVC, Spring Data, Spring Cloud) на базе Java 17 25;
проектируете MCP серверы и реализуете их на Java, глубоко прорабатываете сценарии работы с MCP (resources, tools, prompts, sampling); оптимизируете RAG пайплайны (chunking, embedding, retrieval, генерация), в том числе с векторными БД (Qdrant, Milvus, pgvector);
проектируете микросервисную и событийно ориентированную архитектуру, разрабатываете API с применением REST, gRPC, AsyncAPI, OpenAPI;
настраиваете и эксплуатируете Kubernetes, работаете с инструментами observability (Prometheus, Grafana, OpenTelemetry); интерпретируете метрики (latency p99/p95, cost per request, precision/recall) и опираетесь на них при принятии архитектурных решений;
визуализируете и документируете архитектуру с помощью нотаций C4, UML (PlantUML) и Mermaid;
ведёте техническую коммуникацию в команде, аргументированно отстаиваете архитектурные решения, управляете конфликтными ситуациями, адаптируетесь к изменениям и сохраняете продуктивность в условиях высокой нагрузки.
Будет плюсом:
Мы предлагаем: