Вакансия компании: ООО Террикса Название вакансии: NLP-инженер (Domain-Specific, Классификация текстов)О компании: Наша компания разрабатывает передовые интеллектуальные системы для трансформации работы с данными в нефтегазовой отрасли. Мы создаем продукты, которые помогают специалистам принимать точные и обоснованные решения.О продукте:Вы будете работать над ключевым элементом нашей платформы — «Семантическим роутером». Это высоконагруженный микросервис, который в реальном времени анализирует и классифицирует текстовые запросы пользователей для их дальнейшей обработки сложными системами поиска и AI.Задача:Провести глубокий анализ и полный редизайн системы классификации запросов.Наш текущий MVP-подход с 4 классами показал точность на живых данных ~34%, в то время как на тестовых данных она достигает 97%. Ваша задача — закрыть этот разрыв, спроектировав и внедрив новую, детализированную систему классификации, учитывающую всю сложность и специфику предметной области. Чем предстоит заниматься: * Проведение анализа реальных пользовательских запросов для выявления паттернов, интентов и специфической терминологии.* Разработка иерархической (многоуровневой) классификационной схемы и доменной онтологии для нефтегазовой отрасли.* Создание и обучение моделей NLP/NLU для точного определения намерений пользователя (Intent Classification) и извлечения сущностей (NER).* Разработка алгоритмов для обработки комбинированных и неоднозначных запросов.* Интеграция новых моделей в существующую production-систему, обеспечение обратной совместимости и мониторинг качества.* Постоянная работа над улучшением метрик точности и пользовательского опыта.Мы ищем специалиста, который имеет: * Опыт работы в области NLP/NLU от 2-х лет.* Уверенные знания и практический опыт работы с Python и основными библиотеками (Transformers, spaCy, NLTK, Scikit-learn и т.д.).* Опыт обучения и тонкой настройки (fine-tuning) языковых моделей (BERT/RoBERTa и аналоги).* Понимание задач классификации текстов, извлечения сущностей (NER), работы с онтологиями и таксономиями.* Опыт работы с реальными production-данными (обработка несбалансированных выборок, работа с шумом, опечатками).* Способность к глубокому анализу и системному мышлению.Будет огромным плюсом: * Опыт работы со специфическими предметными областями (domain-specific NLP): медицина, юриспруденция, нефтегазовая/геологоразведочная отрасль и т.д.* Знание основ лингвистики.* Опыт работы с векторными и графовыми базами данных.* Навыки работы с Docker, Kubernetes, системами мониторинга ML-моделей.Мы предлагаем:* Возможность решить сложную и интересную задачу с огромным impact на конечный продукт.* Работу в команде экспертов, где ваше мнение будет ключевым.* Современный технологический стек и полный цикл реализации своих идей — от анализа до внедрения в продакшен.* Конкурентную «белую» заработную плату, гибкий график и возможность удаленной работы.* Корпоративный ДМС и другие бенефиты.Ключевые метрики вашего успеха: * Повышение точности классификации на живых данных с 34% до 85%+.* Снижение доли необработанных запросов до ≤5%.Готовы стать нашим экспертом в области NLP? Откликайтесь на вакансию! [*137940*]