Портал «Рамблер» представил тестирование нейросетей для бизнеса и пользователей
На прошедшей XIII Международной IT-конференции «Стачка», собравшей экспертов в области искусственного интеллекта, разработки и цифровых технологий, был представлен проект по тестированию нейросетей.
Главный специалист по исследованиям данных (CDS) портала «Рамблер», входящего в медиахолдинг Rambler&Co, выступил в секции «Машинное обучение» с темой интеграции больших языковых моделей (LLM) в веб-продукты. Он рассказал о подключении GigaChat к новому порталу.
Основное внимание Карпович уделил методикам промпт-инжиниринга — искусству составления эффективных запросов к языковой модели для получения желаемого результата, а также использованию различных техник, таких как Few-Shot, Chain of Draft и Chain of Thought. Он подчеркнул критическую необходимость всестороннего тестирования при работе с LLM и отметил, что это тестирование должно проводиться на двух уровнях:
1. Этап разработки: оценка способности конкретной LLM эффективно решать поставленные бизнес-задачи до ее внедрения;
2. Производственная среда: обязательный непрерывный мониторинг качества работы LLM после интеграции в продукт, что позволяет отслеживать производительность модели в реальных условиях, выявлять деградацию качества ответов и оперативно вносить коррективы.
Аудитория портала «Рамблер» уже сейчас может ознакомиться с картиной дня на главной странице, которая актуализируется нейросетью раз в несколько минут, а с помощью контекстных подсказок узнавать подробности о событиях или уточнять неизвестные слова.
«Новый «Рамблер» — это не просто портал, а помощник, который берет на себя рутину и помогает получать исчерпывающую полезную информацию по любым жизненным ситуациям. Мы проводим всесторонние тестирования языковых моделей, осуществляем тщательный мониторинг качества создаваемого контента и стремимся к минимизации рисков, чтобы искусственный интеллект эффективно способствовал развитию бизнеса и не порождал потенциальные угрозы», — рассказал Сергей Карпович.
«Стачка» — международная профессиональная IT-конференция, которая ежегодно собирает 2500 специалистов со всей страны — разработчиков, маркетологов, дизайнеров, руководителей и собственников IT-компаний.