Номинация «Двигатель науки»

Майя Котыга (Мытищи)

Фото Майи Котыга
21 год, МФТИ
Аналитик данных, ООО ЦМС

Почему я заслуживаю победы?

Моя жизнь — это постоянный процесс роста и развития. Каждый день я чувствую себя счастливой, потому что могу делиться своими идеями и вдохновлять других. Ведь только вместе мы — сила!

Научные исследования

Выделю три наиболее интересные работы.
Исследование и оптимизация поиска изображений с использованием RAG
Цель: изучить и оптимизировать процесс поиска изображений с использованием RAG (Retrieval Augmented Generation) подхода. Результат: приложение для поиска туристических мест с использованием технологий обработки естественного языка.

Была выбрана задача поиска фотографий памятников истории и архитектуры по описанию для создания путеводителя. Данные парсились из открытых источников. В ходе анализа выяснилось, что некоторые из изображений не относятся к перечисленным памятникам культуры (например, рекламные объявления), что является шумом и может заметно исказить предсказания нашей модели. Для решения этой проблемы мы использовали архитектуру BLIP. В ходе итогов разведочного анализа была отсеяна 1/3 нерелевантных фотографий с помощью BERT и tf-idf. Весь корпус векторизуется и сохраняется в векторную базу FAISS. Дополнительно было сделано обогащение данными из открытых источников, в которых содержалась историческая справка об объектах культурного наследия. Это было сделано для повышения конверсии правильных ответов и снижения рисков галлюцинаций модели. После команда реализовала метод RAG.
No-code кластеризация текстов
Цель: улучшить процесс разведочного анализа данных большого объема неструктурированной текстовой информации. Результат: приложение для кластеризации и классификации текстов.

Компании разных сфер деятельности ежедневно работают с большим объемом неструктурированной текстовой информации, приходящей из разных каналов. Для компаний важно уметь извлекать ценность из этой информации. Для этого ее надо сначала понять и систематизировать. Можно оптимизировать этот процесс путем создания сервиса разведочного анализа данных.
Сервис для промпт-инжиниринга
Цель: облегчить работу промпт-инженеров в создании оптимальных текстовых подсказок для финансового сектора. Результат: рабочий сервис.

Многие пользователи сталкиваются с проблемой при создании запросов (промптов), позволяющих получить релевантный и точный ответ от большой языковой модели. Особенно это важно для финансового сектора, например, в задачах кредитного скоринга. В рамках проекта был разработан сервис, который позволяет пользователям генерировать промпты по описанию желаемого результата без специфичных знаний промпт-инжиниринга. Платформа также направлена на демократизацию технологии ИИ, устранение технологической асимметрии. Решение основано на модели-агностике, т. е. большая языковая модель не зависит от специфики решаемых задач финансового сектора.



Дополнительно

Дипломы и другие документы:
Made on
Tilda