Разработка инструмента на базе ИИ для автоматической проверки цитат с использованием NVIDIA NIM

Точность цитат имеет большое значение для поддержания целостности как академического, так и сгенерированного ИИ контента. Когда цитаты неточные или неверные, они могут вводить читателей в заблуждение и распространять ложную информацию. Мы — группа исследователей из Университета Сиднея, специализирующаяся на машинном обучении и ИИ, разрабатываем инструмент на базе ИИ, способный эффективно проверять и анализировать семантическую точность цитат.

Указание на источник для фактических утверждений может помочь читателям доверять его достоверности, укрепить авторитет автора и способствовать прозрачности, показывая источник информации. Однако обеспечение семантической точности цитат — это трудоемкий процесс, который часто требует глубокого понимания темы.

Наш собственный опыт столкновения с разочарованиями и проблемами, вызванными неточными цитатами, побудил нас разработать надежное и масштабируемое решение — инструмент проверки семантической цитаты. Это решение упрощает процесс проверки цитат и улучшает целостность исследований в различных областях.

Необходимость в проверке цитат стала более актуальной с растущим использованием моделей с большим языком (LLM). Недавние достижения в методах усиленной генерации (RAG) помогают снизить количество галлюцинаций в сгенерированном контенте. Тем не менее, остаются значительные проблемы с установлением надежности без дополнительных методов проверки.

Мы столкнулись с этой проблемой, разрабатывая Приложение для оценки влияния исследований, которое генерирует индивидуальные отчеты о влиянии для научных работ в области медицины и здравоохранения. Несмотря на свою мощь, приложение в настоящее время не может самостоятельно проверять утверждения в цитатах или проверять их соответствие заявлениям в оригинальных источниках.

В этом посте представлен инструмент проверки семантической цитаты, который направлен на ускорение процессов валидации, поддержание высокой точности и предоставление релевантных контекстуальных фрагментов для более глубокого понимания цитируемых материалов. Этот инструмент автоматизирует проверку цитат, сопоставляя фактические утверждения с ссылочными текстами. Он разработан с использованием микросервисов NVIDIA NIM с дополнительной поддержкой основных поставщиков API LLM, сочетая индивидуальную модель, настроенную на ссылочных данных, с гибкими вариантами развертывания.