Создайте собственную семантическую поисковую систему менее чем за 50 строк — не шутка
Автор: LJ, 21 апреля 2025 года
Слишком долго; не читал
CocoIndex — это открытое ETL для подготовки данных к работе с ИИ с обработкой данных в реальном времени для повышения производительности и низкой задержки при обновлениях источника. Qdrant — это ведущая открытая векторная база данных, разработанная для работы с высокоразмерными векторами, обеспечивающая производительность. Начать можно с менее чем 50 строк кода на Python.
CocoIndex официально поддерживает Qdrant! Эта интеграция сочетает в себе высокопроизводительный стек RUST 🦀 с ETL в реальном времени для векторного хранилища:
- CocoIndex — это открытое ETL для подготовки данных к работе с ИИ — с обработкой данных в реальном времени для повышения производительности и низкой задержки при обновлениях источника. https://github.com/cocoindex-io/cocoindex/
- Qdrant — это ведущая открытая векторная база данных, предназначенная для работы с высокоразмерными векторами для производительности и масштабируемых приложений ИИ. https://github.com/qdrant/qdrant
Экспорт данных в коллекцию Qdrant прост.
Спецификация включает следующие поля:
collection_name
(тип:str
, обязательное): имя коллекции, в которую будут экспортированы данные.grpc_url
(тип:str
, необязательное): gRPC URL экземпляра Qdrant. По умолчаниюhttp://localhost:6334/
.api_key
(тип:str
, необязательное). API-ключ для аутентификации запросов.
Перед экспортом необходимо создать коллекцию с именем вектора, которое соответствует имени поля вектора в CocoIndex, и установить setup_by_user=True
во время экспорта.
🚀 Начните (с примером кода!) менее чем за 50 строк кода на Python:
https://github.com/cocoindex-io/cocoindex/tree/main/examples/text_embedding_qdrant
Мы постоянно улучшаем и добавляем новые примеры и блоги. Пожалуйста, поставьте звезду в нашем репозитории на GitHub https://github.com/cocoindex-io/cocoindex для последних обновлений!