Хранение данных в облаке

Jina AI + Qdrant → Хранение данных на лету!

Теперь вы можете использовать Qdrant в качестве хранилища документов для Jina DocArray для более быстрой обработки и поиска документов в облаке!

Введение

DocArray — это уникальная первая в своем роде структура данных для неструктурированных данных. Это часть более крупной экосистемы Jina AI. Он может вмещать все виды данных, включая текст, изображения, аудио, видео и т. д., и интуитивно понятен для использования с Python, поэтому вы можете сразу приступить к работе без каких-либо предварительных условий.

Qdrant — это база данных векторов с открытым исходным кодом, которая предоставляет готовую к работе службу с удобным API для хранения, поиска и управления конечными точками. Он адаптирован для расширенной поддержки фильтрации, что делает его полезным для всех видов нейронных сетей или задач сопоставления на основе семантики.

Настройка экземпляра Qdrant

Чтобы настроить экземпляр облачного хранилища с помощью Qdrant, вам необходимо запустить сервер Qdrant с помощью образа Docker. Для этого вы можете создать docker-compose.yml следующим образом:

Затем вы можете запустить docker compose up, чтобы запустить экземпляр.

Минимальный рабочий пример

В этом примере мы создадим локальный экземпляр Qdrant для хранения документа и построения простого текстового поиска.

Сначала запустите службу Qdrant и создайте экземпляр массива DocumentArray.

Теперь давайте проиндексируем документы:

Теперь мы будем генерировать вложения, используя модель BERT:

Наконец, мы можем запросить проиндексированные документы и получить результаты:

Результат: сохранение документов с помощью Qdrant.

DocArray + Qdrant в действии!

Чтобы дать вам представление о потенциальных возможностях интеграции Qdrant с Jina AI, мы создали блокнот для совместной работы, в котором вы можете просто создать базовую поисковую систему моды (поиск по изображению), просто используя DocArray и Qdrant.

Исходный код и записную книжку можно найти в репозитории GitHub.

Образовательные ресурсы

Это вторая часть серии из трех статей об изучении различных облачных хранилищ документов, которые можно использовать с DocArray от Jina.

Окунитесь в захватывающий мир нейронного поиска с Jina’s Learning Bootcamp. Получите сертификат и станьте частью Зала славы Джины! 🏆

Следите за новостями о будущих продуктах и ​​функциях от Jina AI! 👋