🚀 Experimente o Zilliz Cloud, o Milvus totalmente gerenciado, gratuitamente—experimente um desempenho 10x mais rápido! Experimente Agora>>

milvus-logo
LFAI
Home
  • Guia do utilizador
  • Home
  • Docs
  • Guia do utilizador

  • Colecções

  • Explicação da coleção

Explicação da coleção

No Milvus, pode criar várias colecções para gerir os seus dados e inserir os seus dados como entidades nas colecções. A coleção e a entidade são semelhantes a tabelas e registos em bases de dados relacionais. Esta página ajuda-o a aprender sobre a coleção e conceitos relacionados.

Coleção

Uma coleção é uma tabela bidimensional com colunas fixas e linhas variantes. Cada coluna representa um campo e cada linha representa uma entidade.

O gráfico seguinte mostra uma coleção com oito colunas e seis entidades.

Collection explained Coleção explicada

Esquema e campos

Quando descrevemos um objeto, mencionamos normalmente os seus atributos, como o tamanho, o peso e a posição. É possível utilizar estes atributos como campos numa coleção. Cada campo tem várias propriedades de restrição, como o tipo de dados e a dimensionalidade de um campo vetorial. Pode formar um esquema de coleção criando os campos e definindo a sua ordem. Para conhecer os possíveis tipos de dados aplicáveis, consulte Esquema explicado.

Deve incluir todos os campos definidos pelo esquema nas entidades a inserir. Para tornar alguns deles opcionais, considere

  • Torná-los anuláveis ou definir valores padrão

    Para obter detalhes sobre como tornar um campo anulável ou definir o valor padrão, consulte Anulável e padrão.

  • Ativar o campo dinâmico

    Para obter detalhes sobre como ativar e utilizar o campo dinâmico, consulte Campo dinâmico.

Chave primária e AutoId

À semelhança do campo primário numa base de dados relacional, uma coleção tem um campo primário para distinguir uma entidade das outras. Cada valor no campo primário é globalmente único e corresponde a uma entidade específica.

Como mostrado no gráfico acima, o campo denominado id serve como campo primário, e o primeiro ID 0 corresponde a uma entidade intitulada A taxa de mortalidade do coronavírus não é importante. Não haverá nenhuma outra entidade que tenha o campo primário 0.

Um campo primário aceita apenas números inteiros ou cadeias de caracteres. Ao inserir entidades, você deve incluir os valores do campo primário por padrão. No entanto, se tiver ativado o AutoId aquando da criação da coleção, o Milvus irá gerar esses valores aquando da inserção de dados. Nesse caso, exclua os valores do campo primário das entidades a serem inseridas.

Para mais informações, consulte Primary Field & AutoID.

Índice

A criação de índices em campos específicos melhora a eficiência da pesquisa. Aconselha-se a criação de índices para todos os campos em que o seu serviço se baseia, entre os quais os índices dos campos vectoriais são obrigatórios.

Entidade

As entidades são registos de dados que partilham o mesmo conjunto de campos numa coleção. Os valores em todos os campos da mesma linha constituem uma entidade.

É possível inserir tantas entidades quantas forem necessárias numa coleção. No entanto, à medida que o número de entidades aumenta, o tamanho da memória que ocupa também aumenta, afectando o desempenho da pesquisa.

Para obter mais informações, consulte Esquema explicado.

Carregar e liberar

Carregar uma coleção é o pré-requisito para realizar pesquisas e consultas por similaridade nas coleções. Quando você carrega uma coleção, o Milvus carrega todos os arquivos de índice e os dados brutos em cada campo na memória para uma resposta rápida às pesquisas e consultas.

As pesquisas e consultas são operações que consomem muita memória. Para poupar custos, é aconselhável libertar as colecções que não estão a ser utilizadas.

Para obter mais detalhes, consulte Carregar e liberar.

Pesquisa e consulta

Depois de criar índices e carregar a coleção, pode iniciar uma pesquisa por semelhança alimentando um ou vários vectores de consulta. Por exemplo, ao receber a representação vetorial da sua consulta transportada num pedido de pesquisa, o Milvus utiliza o tipo de métrica especificado para medir a semelhança entre o vetor de consulta e os vectores da coleção de destino antes de devolver os que são semanticamente semelhantes à consulta.

Também é possível incluir a filtragem de metadados nas pesquisas e consultas para melhorar a relevância dos resultados. Note que as condições de filtragem de metadados são obrigatórias nas consultas, mas opcionais nas pesquisas.

Para obter detalhes sobre os tipos de métricas aplicáveis, consulte Tipos de métricas.

Para obter mais informações sobre pesquisas e consultas, consulte os artigos no capítulo Pesquisa e classificação, entre os quais se encontram as funcionalidades básicas.

Além disso, o Milvus também fornece melhorias para melhorar o desempenho e a eficiência da pesquisa. Estas estão desactivadas por defeito e pode activá-las e utilizá-las de acordo com os seus requisitos de serviço. São elas

Partição

As partições são subconjuntos de uma coleção, que partilham o mesmo conjunto de campos com a sua coleção-mãe, cada uma contendo um subconjunto de entidades.

Ao alocar entidades em diferentes partições, é possível criar grupos de entidades. É possível efetuar pesquisas e consultas em partições específicas para que o Milvus ignore entidades noutras partições e melhore a eficiência da pesquisa.

Para obter detalhes, consulte Gerenciar partições.

Fragmento

Shards são fatias horizontais de uma coleção. Cada shard corresponde a um canal de entrada de dados. Cada coleção tem um fragmento por predefinição. Pode definir o número apropriado de fragmentos ao criar uma coleção com base na taxa de transferência esperada e no volume de dados a inserir na coleção.

Para obter detalhes sobre como definir o número de fragmentos, consulte Criar coleção.

Alias

É possível criar aliases para as suas colecções. Uma coleção pode ter vários aliases, mas as colecções não podem partilhar um alias. Ao receber um pedido contra uma coleção, o Milvus localiza a coleção com base no nome fornecido. Se a coleção com o nome fornecido não existir, o Milvus continua a localizar o nome fornecido como um alias. Pode utilizar aliases de colecções para adaptar o seu código a diferentes cenários.

Para mais detalhes, consulte Gerenciar aliases.

Função

É possível definir funções para o Milvus derivar campos aquando da criação da coleção. Por exemplo, a função de pesquisa de texto completo utiliza a função definida pelo utilizador para derivar um campo de vetor esparso de um campo varchar específico. Para obter mais informações sobre a pesquisa de texto completo, consulte Pesquisa de texto completo.

Nível de consistência

Os sistemas de bases de dados distribuídas utilizam normalmente o nível de consistência para definir a semelhança de dados entre nós de dados e réplicas. Pode definir níveis de consistência separados quando cria uma coleção ou realiza pesquisas de semelhança dentro da coleção. Os níveis de consistência aplicáveis são Strong, Bounded Staleness, Session e Eventually.

Para obter detalhes sobre esses níveis de consistência, consulte Nível de consistência.

Limites

Para conhecer os limites e restrições das colecções, consulte Limites e restrições.

Try Managed Milvus for Free

Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

Get Started
Feedback

Esta página foi útil?