Como as competências antrópicas alteram as ferramentas do agente - e como criar uma competência personalizada para que o Milvus possa rapidamente criar o RAG
A utilização de ferramentas é uma parte importante do trabalho de um agente. O agente precisa de escolher a ferramenta certa, decidir quando a chamar e formatar as entradas corretamente. No papel, isso parece simples, mas quando se começa a construir sistemas reais, encontram-se muitos casos extremos e modos de falha.
Muitas equipas usam definições de ferramentas ao estilo MCP para organizar isto, mas o MCP tem algumas arestas. O modelo tem que raciocinar sobre todas as ferramentas ao mesmo tempo, e não há muita estrutura para orientar suas decisões. Para além disso, cada definição de ferramenta tem de estar na janela de contexto. Algumas delas são grandes - o MCP do GitHub tem cerca de 26k tokens - o que consome o contexto antes mesmo de o agente começar a trabalhar de verdade.
O Anthropic introduziu as Skills para melhorar esta situação. As habilidades são menores, mais focadas e mais fáceis de carregar sob demanda. Em vez de despejar tudo no contexto, empacota-se a lógica de domínio, os fluxos de trabalho ou os scripts em unidades compactas que o agente pode utilizar apenas quando necessário.
Neste post, explicarei como as habilidades antrópicas funcionam e, em seguida, mostrarei como criar uma habilidade simples no Claude Code que transforma a linguagem natural em uma base de conhecimento apoiada pelo Milvus- uma configuração rápida para o RAG sem necessidade de fiação extra.
O que são habilidades antrópicas?
As habilidades antrópicas (ou habilidades de agente) são apenas pastas que agrupam as instruções, scripts e arquivos de referência que um agente precisa para lidar com uma tarefa específica. Pense nelas como pequenos pacotes de recursos independentes. Uma habilidade pode definir como gerar um relatório, executar uma análise ou seguir um determinado fluxo de trabalho ou conjunto de regras.
A ideia principal é que as competências são modulares e podem ser carregadas a pedido. Em vez de colocar enormes definições de ferramentas na janela de contexto, o agente puxa apenas a competência de que necessita. Isso mantém o uso do contexto baixo, ao mesmo tempo em que dá ao modelo uma orientação clara sobre quais ferramentas existem, quando chamá-las e como executar cada etapa.
O formato é intencionalmente simples e, por isso, já é suportado ou facilmente adaptado em várias ferramentas de desenvolvedor - Claude Code, Cursor, extensões do VS Code, integrações do GitHub, configurações no estilo Codex e assim por diante.
Uma Skill segue uma estrutura de pastas consistente:
skill-name/
├── SKILL.md # Required: Skill instructions and metadata
├── scripts/ # Optional: helper scripts
├── templates/ # Optional: document templates
└── resources/ # Optional: reference materials
1. SKILL.md (Arquivo principal)
Este é o guia de execução do agente - o documento que informa ao agente exatamente como a tarefa deve ser executada. Ele define os metadados da Habilidade (como nome, descrição e palavras-chave do acionador), o fluxo de execução e as configurações padrão. Neste ficheiro, deve descrever claramente:
Quando a Skill deve ser executada: Por exemplo, acionar a Competência quando a entrada do utilizador incluir uma frase como "processar ficheiros CSV com Python".
Como a tarefa deve ser executada: Organize os passos de execução por ordem, tais como: interpretar o pedido do utilizador → chamar scripts de pré-processamento do diretório
scripts/→ gerar o código necessário → formatar a saída utilizando modelos detemplates/.Regras e restrições: Especificar detalhes como convenções de codificação, formatos de saída e como os erros devem ser tratados.
2. scripts/ (Scripts de execução)
Este diretório contém scripts pré-escritos em linguagens como Python, Shell ou Node.js. O agente pode chamar estes scripts diretamente, em vez de gerar o mesmo código repetidamente em tempo de execução. Exemplos típicos incluem create_collection.py e check_env.py.
3. templates/ (Modelos de documentos)
Ficheiros de modelos reutilizáveis que o agente pode utilizar para gerar conteúdo personalizado. Exemplos comuns incluem modelos de relatório ou modelos de configuração.
4. resources/ (Materiais de referência)
Documentos de referência que o agente pode consultar durante a execução, como documentação da API, especificações técnicas ou guias de práticas recomendadas.
No geral, esta estrutura reflecte a forma como o trabalho é entregue a um novo colega de equipa: SKILL.md explica o trabalho, scripts/ fornece ferramentas prontas a utilizar, templates/ define formatos padrão e resources/ fornece informações de base. Com tudo isso no lugar, o agente pode executar a tarefa de forma confiável e com o mínimo de adivinhação.
Tutorial prático: Criação de uma habilidade personalizada para um sistema RAG alimentado por Milvus
Nesta seção, vamos criar uma habilidade personalizada que pode configurar uma coleção do Milvus e montar um pipeline RAG completo a partir de instruções simples em linguagem natural. O objetivo é saltar todo o trabalho de configuração habitual - sem desenho manual de esquemas, sem configuração de índices, sem código padrão. O utilizador diz ao agente o que pretende e o Skill trata das peças do Milvus por si.
Visão geral do design
Pré-requisitos
| Componente | Requisito |
|---|---|
| CLI | claude-code |
| Modelos | GLM 4.7, OpenAI |
| Contentor | Docker |
| Milvus | 2.6.8 |
| Plataforma de configuração de modelos | CC-Switch |
| Gerenciador de pacotes | npm |
| Linguagem de desenvolvimento | Python |
Passo 1: Configuração do ambiente
Instalar claude-code
npm install -g @anthropic-ai/claude-code
Instalar o CC-Switch
Nota: CC-Switch é uma ferramenta de troca de modelos que facilita a troca entre diferentes APIs de modelos ao executar modelos de IA localmente.
Repositório do projeto: https://github.com/farion1231/cc-switch
Selecione Claude e adicione uma chave de API
Verificar o estado atual
Implantar e iniciar o Milvus-Standalone
# Download docker-compose.yml
wget https://github.com/milvus-io/milvus/releases/download/v2.6.8/milvus-standalone-docker-compose.yml -O docker-compose.yml
# Start Milvus (check port mapping: 19530:19530)
docker-compose up -d
# Verify that the services are running
docker ps | grep milvus
# You should see three containers: milvus-standalone, milvus-etcd, milvus-minio
Configurar a chave da API OpenAI
# Add this to ~/.bashrc or ~/.zshrc
OPENAI_API_KEY=your_openai_api_key_here
Etapa 2: criar a habilidade personalizada para o Milvus
Criar a estrutura de diretório
cd ~/.claude/skills/
mkdir -p milvus-skills/example milvus-skills/scripts
Inicializar SKILL.md
Nota: SKILL.md serve como guia de execução do agente. Ele define o que a habilidade faz e como ela deve ser acionada.
name: milvus-collection-builder
description: Create Milvus collections using natural language, supporting both RAG and text search scenarios
Escrever os scripts principais
| Tipo de script | Nome do ficheiro | Finalidade |
|---|---|---|
| Verificação do ambiente | check_env.py | Verifica a versão do Python, as dependências necessárias e a ligação ao Milvus |
| Análise de intenções | intent_parser.py | Converte pedidos como "construir uma base de dados RAG" numa intenção estruturada, como scene=rag |
| Criação de colecções | milvus_builder.py | O construtor principal que gera o esquema da coleção e a configuração do índice |
| Ingestão de dados | insert_milvus_data.py | Carrega documentos, agrupa-os, gera embeddings e escreve dados no Milvus |
| Exemplo 1 | basic_text_search.py | Demonstra como criar um sistema de pesquisa de documentos |
| Exemplo 2 | rag_knowledge_base.py | Demonstra como construir uma base de conhecimentos RAG completa |
Estes scripts mostram como transformar uma competência centrada no Milvus em algo prático: um sistema de pesquisa de documentos funcional e uma configuração inteligente de perguntas e respostas (RAG).
Etapa 3: Ativar a habilidade e executar um teste
Descrever o pedido em linguagem natural
"I want to build an RAG system."
Sistema RAG criado
Inserir dados de amostra
Executar uma consulta
Conclusão
Neste tutorial, nós caminhamos pela construção de um sistema RAG alimentado pelo Milvus usando uma Skill personalizada. O objetivo não era apenas mostrar outra maneira de chamar o Milvus - era mostrar como as habilidades podem transformar o que normalmente é uma configuração pesada e de várias etapas em algo que pode ser reutilizado e iterado. Em vez de definir manualmente esquemas, ajustar índices ou juntar código de fluxo de trabalho, a Skill lida com a maior parte do trabalho burocrático para que se possa concentrar nas partes do RAG que realmente importam.
Isto é apenas o começo. Um pipeline RAG completo tem muitas peças móveis: pré-processamento, fragmentação, configurações de pesquisa híbrida, reranking, avaliação e muito mais. Tudo isso pode ser empacotado como habilidades separadas e composto dependendo do seu caso de uso. Se a sua equipa tiver normas internas para dimensões de vectores, parâmetros de índices, modelos de pedidos ou lógica de recuperação, as competências são uma forma simples de codificar esse conhecimento e torná-lo repetível.
Para novos desenvolvedores, isso diminui a barreira de entrada - não há necessidade de aprender cada detalhe do Milvus antes de colocar algo em funcionamento. Para equipas experientes, reduz a repetição de configurações e ajuda a manter os projectos consistentes entre ambientes. As habilidades não substituem o design cuidadoso do sistema, mas eliminam muitos atritos desnecessários.
A implementação completa está disponível no repositório de código aberto, e você pode explorar mais exemplos criados pela comunidade no mercado de habilidades.
Fique atento!
Também estamos a trabalhar na introdução de competências oficiais do Milvus e do Zilliz Cloud que abrangem padrões RAG comuns e práticas recomendadas de produção. Se tiver ideias ou fluxos de trabalho específicos para os quais pretende obter suporte, junte-se ao nosso canal do Slack e converse com os nossos engenheiros. E se quiser orientação para a sua própria configuração, pode sempre reservar uma sessão Milvus Office Hours.
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word



