Milvus
Zilliz
  • Home
  • Blog
  • O MCP já está desatualizado? A verdadeira razão pela qual a Anthropic enviou habilidades - e como combiná-las com Milvus

O MCP já está desatualizado? A verdadeira razão pela qual a Anthropic enviou habilidades - e como combiná-las com Milvus

  • Tutorials
November 19, 2025
Min Yin

Nas últimas semanas, uma discussão surpreendentemente acalorada irrompeu no X e no Hacker News: Nós realmente precisamos mais de servidores MCP? Alguns desenvolvedores afirmam que o MCP é excessivamente engenhoso, faminto por tokens e fundamentalmente desalinhado com a forma como os agentes devem usar as ferramentas. Outros defendem o MCP como a forma fiável de expor capacidades do mundo real aos modelos de linguagem. Dependendo do tópico que você lê, o MCP é o futuro do uso de ferramentas - ou está morto na chegada.

A frustração é compreensível. O MCP dá-lhe um acesso robusto a sistemas externos, mas também obriga o modelo a carregar esquemas longos, descrições detalhadas e listas de ferramentas extensas. Isso adiciona custos reais. Se descarregar a transcrição de uma reunião e, mais tarde, a introduzir noutra ferramenta, o modelo pode reprocessar o mesmo texto várias vezes, aumentando a utilização de tokens sem qualquer benefício óbvio. Para as equipas que operam em grande escala, isto não é um inconveniente - é uma fatura.

Mas declarar o MCP obsoleto é prematuro. Anthropic - a mesma equipa que inventou o MCP - introduziu discretamente algo novo: Skills. Skills são definições Markdown/YAML leves que descrevem como e quando uma ferramenta deve ser usada. Em vez de despejar esquemas completos na janela de contexto, o modelo primeiro lê metadados compactos e usa isso para planejar. Na prática, as habilidades reduzem drasticamente a sobrecarga de token e dão aos desenvolvedores mais controle sobre a orquestração de ferramentas.

Então, isso significa que o Skills substituirá o MCP? Não exatamente. As habilidades simplificam o planejamento, mas o MCP ainda fornece os recursos reais: ler arquivos, chamar APIs, interagir com sistemas de armazenamento ou conectar-se a uma infraestrutura externa como o Milvus, um banco de dados vetorial de código aberto que sustenta a recuperação semântica rápida em escala, tornando-o um back-end crítico quando suas habilidades precisam de acesso real a dados.

Este post detalha o que as Skills fazem bem, onde o MCP ainda é importante e como ambos se encaixam na arquitetura de agente em evolução do Anthropic. Em seguida, mostraremos como criar suas próprias Skills que se integram de forma limpa com o Milvus.

O que são habilidades do agente Anthropic e como elas funcionam

Um problema de longa data dos agentes de IA tradicionais é que as instruções são apagadas à medida que a conversa cresce.

Mesmo com as instruções do sistema mais cuidadosamente elaboradas, o comportamento do modelo pode se desviar gradualmente ao longo da conversa. Depois de várias voltas, Claude começa a esquecer ou perder o foco nas instruções originais.

O problema está na estrutura da instrução do sistema. É uma injeção única e estática que compete por espaço na janela de contexto do modelo, juntamente com o histórico da conversa, documentos e quaisquer outras entradas. À medida que a janela de contexto se vai enchendo, a atenção do modelo à mensagem do sistema vai-se diluindo, o que leva a uma perda de consistência ao longo do tempo.

As competências foram concebidas para resolver este problema. As competências são pastas que contêm instruções, guiões e recursos. Em vez de depender de um prompt estático do sistema, as habilidades dividem a experiência em pacotes de instruções modulares, reutilizáveis e persistentes que o Claude pode descobrir e carregar dinamicamente quando necessário para uma tarefa.

Quando o Claude inicia uma tarefa, ele primeiro executa uma varredura leve de todas as habilidades disponíveis, lendo apenas seus metadados YAML (apenas algumas dezenas de tokens). Esses metadados fornecem apenas informações suficientes para que o Claude determine se uma habilidade é relevante para a tarefa atual. Em caso afirmativo, o Claude expande para o conjunto completo de instruções (geralmente menos de 5 mil tokens), e recursos ou scripts adicionais são carregados apenas se necessário.

Essa revelação progressiva permite que o Claude inicialize uma habilidade com apenas 30-50 tokens, melhorando significativamente a eficiência e reduzindo a sobrecarga de contexto desnecessária.

Como as habilidades se comparam a prompts, projetos, MCP e subagentes

O cenário atual de ferramentas de modelo pode parecer lotado. Mesmo apenas no ecossistema agêntico do Claude, há vários componentes distintos: Habilidades, prompts, projetos, subagentes e MCP.

Agora que entendemos o que são as habilidades e como elas funcionam por meio de pacotes de instruções modulares e carregamento dinâmico, precisamos saber como as habilidades se relacionam com outras partes do ecossistema do Claude, especialmente o MCP. Aqui está um resumo:

1. Habilidades

As habilidades são pastas que contêm instruções, scripts e recursos. O Claude as descobre e carrega dinamicamente usando a divulgação progressiva: primeiro os metadados, depois as instruções completas e, por fim, todos os arquivos necessários.

Ideal para:

  • Fluxos de trabalho organizacionais (diretrizes de marca, procedimentos de conformidade)

  • Experiência no domínio (fórmulas do Excel, análise de dados)

  • Preferências pessoais (sistemas de tomada de notas, padrões de codificação)

  • Tarefas profissionais que precisam de ser reutilizadas em conversas (revisões de segurança de código baseadas em OWASP)

2. Avisos

Os prompts são as instruções em linguagem natural que dá ao Claude numa conversa. São temporárias e existem apenas na conversa atual.

Ideal para:

  • Pedidos pontuais (resumir um artigo, formatar uma lista)

  • Aperfeiçoamento de conversas (ajustar o tom, adicionar detalhes)

  • Contexto imediato (analisar dados específicos, interpretar conteúdo)

  • Instruções ad-hoc

3. Projectos

Os projectos são espaços de trabalho autónomos com os seus próprios históricos de conversação e bases de conhecimento. Cada projeto oferece uma janela de contexto de 200K. Quando o conhecimento do seu projeto se aproxima dos limites do contexto, o Claude transita sem problemas para o modo RAG, permitindo uma expansão de até 10 vezes na capacidade efectiva.

Ideal para:

  • Contexto persistente (por exemplo, todas as conversas relacionadas ao lançamento de um produto)

  • Organização do espaço de trabalho (contextos separados para diferentes iniciativas)

  • Colaboração em equipa (nos planos Team e Enterprise)

  • Instruções personalizadas (tom ou perspetiva específicos do projeto)

4. Subagentes

Os subagentes são assistentes de IA especializados com as suas próprias janelas de contexto, avisos de sistema personalizados e permissões de ferramentas específicas. Eles podem trabalhar de forma independente e retornar resultados para o agente principal.

Ideal para:

  • Especialização de tarefas (revisão de código, geração de testes, auditorias de segurança)

  • Gerenciamento de contexto (manter a conversa principal focada)

  • Processamento paralelo (vários subagentes trabalhando em diferentes aspectos simultaneamente)

  • Restrição de ferramentas (por exemplo, acesso só de leitura)

5. MCP (Protocolo de Contexto de Modelo)

O Protocolo de Contexto de Modelo (MCP) é uma norma aberta que liga modelos de IA a ferramentas e fontes de dados externas.

Ideal para:

  • Aceder a dados externos (Google Drive, Slack, GitHub, bases de dados)

  • Utilizar ferramentas empresariais (sistemas CRM, plataformas de gestão de projectos)

  • Ligação a ambientes de desenvolvimento (ficheiros locais, IDEs, controlo de versões)

  • Integração com sistemas personalizados (ferramentas proprietárias e fontes de dados)

Com base no exposto, podemos ver que as Competências e o CIM abordam desafios diferentes e trabalham em conjunto para se complementarem.

DimensãoCIMCompetências
Valor principalLiga-se a sistemas externos (bases de dados, APIs, plataformas SaaS)Define especificações de comportamento (como processar e apresentar dados)
Perguntas respondidas"A que é que o Cláudio pode aceder?""O que é que o Claude deve fazer?"
ImplementaçãoProtocolo cliente-servidor + esquema JSONFicheiro Markdown + metadados YAML
Consumo de contextoDezenas de milhares de tokens (acumulações de vários servidores)30-50 tokens por operação
Casos de utilizaçãoConsulta de grandes bases de dados, chamada de APIs do GitHubDefinição de estratégias de pesquisa, aplicação de regras de filtragem, formatação de saída

Tomemos como exemplo a pesquisa de código.

  • MCP (por exemplo, claude-context): Fornece a capacidade de aceder à base de dados de vectores Milvus.

  • Competências: Define o fluxo de trabalho, como priorizar o código modificado mais recentemente, classificar os resultados por relevância e apresentar os dados em uma tabela Markdown.

O MCP fornece a capacidade, enquanto as habilidades definem o processo. Juntas, elas formam um par complementar.

Como criar habilidades personalizadas com Claude-Context e Milvus

O Claude-Context é um plug-in do MCP que adiciona a funcionalidade de pesquisa de código semântico ao Claude Code, transformando toda a base de código no contexto do Claude.

Pré-requisito

Requisitos do sistema:

  • Node.js: Versão >= 20.0.0 e < 24.0.0

  • Chave de API do OpenAI (para modelos de incorporação)

  • Chave de APIdo Zilliz Cloud (serviço Milvus gerido)

Etapa 1: configurar o serviço MCP (claude-context)

Execute o seguinte comando no terminal:

claude mcp add claude-context \
  -e OPENAI_API_KEY=sk-your-openai-api-key \
  -e MILVUS_ADDRESS=https://xxxxxxxxx-cn-hangzhou.cloud.zilliz.com.cn \
  -e MILVUS_TOKEN=your-zilliz-cloud-api-key \
  -e COLLECTION_NAME=medium_articles \
  -- npx @zilliz/claude-context-mcp@latest

Verificar a configuração:

claude mcp list

A configuração do MCP está concluída. O Claude pode agora aceder à base de dados de vectores do Milvus.

Passo 2: Criar a competência

Crie o diretório Skills:

mkdir -p ~/.claude/skills/milvus-code-search
cd ~/.claude/skills/milvus-code-search

Criar o ficheiro SKILL.md:

---
name: milvus-code-search
description: A semantic code search and architecture analysis skill designed for the Milvus codebase
---

## Instructions When the user asks questions related to the Milvus codebase, I will:

1. Code Search : Use semantic search to locate relevant code snippets across the Milvus repository
2. Architecture Analysis : Analyze Milvus’s module structure, component relationships, and design patterns
3. Feature Explanation : Explain how specific features are implemented and how the corresponding logic works
4. Development Guidance : Provide suggestions, best practices, and improvement ideas for modifying the code

## Target Repository

  • Core Modules:
    • <span class="hljs-keyword">internal</span>/ — Core internal components
    • pkg/ — Public packages and utilities
    • client/ — Go client implementation
    • cmd/ — Command-line tools

## Usage Examples

### Architecture Query User: How does Milvus’s query coordinator work?
Assistant: (searching for querycoordv2) Let me walk you through how the query coordinator operates in Milvus…

### Feature Implementation User: How does Milvus implement vector indexing?
Assistant: (searching for index code) The vector indexing logic in Milvus is mainly implemented in the following modules…

### Code Understanding User: What does this function do? (points to a specific file)
Assistant: (analyzing the surrounding code) Based on the context of the Milvus codebase, this function is responsible for

### Development Guidance User: How can I add a new vector distance metric to Milvus?
Assistant: (searching for distance implementations) Following the existing pattern, you can add a new distance method by

## Best Practices 1. Precise Search : Use specific technical terms and module names
2. Contextual Understanding : Interpret code within Milvus’s overall system architecture
3. Actionable Advice : Provide practical, implementation-ready suggestions
4. Performance Awareness : Consider Milvus’s requirements as a high-performance vector database


A custom code-search Skill tailored for the open-source Milvus vector database project.


Etapa 3: reiniciar o Claude para aplicar as habilidades

Execute o seguinte comando para reiniciar o Claude:

claude

Nota: Depois que a configuração estiver concluída, você pode usar imediatamente as habilidades para consultar a base de código do Milvus.

Abaixo está um exemplo de como isso funciona.

Consulta: Como funciona o Milvus QueryCoord?

Conclusão

No fundo, as Skills funcionam como um mecanismo de encapsulamento e transferência de conhecimento especializado. Ao usar Skills, a IA pode herdar a experiência de uma equipa e seguir as melhores práticas da indústria - quer seja uma lista de verificação para revisões de código ou padrões de documentação. Quando esse conhecimento tácito é explicitado por meio de arquivos Markdown, a qualidade dos resultados gerados pela IA pode ter uma melhoria significativa.

Olhando para o futuro, a capacidade de aproveitar as competências de forma eficaz pode tornar-se um diferenciador chave na forma como as equipas e os indivíduos utilizam a IA em seu benefício.

À medida que explora o potencial da IA na sua organização, o Milvus é uma ferramenta essencial para gerir e pesquisar dados vectoriais em grande escala. Ao combinar o poderoso banco de dados vetorial do Milvus com ferramentas de IA como o Skills, você pode melhorar não apenas seus fluxos de trabalho, mas também a profundidade e a velocidade de seus insights orientados por dados.

Tem dúvidas ou quer um mergulho profundo em qualquer recurso? Junte-se ao nosso canal Discord para conversar com nossos engenheiros e outros engenheiros de IA na comunidade. Também pode reservar uma sessão individual de 20 minutos para obter informações, orientação e respostas às suas perguntas através do Milvus Office Hours.

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    Continue Lendo