milvus-logo
LFAI
홈페이지
  • 관리 가이드

쿼리 노드 관련 구성

벡터 데이터와 스칼라 데이터 간의 하이브리드 검색을 실행하는 데 사용되는 쿼리 노드의 관련 구성입니다.

queryNode.stats.publishInterval

설명 기본값
쿼리 노드가 세그먼트 상태, CPU 사용량, 메모리 사용량, 상태 등을 포함한 노드 통계 정보를 게시하는 간격입니다. 단위: ms. 1000

queryNode.segcore.knowhereThreadPoolNumRatio

설명 기본값
knowhere의 스레드 풀에 있는 스레드 수입니다. 디스크가 활성화된 경우 풀 크기는 knowhereThreadPoolNumRatio([1, 32])에 곱해집니다. 4

queryNode.segcore.chunkRows

설명 기본값
세그코어가 세그먼트를 청크로 나누는 행 수입니다. 128

queryNode.segcore.interimIndex.enableIndex

설명 기본값
  • 증가하는 세그먼트와 아직 색인되지 않은 세그먼트에 대한 임시 색인을 생성하여 검색 성능을 개선할지 여부입니다.
  • Milvus는 결국 모든 세그먼트를 봉인하고 색인하지만, 이 기능을 활성화하면 데이터 삽입 후 즉각적인 쿼리에 대한 검색 성능이 최적화됩니다.
  • 이 설정의 기본값은 true로, Milvus가 증가하는 세그먼트와 검색 시 색인되지 않은 봉인된 세그먼트에 대한 임시 색인을 생성한다는 것을 나타냅니다.
  • true

    queryNode.segcore.interimIndex.nlist

    설명 기본값
    임시 인덱스 nlist, sqrt(chunkRows)를 설정하는 것이 좋으며, chunkRows/8보다 작아야 합니다. 128

    queryNode.segcore.interimIndex.nprobe

    설명 기본값
    정확도 요구 사항에 따라 작은 인덱스를 검색할 nprobe는 nlist보다 작아야 합니다. 16

    queryNode.segcore.interimIndex.memExpansionRate

    설명 기본값
    임시 인덱스 구축에 필요한 추가 메모리 1.15

    queryNode.segcore.interimIndex.buildParallelRate

    설명 기본값
    CPU 수와 일치하는 빌드 중간 인덱스 병렬 비율 0.5

    queryNode.segcore.knowhereScoreConsistency

    설명 기본값
    강력한 일관성 점수 계산 로직을 사용하도록 설정합니다. false

    queryNode.loadMemoryUsageFactor

    설명 기본값
    세그먼트를 로드하는 동안 메모리 사용량을 계산하는 곱셈 계수입니다. 1

    queryNode.enableDisk

    설명 기본값
    쿼리 노드가 디스크 인덱스를 로드하고 디스크 인덱스에서 검색을 사용하도록 설정합니다. false

    queryNode.cache.memoryLimit

    설명 기본값
    2GB, 2 * 1024 *1024 *1024 2147483648

    queryNode.cache.readAheadPolicy

    설명 기본값
    청크 캐시의 미리 읽기 정책, 옵션: '일반, 랜덤, 순차, willneed, dontneed' willneed

    queryNode.cache.warmup

    설명 기본값
  • 옵션: 비동기, 동기화, 비활성화.
  • 청크 캐시 워밍업 필요성을 지정합니다.
  • 1. "동기화" 또는 "비동기화"로 설정하면 원본 벡터 데이터가 로드 과정에서 동기식/비동기식으로
  • 청크 캐시에 동기식/비동기식으로 로드됩니다. 이 접근 방식은 쿼리/검색 지연 시간을 크게 줄일 수 있는 잠재력이 있습니다.
  • 을 크게 줄일 수 있는 잠재력을 가지고 있지만, 동시에 디스크 사용량이 증가합니다;
  • 2. '비활성화'로 설정하면 원본 벡터 데이터는 검색/쿼리 중에만 청크 캐시에 로드됩니다.
  • disable

    queryNode.mmap.mmapEnabled

    설명 기본값
    데이터 로딩에 mmap 사용 false

    queryNode.mmap.growingMmapEnabled

    설명 기본값
    원시 데이터 증가에 mmap을 사용하도록 설정합니다. false

    queryNode.mmap.fixedFileSizeForMmapAlloc

    설명 기본값
    MMAP 청크 관리자를 위한 TMP 파일 크기 1

    queryNode.mmap.maxDiskUsagePercentageForMmapAlloc

    설명 기본값
    MMAP 청크 관리자에서 사용되는 디스크 비율 50

    queryNode.lazyload.enabled

    설명 기본값
    데이터 로딩에 지연 로드 활성화 false

    queryNode.lazyload.waitTimeout

    설명 기본값
    지연 로드 검색 및 검색을 시작하기 전 최대 대기 시간 초과 기간(밀리초) 30000

    queryNode.lazyload.requestResourceTimeout

    설명 기본값
    지연 로드를 위한 대기 요청 리소스의 최대 대기 시간(밀리초), 기본값은 5초입니다. 5000

    queryNode.lazyload.requestResourceRetryInterval

    설명 기본값
    지연 로드를 위한 대기 요청 리소스에 대한 재시도 간격(밀리초), 기본값은 2초입니다. 2000

    queryNode.lazyload.maxRetryTimes

    설명 기본값
    지연 로드를 위한 최대 재시도 횟수, 기본값 1 1

    queryNode.lazyload.maxEvictPerRetry

    설명 기본값
    지연 로드를 위한 최대 퇴거 횟수, 기본값 1 1

    queryNode.scheduler.maxReadConcurrentRatio

    설명 기본값
  • 최대 읽기 동시성 비율은 읽기 작업(검색 작업과 쿼리 작업)의 동시성 비율입니다.
  • 최대 읽기 동시성은 hardware.GetCPUNum * maxReadConcurrentRatio의 값입니다.
  • 기본값은 2.0으로, 최대 읽기 동시성은 hardware.GetCPUNum * 2의 값입니다.
  • 최대 읽기 동시성은 1보다 크거나 같아야 하며 hardware.GetCPUNum * 100보다 작아야 합니다.
  • (0, 100]
  • 1

    queryNode.scheduler.cpuRatio

    설명 기본값
    읽기 작업 CPU 사용량을 추정하는 데 사용되는 비율입니다. 10

    queryNode.scheduler.scheduleReadPolicy.name

    설명 기본값
  • FIFO: FIFO 대기열이 스케줄을 지원합니다.
  • 사용자 작업 폴링:
  • 사용자의 작업을 하나씩 폴링하여 스케줄링합니다.
  • 스케줄링은 작업 세분화에 따라 공정하게 이루어집니다.
  • 이 정책은 인증을 위한 사용자 아이디를 기반으로 합니다.
  • 그리고 빈 사용자 아이디는 동일한 사용자로 간주됩니다.
  • 다중 사용자가 없으면 정책은 FIFO로 붕괴됩니다."
  • fifo

    queryNode.scheduler.scheduleReadPolicy.taskQueueExpire

    설명 기본값
    대기열이 비어 있는 동안 대기열이 유지되는 기간(초)을 제어합니다. 60

    queryNode.scheduler.scheduleReadPolicy.enableCrossUserGrouping

    설명 기본값
    사용자 작업 폴링 정책을 사용할 때 교차 사용자 그룹화를 사용하도록 설정합니다. (사용자의 작업이 서로 병합될 수 없는 경우 비활성화합니다.) false

    queryNode.scheduler.scheduleReadPolicy.maxPendingTaskPerUser

    설명 기본값
    스케줄러에서 사용자당 최대 보류 중인 작업 수 1024

    queryNode.dataSync.flowGraph.maxQueueLength

    설명 기본값
    쿼리 노드의 흐름 그래프에서 작업 대기열 캐시의 최대 크기입니다. 16

    queryNode.dataSync.flowGraph.maxParallelism

    설명 기본값
    플로우 그래프에서 병렬로 실행되는 최대 작업 수 1024

    queryNode.enableSegmentPrune

    설명 기본값
    파티션 통계를 사용하여 샤드 위임자의 검색/쿼리에서 데이터를 정리합니다. false

    queryNode.bloomFilterApplyParallelFactor

    설명 기본값
    블룸 필터에 PK를 적용할 때 병렬 계수, 기본값은 4*CPU_CORE_NUM입니다. 4

    queryNode.queryStreamBatchSize

    설명 기본값
    스트림 쿼리의 배치 크기 반환 4194304

    queryNode.workerPooling.size

    설명 기본값
    워커 쿼리노드 클라이언트 풀의 크기 10

    queryNode.ip

    설명 기본값
    쿼리노드의 TCP/IP 주소입니다. 지정하지 않으면 첫 번째 유니캐스트 가능한 주소를 사용합니다.

    queryNode.port

    설명 기본값
    쿼리 노드의 TCP 포트 21123

    queryNode.grpc.serverMaxSendSize

    설명 기본값
    쿼리 노드가 전송할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 536870912

    queryNode.grpc.serverMaxRecvSize

    설명 기본값
    쿼리 노드가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 268435456

    queryNode.grpc.clientMaxSendSize

    설명 기본값
    쿼리 노드의 클라이언트가 보낼 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 268435456

    queryNode.grpc.clientMaxRecvSize

    설명 기본값
    쿼리 노드의 클라이언트가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 536870912

    번역DeepLogo

    목차 목록
    피드백

    이 페이지가 도움이 되었나요?