벡터 데이터와 스칼라 데이터 간의 하이브리드 검색을 실행하는 데 사용되는 쿼리 노드의 관련 구성입니다.
설명 |
기본값 |
쿼리 노드가 세그먼트 상태, CPU 사용량, 메모리 사용량, 상태 등을 포함한 노드 통계 정보를 게시하는 간격입니다. 단위: ms. |
1000 |
설명 |
기본값 |
knowhere의 스레드 풀에 있는 스레드 수입니다. 디스크가 활성화된 경우 풀 크기는 knowhereThreadPoolNumRatio([1, 32])에 곱해집니다. |
4 |
설명 |
기본값 |
세그코어가 세그먼트를 청크로 나누는 행 수입니다. |
128 |
설명 |
기본값 |
증가하는 세그먼트와 아직 색인되지 않은 세그먼트에 대한 임시 색인을 생성하여 검색 성능을 개선할지 여부입니다.
Milvus는 결국 모든 세그먼트를 봉인하고 색인하지만, 이 기능을 활성화하면 데이터 삽입 후 즉각적인 쿼리에 대한 검색 성능이 최적화됩니다.
이 설정의 기본값은 true로, Milvus가 증가하는 세그먼트와 검색 시 색인되지 않은 봉인된 세그먼트에 대한 임시 색인을 생성한다는 것을 나타냅니다. |
true |
설명 |
기본값 |
임시 인덱스 nlist, sqrt(chunkRows)를 설정하는 것이 좋으며, chunkRows/8보다 작아야 합니다. |
128 |
설명 |
기본값 |
정확도 요구 사항에 따라 작은 인덱스를 검색할 nprobe는 nlist보다 작아야 합니다. |
16 |
설명 |
기본값 |
임시 인덱스 구축에 필요한 추가 메모리 |
1.15 |
설명 |
기본값 |
CPU 수와 일치하는 빌드 중간 인덱스 병렬 비율 |
0.5 |
설명 |
기본값 |
강력한 일관성 점수 계산 로직을 사용하도록 설정합니다. |
false |
설명 |
기본값 |
세그먼트를 로드하는 동안 메모리 사용량을 계산하는 곱셈 계수입니다. |
1 |
설명 |
기본값 |
쿼리 노드가 디스크 인덱스를 로드하고 디스크 인덱스에서 검색을 사용하도록 설정합니다. |
false |
설명 |
기본값 |
2GB, 2 * 1024 *1024 *1024 |
2147483648 |
설명 |
기본값 |
청크 캐시의 미리 읽기 정책, 옵션: '일반, 랜덤, 순차, willneed, dontneed' |
willneed |
설명 |
기본값 |
옵션: 비동기, 동기화, 비활성화.
청크 캐시 워밍업 필요성을 지정합니다.
1. "동기화" 또는 "비동기화"로 설정하면 원본 벡터 데이터가 로드 과정에서 동기식/비동기식으로
청크 캐시에 동기식/비동기식으로 로드됩니다. 이 접근 방식은 쿼리/검색 지연 시간을 크게 줄일 수 있는 잠재력이 있습니다.
을 크게 줄일 수 있는 잠재력을 가지고 있지만, 동시에 디스크 사용량이 증가합니다;
2. '비활성화'로 설정하면 원본 벡터 데이터는 검색/쿼리 중에만 청크 캐시에 로드됩니다. |
disable |
설명 |
기본값 |
데이터 로딩에 mmap 사용 |
false |
설명 |
기본값 |
원시 데이터 증가에 mmap을 사용하도록 설정합니다. |
false |
설명 |
기본값 |
데이터 로딩에 지연 로드 활성화 |
false |
설명 |
기본값 |
지연 로드 검색 및 검색을 시작하기 전 최대 대기 시간 초과 기간(밀리초) |
30000 |
설명 |
기본값 |
지연 로드를 위한 대기 요청 리소스의 최대 대기 시간(밀리초), 기본값은 5초입니다. |
5000 |
설명 |
기본값 |
지연 로드를 위한 대기 요청 리소스에 대한 재시도 간격(밀리초), 기본값은 2초입니다. |
2000 |
설명 |
기본값 |
지연 로드를 위한 최대 재시도 횟수, 기본값 1 |
1 |
설명 |
기본값 |
지연 로드를 위한 최대 퇴거 횟수, 기본값 1 |
1 |
설명 |
기본값 |
최대 읽기 동시성 비율은 읽기 작업(검색 작업과 쿼리 작업)의 동시성 비율입니다.
최대 읽기 동시성은 hardware.GetCPUNum * maxReadConcurrentRatio의 값입니다.
기본값은 2.0으로, 최대 읽기 동시성은 hardware.GetCPUNum * 2의 값입니다.
최대 읽기 동시성은 1보다 크거나 같아야 하며 hardware.GetCPUNum * 100보다 작아야 합니다.
(0, 100] |
1 |
설명 |
기본값 |
읽기 작업 CPU 사용량을 추정하는 데 사용되는 비율입니다. |
10 |
설명 |
기본값 |
FIFO: FIFO 대기열이 스케줄을 지원합니다.
사용자 작업 폴링:
사용자의 작업을 하나씩 폴링하여 스케줄링합니다.
스케줄링은 작업 세분화에 따라 공정하게 이루어집니다.
이 정책은 인증을 위한 사용자 아이디를 기반으로 합니다.
그리고 빈 사용자 아이디는 동일한 사용자로 간주됩니다.
다중 사용자가 없으면 정책은 FIFO로 붕괴됩니다." |
fifo |
설명 |
기본값 |
대기열이 비어 있는 동안 대기열이 유지되는 기간(초)을 제어합니다. |
60 |
설명 |
기본값 |
사용자 작업 폴링 정책을 사용할 때 교차 사용자 그룹화를 사용하도록 설정합니다. (사용자의 작업이 서로 병합될 수 없는 경우 비활성화합니다.) |
false |
설명 |
기본값 |
스케줄러에서 사용자당 최대 보류 중인 작업 수 |
1024 |
설명 |
기본값 |
쿼리 노드의 흐름 그래프에서 작업 대기열 캐시의 최대 크기입니다. |
16 |
설명 |
기본값 |
플로우 그래프에서 병렬로 실행되는 최대 작업 수 |
1024 |
설명 |
기본값 |
파티션 통계를 사용하여 샤드 위임자의 검색/쿼리에서 데이터를 정리합니다. |
false |
설명 |
기본값 |
블룸 필터에 PK를 적용할 때 병렬 계수, 기본값은 4*CPU_CORE_NUM입니다. |
4 |
설명 |
기본값 |
스트림 쿼리의 배치 크기 반환 |
4194304 |
설명 |
기본값 |
워커 쿼리노드 클라이언트 풀의 크기 |
10 |
설명 |
기본값 |
쿼리노드의 TCP/IP 주소입니다. 지정하지 않으면 첫 번째 유니캐스트 가능한 주소를 사용합니다. |
|
설명 |
기본값 |
쿼리 노드의 TCP 포트 |
21123 |
설명 |
기본값 |
쿼리 노드가 전송할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
536870912 |
설명 |
기본값 |
쿼리 노드가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
268435456 |
설명 |
기본값 |
쿼리 노드의 클라이언트가 보낼 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
268435456 |
설명 |
기본값 |
쿼리 노드의 클라이언트가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
536870912 |