벡터 데이터와 스칼라 데이터 간의 하이브리드 검색을 실행하는 데 사용되는 쿼리 노드의 관련 구성입니다.
| 설명 |
기본값 |
| 쿼리 노드가 세그먼트 상태, CPU 사용량, 메모리 사용량, 상태 등을 포함한 노드 통계 정보를 게시하는 간격입니다. 단위: ms. |
1000 |
| 설명 |
기본값 |
| knowhere의 스레드 풀에 있는 스레드 수입니다. 디스크가 활성화된 경우 풀 크기는 knowhereThreadPoolNumRatio([1, 32])에 곱해집니다. |
4 |
| 설명 |
기본값 |
| 세그코어가 세그먼트를 청크로 나누는 행 수입니다. |
128 |
| 설명 |
기본값 |
|
증가하는 세그먼트와 아직 색인되지 않은 세그먼트에 대한 임시 색인을 생성하여 검색 성능을 개선할지 여부입니다.
Milvus는 결국 모든 세그먼트를 봉인하고 색인하지만, 이 기능을 활성화하면 데이터 삽입 후 즉각적인 쿼리에 대한 검색 성능이 최적화됩니다.
이 설정의 기본값은 true로, Milvus가 증가하는 세그먼트와 검색 시 색인되지 않은 봉인된 세그먼트에 대한 임시 색인을 생성한다는 것을 나타냅니다. |
true |
| 설명 |
기본값 |
| 임시 인덱스 nlist, sqrt(chunkRows)를 설정하는 것이 좋으며, chunkRows/8보다 작아야 합니다. |
128 |
| 설명 |
기본값 |
| 정확도 요구 사항에 따라 작은 인덱스를 검색할 nprobe는 nlist보다 작아야 합니다. |
16 |
| 설명 |
기본값 |
| 임시 인덱스 구축에 필요한 추가 메모리 |
1.15 |
| 설명 |
기본값 |
| CPU 수와 일치하는 빌드 중간 인덱스 병렬 비율 |
0.5 |
| 설명 |
기본값 |
| 강력한 일관성 점수 계산 로직을 사용하도록 설정합니다. |
false |
| 설명 |
기본값 |
| 세그먼트를 로드하는 동안 메모리 사용량을 계산하는 곱셈 계수입니다. |
1 |
| 설명 |
기본값 |
| 쿼리 노드가 디스크 인덱스를 로드하고 디스크 인덱스에서 검색을 사용하도록 설정합니다. |
false |
| 설명 |
기본값 |
| 2GB, 2 * 1024 *1024 *1024 |
2147483648 |
| 설명 |
기본값 |
| 청크 캐시의 미리 읽기 정책, 옵션: '일반, 랜덤, 순차, willneed, dontneed' |
willneed |
| 설명 |
기본값 |
|
옵션: 비동기, 동기화, 비활성화.
청크 캐시 워밍업 필요성을 지정합니다.
1. "동기화" 또는 "비동기화"로 설정하면 원본 벡터 데이터가 로드 과정에서 동기식/비동기식으로
청크 캐시에 동기식/비동기식으로 로드됩니다. 이 접근 방식은 쿼리/검색 지연 시간을 크게 줄일 수 있는 잠재력이 있습니다.
을 크게 줄일 수 있는 잠재력을 가지고 있지만, 동시에 디스크 사용량이 증가합니다;
2. '비활성화'로 설정하면 원본 벡터 데이터는 검색/쿼리 중에만 청크 캐시에 로드됩니다. |
disable |
| 설명 |
기본값 |
| 벡터 데이터 로드를 위해 mmap 사용 |
false |
| 설명 |
기본값 |
| 벡터 인덱스 로드를 위해 mmap 사용 |
false |
| 설명 |
기본값 |
| 스칼라 데이터 로드에 mmap 사용 |
false |
| 설명 |
기본값 |
| 스칼라 인덱스 로딩에 mmap 사용 |
false |
| 설명 |
기본값 |
| 청크 캐시(원시 벡터 검색)에 mmap을 사용하도록 설정합니다. |
true |
| 설명 |
기본값 |
|
메모리 매핑(mmap)을 활성화하여 증가하는 원시 데이터의 처리를 최적화합니다.
이 기능을 활성화하면 새로 추가되거나 수정된 데이터와 관련된 메모리 오버헤드가 크게 최소화됩니다.
그러나 이러한 최적화는 영향을 받는 데이터 세그먼트의 쿼리 지연 시간을 약간 감소시키는 대가를 치를 수 있습니다. |
false |
| 설명 |
기본값 |
| 데이터 로딩에 지연 로드 활성화 |
false |
| 설명 |
기본값 |
| 지연 로드 검색 및 검색을 시작하기 전 최대 대기 시간 초과 기간(밀리초) |
30000 |
| 설명 |
기본값 |
| 지연 로드를 위한 대기 요청 리소스의 최대 대기 시간(밀리초), 기본값은 5초입니다. |
5000 |
| 설명 |
기본값 |
| 지연 로드를 위한 대기 요청 리소스에 대한 재시도 간격(밀리초), 기본값은 2초입니다. |
2000 |
| 설명 |
기본값 |
| 지연 로드를 위한 최대 재시도 횟수, 기본값 1 |
1 |
| 설명 |
기본값 |
| 지연 로드를 위한 최대 퇴거 횟수, 기본값 1 |
1 |
| 설명 |
기본값 |
| 일부 스칼라 인덱스에 대해 인덱스 오프셋 캐시 활성화, 이제 비트맵 인덱스 전용, 이 매개 변수를 활성화하면 인덱스에서 원시 데이터를 검색하는 성능을 향상시킬 수 있습니다. |
false |
| 설명 |
기본값 |
|
최대 읽기 동시성 비율은 읽기 작업(검색 작업과 쿼리 작업)의 동시성 비율입니다.
최대 읽기 동시성은 hardware.GetCPUNum * maxReadConcurrentRatio의 값입니다.
기본값은 2.0으로, 최대 읽기 동시성은 hardware.GetCPUNum * 2의 값입니다.
최대 읽기 동시성은 1보다 크거나 같아야 하며 hardware.GetCPUNum * 100보다 작아야 합니다.
(0, 100] |
1 |
| 설명 |
기본값 |
| 읽기 작업 CPU 사용량을 추정하는 데 사용되는 비율입니다. |
10 |
| 설명 |
기본값 |
|
FIFO: FIFO 대기열이 스케줄을 지원합니다.
사용자 작업 폴링:
사용자의 작업을 하나씩 폴링하여 스케줄링합니다.
스케줄링은 작업 세분화에 따라 공정하게 이루어집니다.
이 정책은 인증을 위한 사용자 아이디를 기반으로 합니다.
그리고 빈 사용자 아이디는 동일한 사용자로 간주됩니다.
다중 사용자가 없으면 정책은 FIFO로 붕괴됩니다." |
fifo |
| 설명 |
기본값 |
| 대기열이 비어 있는 동안 대기열이 유지되는 기간(초)을 제어합니다. |
60 |
| 설명 |
기본값 |
| 사용자 작업 폴링 정책을 사용할 때 교차 사용자 그룹화를 사용하도록 설정합니다. (사용자의 작업이 서로 병합될 수 없는 경우 비활성화합니다.) |
false |
| 설명 |
기본값 |
| 스케줄러에서 사용자당 최대 보류 중인 작업 수 |
1024 |
| 설명 |
기본값 |
| 위임자 레벨 제로 삭제 전달 정책, 가능한 옵션["FilterByBF", "RemoteLoad"] |
FilterByBF |
| 설명 |
기본값 |
| 위임자 스트리밍 삭제 전달 정책, 사용 가능한 옵션["FilterByBF", "직접"] |
FilterByBF |
| 설명 |
기본값 |
| 쿼리 노드의 흐름 그래프에서 작업 대기열 캐시의 최대 크기입니다. |
16 |
| 설명 |
기본값 |
| 플로우 그래프에서 병렬로 실행되는 최대 작업 수 |
1024 |
| 설명 |
기본값 |
| 파티션 통계를 사용하여 샤드 위임자의 검색/쿼리에서 데이터를 정리합니다. |
false |
| 설명 |
기본값 |
| 스트림 쿼리의 최소 배치 크기 반환 |
4194304 |
| 설명 |
기본값 |
| 스트림 쿼리의 최대 배치 크기 반환 |
134217728 |
| 설명 |
기본값 |
| 블룸 필터에 PK를 적용할 병렬 계수, 기본값은 4*CPU_CORE_NUM입니다. |
4 |
| 설명 |
기본값 |
| 워커 쿼리노드 클라이언트 풀의 크기 |
10 |
| 설명 |
기본값 |
| 쿼리노드의 TCP/IP 주소입니다. 지정하지 않으면 첫 번째 유니캐스트 가능한 주소를 사용합니다. |
|
| 설명 |
기본값 |
| 쿼리 노드의 TCP 포트 |
21123 |
| 설명 |
기본값 |
| 쿼리 노드가 전송할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
536870912 |
| 설명 |
기본값 |
| 쿼리 노드가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
268435456 |
| 설명 |
기본값 |
| 쿼리 노드의 클라이언트가 보낼 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
268435456 |
| 설명 |
기본값 |
| 쿼리 노드의 클라이언트가 수신할 수 있는 각 RPC 요청의 최대 크기, 단위: 바이트 |
536870912 |