JSON 필드 사용하기
이 가이드에서는 기본 및 고급 연산자를 사용하여 JSON 필드에 JSON 값을 삽입하고 검색 및 쿼리하는 등 JSON 필드를 사용하는 방법을 설명합니다.
개요
JSON은 가볍고 간단한 텍스트 기반 데이터 형식인 자바스크립트 객체 표기법의 약자입니다. JSON의 데이터는 키-값 쌍으로 구조화되며, 모든 키는 숫자, 문자열, 부울, 목록 또는 배열의 값에 매핑되는 문자열입니다. Milvus 클러스터를 사용하면 컬렉션에 필드 값으로 사전을 저장할 수 있습니다.
예를 들어, 다음 코드는 키 색상이 있는 JSON 필드를 포함하는 키-값 쌍을 무작위로 생성합니다.
# 3. Insert randomly generated vectors
colors = ["green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey"]
data = []
for i in range(1000):
current_color = random.choice(colors)
current_tag = random.randint(1000, 9999)
current_coord = [ random.randint(0, 40) for _ in range(3) ]
current_ref = [ [ random.choice(colors) for _ in range(3) ] for _ in range(3) ]
data.append({
"id": i,
"vector": [ random.uniform(-1, 1) for _ in range(5) ],
"color": {
"label": current_color,
"tag": current_tag,
"coord": current_coord,
"ref": current_ref
}
})
print(data[0])
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;
import java.util.Map;
import java.util.Random;
import com.alibaba.fastjson.JSONObject;
// 3. Insert randomly generated vectors and JSON data into the collection
List<String> colors = Arrays.asList("green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey");
List<JSONObject> data = new ArrayList<>();
for (int i=0; i<1000; i++) {
Random rand = new Random();
String current_color = colors.get(rand.nextInt(colors.size()-1));
Integer current_tag = rand.nextInt(8999) + 1000;
List<Integer> current_coord = Arrays.asList(rand.nextInt(40), rand.nextInt(40), rand.nextInt(40));
List<List<String>> current_ref = Arrays.asList(
Arrays.asList(colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1))),
Arrays.asList(colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1))),
Arrays.asList(colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1)), colors.get(rand.nextInt(colors.size()-1)))
);
JSONObject row = new JSONObject();
row.put("id", Long.valueOf(i));
row.put("vector", Arrays.asList(rand.nextFloat(), rand.nextFloat(), rand.nextFloat(), rand.nextFloat(), rand.nextFloat()));
JSONObject color = new JSONObject();
color.put("label", current_color);
color.put("tag", current_tag);
color.put("coord", current_coord);
color.put("ref", current_ref);
row.put("color", color);
data.add(row);
}
System.out.println(JSONObject.toJSON(data.get(0)));
// 3. Insert randomly generated vectors
const colors = ["green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey"]
var data = []
for (let i = 0; i < 1000; i++) {
const current_color = colors[Math.floor(Math.random() * colors.length)]
const current_tag = Math.floor(Math.random() * 8999 + 1000)
const current_coord = Array(3).fill(0).map(() => Math.floor(Math.random() * 40))
const current_ref = [ Array(3).fill(0).map(() => colors[Math.floor(Math.random() * colors.length)]) ]
data.push({
id: i,
vector: [Math.random(), Math.random(), Math.random(), Math.random(), Math.random()],
color: {
label: current_color,
tag: current_tag,
coord: current_coord,
ref: current_ref
}
})
}
console.log(data[0])
첫 번째 항목을 확인하면 생성된 데이터의 구조를 볼 수 있습니다.
{
"id": 0,
"vector": [
-0.8017921296923975,
0.550046715206634,
0.764922589768134,
0.6371433836123146,
0.2705233937454232
],
"color": {
"label": "blue",
"tag": 9927,
"coord": [
22,
36,
6
],
"ref": [
[
"blue",
"green",
"white"
],
[
"black",
"green",
"pink"
],
[
"grey",
"black",
"brown"
]
]
}
}
참고
목록이나 배열의 모든 값이 동일한 데이터 유형인지 확인하세요.
JSON 필드 값에 중첩된 사전은 모두 문자열로 간주됩니다.
다른 문자는 필터링이나 검색에 문제를 일으킬 수 있으므로 영숫자와 밑줄만 사용하여 JSON 키 이름을 지정하세요.
- 현재 JSON 필드 색인화는 사용할 수 없으므로 필터링에 시간이 많이 소요될 수 있습니다. 하지만 이 제한 사항은 향후 릴리스에서 해결될 예정입니다.
JSON 필드 정의
JSON 필드를 정의하려면 다른 유형의 필드를 정의할 때와 동일한 절차를 따르기만 하면 됩니다.
매개변수에 대한 자세한 내용은 MilvusClient
, create_schema()
, add_field()
, add_index()
, create_collection()
및 get_load_state()
를 참조하세요.
파라미터에 대한 자세한 내용은 MilvusClientV2
, createSchema()
, addField()
, IndexParam
, createCollection()
및 getLoadState()
를 참조하세요.
매개 변수에 대한 자세한 내용은 MilvusClient
과 createCollection()
및 createCollection()
를 참조하세요.
import random, time
from pymilvus import connections, MilvusClient, DataType
CLUSTER_ENDPOINT = "http://localhost:19530"
# 1. Set up a Milvus client
client = MilvusClient(
uri=CLUSTER_ENDPOINT
)
# 2. Create a collection
schema = MilvusClient.create_schema(
auto_id=False,
enable_dynamic_field=False,
)
schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True)
schema.add_field(field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=5)
schema.add_field(field_name="color", datatype=DataType.JSON)
index_params = MilvusClient.prepare_index_params()
index_params.add_index(
field_name="id",
index_type="STL_SORT"
)
index_params.add_index(
field_name="vector",
index_type="IVF_FLAT",
metric_type="L2",
params={"nlist": 1024}
)
client.create_collection(
collection_name="test_collection",
schema=schema,
index_params=index_params
)
res = client.get_load_state(
collection_name="test_collection"
)
print(res)
# Output
#
# {
# "state": "<LoadState: Loaded>"
# }
String CLUSTER_ENDPOINT = "http://localhost:19530";
// 1. Connect to Milvus server
ConnectConfig connectConfig = ConnectConfig.builder()
.uri(CLUSTER_ENDPOINT)
.build();
MilvusClientV2 client = new MilvusClientV2(connectConfig);
// 2. Create a collection in customized setup mode
// 2.1 Create schema
CreateCollectionReq.CollectionSchema schema = client.createSchema();
// 2.2 Add fields to schema
schema.addField(AddFieldReq.builder()
.fieldName("id")
.dataType(DataType.Int64)
.isPrimaryKey(true)
.autoID(false)
.build());
schema.addField(AddFieldReq.builder()
.fieldName("vector")
.dataType(DataType.FloatVector)
.dimension(5)
.build());
schema.addField(AddFieldReq.builder()
.fieldName("color")
.dataType(DataType.JSON)
.build());
// 2.3 Prepare index parameters
IndexParam indexParamForIdField = IndexParam.builder()
.fieldName("id")
.indexType(IndexParam.IndexType.STL_SORT)
.build();
IndexParam indexParamForVectorField = IndexParam.builder()
.fieldName("vector")
.indexType(IndexParam.IndexType.IVF_FLAT)
.metricType(IndexParam.MetricType.IP)
.extraParams(Map.of("nlist", 1024))
.build();
List<IndexParam> indexParams = new ArrayList<>();
indexParams.add(indexParamForIdField);
indexParams.add(indexParamForVectorField);
// 2.4 Create a collection with schema and index parameters
CreateCollectionReq customizedSetupReq = CreateCollectionReq.builder()
.collectionName("test_collection")
.collectionSchema(schema)
.indexParams(indexParams)
.build();
client.createCollection(customizedSetupReq);
// 2.5 Check if the collection is loaded
GetLoadStateReq getLoadStateReq = GetLoadStateReq.builder()
.collectionName("test_collection")
.build();
Boolean isLoaded = client.getLoadState(getLoadStateReq);
System.out.println(isLoaded);
// Output:
// true
const { MilvusClient, DataType, sleep } = require("@zilliz/milvus2-sdk-node")
const address = "http://localhost:19530"
async function main() {
// 1. Set up a Milvus Client
client = new MilvusClient({address});
// 2. Create a collection
// 2.1 Define fields
const fields = [
{
name: "id",
data_type: DataType.Int64,
is_primary_key: true,
auto_id: false
},
{
name: "vector",
data_type: DataType.FloatVector,
dim: 5
},
{
name: "color",
data_type: DataType.JSON,
}
]
// 2.2 Prepare index parameters
const index_params = [{
field_name: "vector",
index_type: "IVF_FLAT",
metric_type: "IP",
params: { nlist: 1024}
}]
// 2.3 Create a collection with fields and index parameters
res = await client.createCollection({
collection_name: "test_collection",
fields: fields,
index_params: index_params
})
console.log(res.error_code)
// Output
//
// Success
//
res = await client.getLoadState({
collection_name: "test_collection",
})
console.log(res.state)
// Output
//
// LoadStateLoaded
//
매개변수에 대한 자세한 내용은 MilvusClient
, create_schema()
, add_field()
, add_index()
, create_collection()
및 get_load_state()
를 참조하세요.
파라미터에 대한 자세한 내용은 MilvusClientV2
, createSchema()
, addField()
, IndexParam
, createCollection()
및 getLoadState()
를 참조하세요.
파라미터에 대한 자세한 내용은 MilvusClient
, createCollection()
및 getLoadState()
를 참조하세요.
필드 값 삽입
CollectionSchema
객체에서 컬렉션을 만든 후 위와 같은 사전을 컬렉션에 삽입할 수 있습니다.
컬렉션에 데이터를 삽입하려면 insert()
메서드를 사용하여 컬렉션에 데이터를 삽입합니다.
컬렉션에 데이터를 삽입하려면 insert()
메서드를 사용하여 컬렉션에 데이터를 삽입합니다.
컬렉션에 데이터를 삽입하려면 insert()
메서드를 사용하여 컬렉션에 데이터를 삽입합니다.
res = client.insert(
collection_name="test_collection",
data=data
)
print(res)
# Output
#
# {
# "insert_count": 1000,
# "ids": [
# 0,
# 1,
# 2,
# 3,
# 4,
# 5,
# 6,
# 7,
# 8,
# 9,
# "(990 more items hidden)"
# ]
# }
// 3.1 Insert data into the collection
InsertReq insertReq = InsertReq.builder()
.collectionName("test_collection")
.data(data)
.build();
InsertResp insertResp = client.insert(insertReq);
System.out.println(JSONObject.toJSON(insertResp));
// Output:
// {"insertCnt": 1000}
// 3. Insert randomly generated vectors
const colors = ["green", "blue", "yellow", "red", "black", "white", "purple", "pink", "orange", "brown", "grey"]
var data = []
for (let i = 0; i < 1000; i++) {
const current_color = colors[Math.floor(Math.random() * colors.length)]
const current_tag = Math.floor(Math.random() * 8999 + 1000)
const current_coord = Array(3).fill(0).map(() => Math.floor(Math.random() * 40))
const current_ref = [ Array(3).fill(0).map(() => colors[Math.floor(Math.random() * colors.length)]) ]
data.push({
id: i,
vector: [Math.random(), Math.random(), Math.random(), Math.random(), Math.random()],
color: {
label: current_color,
tag: current_tag,
coord: current_coord,
ref: current_ref
}
})
}
console.log(data[0])
// Output
//
// {
// id: 0,
// vector: [
// 0.11455530974226114,
// 0.21704086958595314,
// 0.9430119822312437,
// 0.7802712923612023,
// 0.9106927960926137
// ],
// color: { label: 'grey', tag: 7393, coord: [ 22, 1, 22 ], ref: [ [Array] ] }
// }
//
res = await client.insert({
collection_name: "test_collection",
data: data,
})
console.log(res.insert_cnt)
// Output
//
// 1000
//
기본 스칼라 필터링
모든 데이터를 추가한 후에는 표준 스칼라 필드와 동일한 방식으로 JSON 필드의 키를 사용하여 검색 및 쿼리를 수행할 수 있습니다.
매개변수에 대한 자세한 내용은 search()
를 참조하세요.
파라미터에 대한 자세한 내용은 search()
를 참조하세요.
파라미터에 대한 자세한 내용은 search()
를 참조하세요.
# 4. Basic search with a JSON field
query_vectors = [ [ random.uniform(-1, 1) for _ in range(5) ]]
res = client.search(
collection_name="test_collection",
data=query_vectors,
filter='color["label"] in ["red"]',
search_params={
"metric_type": "L2",
"params": {"nprobe": 16}
},
output_fields=["id", "color"],
limit=3
)
print(res)
# Output
#
# [
# [
# {
# "id": 460,
# "distance": 0.4016231596469879,
# "entity": {
# "id": 460,
# "color": {
# "label": "red",
# "tag": 5030,
# "coord": [14, 32, 40],
# "ref": [
# [ "pink", "green", "brown" ],
# [ "red", "grey", "black"],
# [ "red", "yellow", "orange"]
# ]
# }
# }
# },
# {
# "id": 785,
# "distance": 0.451080858707428,
# "entity": {
# "id": 785,
# "color": {
# "label": "red",
# "tag": 5290,
# "coord": [31, 13, 23],
# "ref": [
# ["yellow", "pink", "pink"],
# ["purple", "grey", "orange"],
# ["grey", "purple", "pink"]
# ]
# }
# }
# },
# {
# "id": 355,
# "distance": 0.5839247703552246,
# "entity": {
# "id": 355,
# "color": {
# "label": "red",
# "tag": 8725,
# "coord": [5, 10, 22],
# "ref": [
# ["white", "purple", "yellow"],
# ["white", "purple", "white"],
# ["orange", "white", "pink"]
# ]
# }
# }
# }
# ]
# ]
// 4. Basic search with a JSON field
List<List<Float>> query_vectors = Arrays.asList(Arrays.asList(0.3580376395471989f, -0.6023495712049978f, 0.18414012509913835f, -0.26286205330961354f, 0.9029438446296592f));
SearchReq searchReq = SearchReq.builder()
.collectionName("test_collection")
.data(query_vectors)
.filter("color[\"label\"] in [\"red\"]")
.outputFields(Arrays.asList("id", "color"))
.topK(3)
.build();
SearchResp searchResp = client.search(searchReq);
System.out.println(JSONObject.toJSON(searchResp));
// Output:
// {"searchResults": [[
// {
// "distance": 1.2636482,
// "id": 290,
// "entity": {
// "color": {
// "coord": [32,37,32],
// "ref": [
// ["green", "blue", "yellow"],
// ["yellow", "pink", "pink"],
// ["purple", "red", "brown"]
// ],
// "label": "red",
// "tag": 8949
// },
// "id": 290
// }
// },
// {
// "distance": 1.002122,
// "id": 629,
// "entity": {
// "color": {
// "coord": [23,5,35],
// "ref": [
// ["black", ""yellow", "black"],
// ["black", "purple", "white"],
// ["black", "brown", "orange"]
// ],
// "label": "red",
// "tag": 5072
// },
// "id": 629
// }
// },
// {
// "distance": 0.9542817,
// "id": 279,
// "entity": {
// "color": {
// "coord": [20,33,33],
// "ref": [
// ["yellow", "white", "brown"],
// ["black", "white", "purple"],
// ["green", "brown", "blue"]
// ],
// "label": "red",
// "tag": 4704
// },
// "id": 279
// }
// }
// ]]}
// 4. Basic search with a JSON field
query_vectors = [[0.6765405125697714, 0.759217474274025, 0.4122471841491111, 0.3346805565394215, 0.09679748345514638]]
res = await client.search({
collection_name: "test_collection",
data: query_vectors,
filter: 'color["label"] in ["red"]',
output_fields: ["color", "id"],
limit: 3
})
console.log(JSON.stringify(res.results, null, 4))
// Output
//
// [
// {
// "score": 1.777988076210022,
// "id": "595",
// "color": {
// "label": "red",
// "tag": 7393,
// "coord": [31,34,18],
// "ref": [
// ["grey", "white", "orange"]
// ]
// }
// },
// {
// "score": 1.7542595863342285,
// "id": "82",
// "color": {
// "label": "red",
// "tag": 8636,
// "coord": [4,37,29],
// "ref": [
// ["brown", "brown", "pink"]
// ]
// }
// },
// {
// "score": 1.7537562847137451,
// "id": "748",
// "color": {
// "label": "red",
// "tag": 1626,
// "coord": [31,4,25
// ],
// "ref": [
// ["grey", "green", "blue"]
// ]
// }
// }
// ]
//
고급 스칼라 필터링
Milvus는 JSON 필드에서 스칼라 필터링을 위한 고급 필터 세트를 제공합니다. 이러한 필터는 JSON_CONTAINS
, JSON_CONTAINS_ALL
, JSON_CONTAINS_ANY
입니다.
["blue", "brown", "grey"]
을 참조 색상으로 설정한 모든 엔티티를 필터링합니다.# 5. Advanced search within a JSON field res = client.query( collection_name="test_collection", data=query_vectors, filter='JSON_CONTAINS(color["ref"], ["blue", "brown", "grey"])', output_fields=["id", "color"], limit=3 ) print(res) # Output # # [ # { # "id": 79, # "color": { # "label": "orange", # "tag": 8857, # "coord": [ # 10, # 14, # 5 # ], # "ref": [ # [ # "yellow", # "white", # "green" # ], # [ # "blue", # "purple", # "purple" # ], # [ # "blue", # "brown", # "grey" # ] # ] # } # }, # { # "id": 371, # "color": { # "label": "black", # "tag": 1324, # "coord": [ # 2, # 18, # 32 # ], # "ref": [ # [ # "purple", # "orange", # "brown" # ], # [ # "blue", # "brown", # "grey" # ], # [ # "purple", # "blue", # "blue" # ] # ] # } # }, # { # "id": 590, # "color": { # "label": "red", # "tag": 3340, # "coord": [ # 13, # 21, # 13 # ], # "ref": [ # [ # "yellow", # "yellow", # "red" # ], # [ # "blue", # "brown", # "grey" # ], # [ # "pink", # "yellow", # "purple" # ] # ] # } # } # ]
// 5. Advanced search within a JSON field searchReq = SearchReq.builder() .collectionName("test_collection") .data(query_vectors) .filter("JSON_CONTAINS(color[\"ref\"], [\"purple\", \"pink\", \"orange\"])") .outputFields(Arrays.asList("id", "color")) .topK(3) .build(); searchResp = client.search(searchReq); System.out.println(JSONObject.toJSON(searchResp)); // Output: // {"searchResults": [[ // { // "distance": 1.1811467, // "id": 180, // "entity": { // "color": { // "coord": [ // 17, // 26, // 14 // ], // "ref": [ // [ // "white", // "black", // "brown" // ], // [ // "purple", // "pink", // "orange" // ], // [ // "black", // "pink", // "red" // ] // ], // "label": "green", // "tag": 2470 // }, // "id": 180 // } // }, // { // "distance": 0.6487204, // "id": 331, // "entity": { // "color": { // "coord": [ // 16, // 32, // 23 // ], // "ref": [ // [ // "purple", // "pink", // "orange" // ], // [ // "brown", // "red", // "orange" // ], // [ // "red", // "yellow", // "brown" // ] // ], // "label": "white", // "tag": 1236 // }, // "id": 331 // } // }, // { // "distance": 0.59387654, // "id": 483, // "entity": { // "color": { // "coord": [ // 8, // 33, // 2 // ], // "ref": [ // [ // "red", // "orange", // "brown" // ], // [ // "purple", // "pink", // "orange" // ], // [ // "brown", // "blue", // "green" // ] // ], // "label": "pink", // "tag": 5686 // }, // "id": 483 // } // } // ]]}
// 5. Advanced search within a JSON field res = await client.search({ collection_name: "test_collection", data: query_vectors, filter: 'JSON_CONTAINS(color["ref"], ["blue", "brown", "grey"])', output_fields: ["color", "id"], limit: 3 }) console.log(JSON.stringify(res.results, null, 4)) // Output // // [ // { // "id": 79, // "color": { // "label": "orange", // "tag": 8857, // "coord": [ // 10, // 14, // 5 // ], // "ref": [ // [ // "yellow", // "white", // "green" // ], // [ // "blue", // "purple", // "purple" // ], // [ // "blue", // "brown", // "grey" // ] // ] // } // }, // { // "id": 371, // "color": { // "label": "black", // "tag": 1324, // "coord": [ // 2, // 18, // 32 // ], // "ref": [ // [ // "purple", // "orange", // "brown" // ], // [ // "blue", // "brown", // "grey" // ], // [ // "purple", // "blue", // "blue" // ] // ] // } // }, // { // "id": 590, // "color": { // "label": "red", // "tag": 3340, // "coord": [ // 13, // 21, // 13 // ], // "ref": [ // [ // "yellow", // "yellow", // "red" // ], // [ // "blue", // "brown", // "grey" // ], // [ // "pink", // "yellow", // "purple" // ] // ] // } // } // ] //
코디네이터가
[4, 5]
인 엔티티를 필터링합니다.res = client.query( collection_name="test_collection", data=query_vectors, filter='JSON_CONTAINS_ALL(color["coord"], [4, 5])', output_fields=["id", "color"], limit=3 ) print(res) # Output # # [ # { # "id": 281, # "color": { # "label": "red", # "tag": 3645, # "coord": [ # 5, # 33, # 4 # ], # "ref": [ # [ # "orange", # "blue", # "pink" # ], # [ # "purple", # "blue", # "purple" # ], # [ # "black", # "brown", # "yellow" # ] # ] # } # }, # { # "id": 464, # "color": { # "label": "brown", # "tag": 6261, # "coord": [ # 5, # 9, # 4 # ], # "ref": [ # [ # "purple", # "purple", # "brown" # ], # [ # "black", # "pink", # "white" # ], # [ # "brown", # "grey", # "brown" # ] # ] # } # }, # { # "id": 567, # "color": { # "label": "green", # "tag": 4589, # "coord": [ # 5, # 39, # 4 # ], # "ref": [ # [ # "purple", # "yellow", # "white" # ], # [ # "yellow", # "yellow", # "brown" # ], # [ # "blue", # "red", # "yellow" # ] # ] # } # } # ]
searchReq = SearchReq.builder() .collectionName("test_collection") .data(query_vectors) .filter("JSON_CONTAINS_ALL(color[\"coord\"], [4, 5])") .outputFields(Arrays.asList("id", "color")) .topK(3) .build(); searchResp = client.search(searchReq); System.out.println(JSONObject.toJSON(searchResp)); // Output: // {"searchResults": [[ // { // "distance": 0.77485126, // "id": 304, // "entity": { // "color": { // "coord": [ // 4, // 5, // 13 // ], // "ref": [ // [ // "purple", // "pink", // "brown" // ], // [ // "orange", // "red", // "blue" // ], // [ // "yellow", // "blue", // "purple" // ] // ], // "label": "blue", // "tag": 7228 // }, // "id": 304 // } // }, // { // "distance": 0.68138736, // "id": 253, // "entity": { // "color": { // "coord": [ // 5, // 38, // 4 // ], // "ref": [ // [ // "black", // "pink", // "blue" // ], // [ // "pink", // "brown", // "pink" // ], // [ // "red", // "pink", // "orange" // ] // ], // "label": "blue", // "tag": 6935 // }, // "id": 253 // } // }, // { // "distance": 0.56997097, // "id": 944, // "entity": { // "color": { // "coord": [ // 5, // 6, // 4 // ], // "ref": [ // [ // "blue", // "yellow", // "orange" // ], // [ // "orange", // "white", // "orange" // ], // [ // "pink", // "brown", // "white" // ] // ], // "label": "pink", // "tag": 3325 // }, // "id": 944 // } // } // ]]}
res = await client.search({ collection_name: "test_collection", data: query_vectors, filter: 'JSON_CONTAINS_ALL(color["coord"], [4, 5])', output_fields: ["color", "id"], limit: 3 }) console.log(JSON.stringify(res.results, null, 4)) // Output // // [ // { // "score": 1.8944344520568848, // "id": "792", // "color": { // "label": "purple", // "tag": 8161, // "coord": [ // 4, // 38, // 5 // ], // "ref": [ // [ // "red", // "white", // "grey" // ] // ] // } // }, // { // "score": 1.2801706790924072, // "id": "489", // "color": { // "label": "red", // "tag": 4358, // "coord": [ // 5, // 4, // 1 // ], // "ref": [ // [ // "blue", // "orange", // "orange" // ] // ] // } // }, // { // "score": 1.2097992897033691, // "id": "656", // "color": { // "label": "red", // "tag": 7856, // "coord": [ // 5, // 20, // 4 // ], // "ref": [ // [ // "black", // "orange", // "white" // ] // ] // } // } // ] //
코디네이터에
4
또는5
이 포함된 엔티티를 필터링합니다.res = client.query( collection_name="test_collection", data=query_vectors, filter='JSON_CONTAINS_ANY(color["coord"], [4, 5])', output_fields=["id", "color"], limit=3 ) print(res) # Output # # [ # { # "id": 0, # "color": { # "label": "yellow", # "tag": 6340, # "coord": [ # 40, # 4, # 40 # ], # "ref": [ # [ # "purple", # "yellow", # "orange" # ], # [ # "green", # "grey", # "purple" # ], # [ # "black", # "white", # "yellow" # ] # ] # } # }, # { # "id": 2, # "color": { # "label": "brown", # "tag": 9359, # "coord": [ # 38, # 21, # 5 # ], # "ref": [ # [ # "red", # "brown", # "white" # ], # [ # "purple", # "red", # "brown" # ], # [ # "pink", # "grey", # "black" # ] # ] # } # }, # { # "id": 7, # "color": { # "label": "green", # "tag": 3560, # "coord": [ # 5, # 9, # 5 # ], # "ref": [ # [ # "blue", # "orange", # "green" # ], # [ # "blue", # "blue", # "black" # ], # [ # "green", # "purple", # "green" # ] # ] # } # } # ]
searchReq = SearchReq.builder() .collectionName("test_collection") .data(query_vectors) .filter("JSON_CONTAINS_ANY(color[\"coord\"], [4, 5])") .outputFields(Arrays.asList("id", "color")) .topK(3) .build(); searchResp = client.search(searchReq); System.out.println(JSONObject.toJSON(searchResp)); // Output: // {"searchResults": [[ // { // "distance": 1.002122, // "id": 629, // "entity": { // "color": { // "coord": [ // 23, // 5, // 35 // ], // "ref": [ // [ // "black", // "yellow", // "black" // ], // [ // "black", // "purple", // "white" // ], // [ // "black", // "brown", // "orange" // ] // ], // "label": "red", // "tag": 5072 // }, // "id": 629 // } // }, // { // "distance": 0.85788506, // "id": 108, // "entity": { // "color": { // "coord": [ // 25, // 5, // 38 // ], // "ref": [ // [ // "green", // "brown", // "pink" // ], // [ // "purple", // "green", // "green" // ], // [ // "green", // "pink", // "black" // ] // ], // "label": "orange", // "tag": 8982 // }, // "id": 108 // } // }, // { // "distance": 0.80550396, // "id": 120, // "entity": { // "color": { // "coord": [ // 25, // 16, // 4 // ], // "ref": [ // [ // "red", // "green", // "orange" // ], // [ // "blue", // "pink", // "blue" // ], // [ // "brown", // "black", // "green" // ] // ], // "label": "purple", // "tag": 6711 // }, // "id": 120 // } // } // ]]}
res = await client.search({ collection_name: "test_collection", data: query_vectors, filter: 'JSON_CONTAINS_ANY(color["coord"], [4, 5])', output_fields: ["color", "id"], limit: 3 }) console.log(JSON.stringify(res.results, null, 4)) // Output // // [ // { // "score": 1.9083369970321655, // "id": "453", // "color": { // "label": "brown", // "tag": 8788, // "coord": [ // 21, // 18, // 5 // ], // "ref": [ // [ // "pink", // "black", // "brown" // ] // ] // } // }, // { // "score": 1.8944344520568848, // "id": "792", // "color": { // "label": "purple", // "tag": 8161, // "coord": [ // 4, // 38, // 5 // ], // "ref": [ // [ // "red", // "white", // "grey" // ] // ] // } // }, // { // "score": 1.8615753650665283, // "id": "272", // "color": { // "label": "grey", // "tag": 3400, // "coord": [ // 5, // 1, // 32 // ], // "ref": [ // [ // "purple", // "green", // "white" // ] // ] // } // } // ] //
JSON 필터에 대한 참조
JSON 필드로 작업할 때는 JSON 필드를 필터로 사용하거나 특정 키 중 일부를 사용할 수 있습니다.
참고
- Milvus는 시맨틱 이스케이프나 변환을 수행하지 않고 JSON 필드에 문자열 값을 그대로 저장합니다.
예를 들어 'a"b'
, "a'b"
, 'a\\\\'b'
, "a\\\\"b"
은 그대로 저장되지만 'a'b'
및 "a"b"
은 유효하지 않은 값으로 처리됩니다.
JSON 필드를 사용하여 필터 표현식을 작성하려면 필드 내의 키를 활용할 수 있습니다.
키의 값이 정수 또는 실수인 경우 다른 정수 또는 실수 키 또는 INT32/64 또는 FLOAT32/64 필드와 비교할 수 있습니다.
키의 값이 문자열인 경우 다른 문자열 키 또는 VARCHAR 필드와만 비교할 수 있습니다.
JSON 필드의 기본 연산자
다음 표에서는 json_key
라는 JSON 필드 값에 A
이라는 키가 있다고 가정합니다. JSON 필드 키를 사용하여 부울 표현식을 작성할 때 참조로 사용하세요.
연산자 | 예제 | 설명 |
---|---|---|
< | 'json_field["A"] < 3' | 이 표현식은 json_field["A"] 의 값이 3 보다 작으면 참으로 평가됩니다. |
> | 'json_field["A"] > 1' | 이 표현식은 json_field["A"] 의 값이 1 보다 크면 true로 평가됩니다. |
== | 'json_field["A"] == 1' | 이 표현식은 json_field["A"] 의 값이 1 과 같으면 true로 평가됩니다. |
!= | 'json_field["A"][0]' != "abc"' | - json_field 에 A 라는 키가 없는 경우 이 표현식은 true로 평가됩니다.- json_field 에는 A 이라는 키가 있지만 json_field["A"] 은 배열이 아닙니다.- json_field["A"] 은 빈 배열입니다.- json_field["A"] 은 배열이지만 첫 번째 요소가 abc 이 아닌 경우. |
<= | 'json_field["A"] <= 5' | 이 표현식은 json_field["A"] 의 값이 5 보다 작거나 같으면 참으로 평가됩니다. |
>= | 'json_field["A"] >= 1' | 이 표현식은 json_field["A"] 의 값이 1 보다 크거나 같으면 참으로 평가됩니다. |
not | 'not json_field["A"] == 1' | - json_field 에 A 라는 이름의 키가 없는 경우 이 표현식은 참으로 평가됩니다.- json_field["A"] 은 1 과 같지 않습니다. |
in | 'json_field["A"] in [1, 2, 3]' | json_field["A"] 의 값이 1 , 2 , 또는 3 인 경우 이 표현식은 참으로 평가됩니다. |
및 (&&) | 'json_field["A"] > 1 && json_field["A"] < 3' | json_field["A"] 의 값이 1보다 크고 3 보다 작으면 이 표현식은 참으로 평가됩니다. |
또는 (||) | ‘json_field[“A”] > 1 || json_field[“A”] < 3’ | json_field["A"] 의 값이 1 보다 크거나 3 보다 작으면 이 표현식은 참으로 평가됩니다. |
exists | 'exists json_field["A"]' | json_field 에 A 이라는 키가 있는 경우 이 표현식은 true로 평가됩니다. |
고급 연산자
다음 연산자는 JSON 필드에만 해당합니다:
json_contains(identifier, jsonExpr)
이 연산자는 식별자에 지정된 JSON 표현식이 포함된 엔티티를 필터링합니다.
예 1:
{"x": [1,2,3]}
json_contains(x, 1) # => True (x contains 1.) json_contains(x, "a") # => False (x does not contain a member "a".)
예 2:
{"x", [[1,2,3], [4,5,6], [7,8,9]]}
json_contains(x, [1,2,3]) # => True (x contains [1,2,3].) json_contains(x, [3,2,1]) # => False (x does contain a member [3,2,1].)
json_contains_all(identifier, jsonExpr)
이 연산자는 식별자에 JSON 표현식의 모든 멤버가 포함된 엔티티를 필터링합니다.
예시:
{"x": [1,2,3,4,5,7,8]}
json_contains_all(x, [1,2,8]) # => True (x contains 1, 2, and 8.) json_contains_all(x, [4,5,6]) # => False (x does not has a member 6.)
json_contains_any(identifier, jsonExpr)
이 연산자는 식별자에 JSON 표현식의 멤버가 포함된 엔티티를 필터링합니다.
예시:
{"x": [1,2,3,4,5,7,8]}
json_contains_any(x, [1,2,8]) # => True (x contains 1, 2, and 8.) json_contains_any(x, [4,5,6]) # => True (x contains 4 and 5.) json_contains_any(x, [6,9]) # => False (x contains none of 6 and 9.)