🚀 免费试用 Zilliz Cloud,完全托管的 Milvus,体验 10 倍的性能提升!立即试用>

milvus-logo
LFAI
  • Home
  • Blog
  • 利用 Milvus 注入人工智能的 Proptech 进行个性化房地产搜索

利用 Milvus 注入人工智能的 Proptech 进行个性化房地产搜索

  • Scenarios
March 18, 2021
milvus

人工智能(AI)在房地产领域的强大应用正在改变房屋搜索流程。多年来,精通技术的房地产专业人士一直在利用人工智能,他们认识到人工智能能够帮助客户更快地找到合适的房屋,并简化购房流程。冠状病毒大流行加速了全球对房地产技术(或称 Proptech)的兴趣、采用和投资,表明它将在房地产行业发挥越来越大的作用。

本文将探讨北科公司如何利用向量相似性搜索建立一个看房平台,以提供个性化的结果,并近乎实时地推荐房源。

向量相似性搜索的应用横跨人工智能、深度学习和传统向量计算等多种场景。人工智能技术的普及在一定程度上归功于向量搜索及其对非结构化数据的理解能力,非结构化数据包括图像、视频、音频、行为数据、文档等。

据估计,非结构化数据占所有数据的 80-90%,从中提取洞察力正迅速成为企业在瞬息万变的世界中保持竞争力的必要条件。非结构化数据分析需求的不断增长、计算能力的不断提高以及计算成本的不断下降,使得人工智能支持的向量搜索比以往任何时候都更容易实现。

beike-blog-img1.jpg beike-blog-img1.jpg

传统上,非结构化数据由于不遵循预定义的模型或组织结构,一直是大规模处理和分析的难题。神经网络(如 CNN、RNN 和 BERT)使得将非结构化数据转换为特征向量成为可能,特征向量是一种数字数据格式,可以很容易地被计算机解读。然后使用算法,利用余弦相似度或欧氏距离等指标计算向量之间的相似度。

最终,向量相似性搜索是一个广义的术语,描述了在海量数据集中识别相似事物的技术。Beike 利用这一技术为智能家居搜索引擎提供动力,该引擎可根据个人用户的偏好、搜索历史和房产标准自动推荐房源,从而加快房地产搜索和购买过程。Milvus 是一个开源向量数据库,它将信息与算法连接起来,使 Beike 能够开发和管理其人工智能房地产平台。


Milvus 如何管理向量数据?

Milvus 是专为大规模向量数据管理而构建的,其应用范围涵盖图像和视频搜索、化学相似性分析、个性化推荐系统、对话式人工智能等。存储在 Milvus 中的向量数据集可以高效地进行查询,大多数实施方案都遵循这样的一般流程:

beike-blog-img2.jpg Beike-blog-img2.jpg


北科如何利用 Milvus 让找房变得更智能?

北科一般被称为中国的 Zillow,是一个允许房地产 Agents 列出出租或出售房产的在线平台。为了帮助改善找房者的找房体验,并帮助 Agents 更快地达成交易,该公司为其房源数据库建立了一个人工智能驱动的搜索引擎。Beike 的房地产房源数据库被转换成特征向量,然后输入 Milvus 进行索引和存储。然后,Milvus 根据输入的房源信息、搜索条件、用户资料或其他条件进行相似性搜索。

例如,在搜索与给定房源相似的更多房屋时,会提取楼层平面图、尺寸、朝向、内部装修、油漆颜色等特征。由于原始数据库中的房产列表数据已经编制了索引,因此只需几毫秒就能完成搜索。Beike 的最终产品在包含 300 多万个向量的数据集上的平均查询时间为 113 毫秒。不过,Milvus 能够在万亿规模的数据集上保持高效的速度,使这个相对较小的房地产数据库变得轻而易举。一般来说,该系统遵循以下流程:

  1. 深度学习模型(如 CNN、RNN 或 BERT)将非结构化数据转换为特征向量,然后导入 Milvus。

  2. Milvus 对特征向量进行存储和索引。

  3. Milvus 根据用户查询返回相似性搜索结果。

milvus-overview-diagram.png milvus-overview-diagram.png


Beike 的智能房地产搜索平台采用推荐算法,利用余弦距离计算向量相似度。该系统可根据最喜欢的房源和搜索条件找到相似的房屋。其工作原理大致如下:

  1. 根据输入的房源信息,使用平面图、尺寸和朝向等特征来提取 4 个特征向量集合。

  2. 提取的特征集合用于在 Milvus 中执行相似性搜索。每个向量集合的查询结果是输入房源与其他类似房源之间相似性的度量。

  3. 对 4 个向量集合中每个集合的搜索结果进行比较,然后用于推荐类似的房屋。

beike-intelligent-house-platform-diagram.jpg Beike-intelligent-house-platform-diagram.jpg


如上图所示,系统采用 A/B 表切换机制更新数据。Milvus 将前 T 天的数据存储在表 A 中,T+1 天开始将数据存储在表 B 中,2T+1 天开始重写表 A,以此类推。


想了解更多关于用 Milvus 制作东西的信息,请查看以下资源:

    Try Managed Milvus for Free

    Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.

    Get Started

    Like the article? Spread the word

    扩展阅读