一文了解托管在亚马逊云科技的向量数据库MyScale( 二 )


选择配备基于NVMe的本地SSD盘的EC2实例来部署MyScale数据库 。和大部分选择纯内存HNSW向量索引算法的向量数据库不同,MyScale自研的MSTG算法允许将向量数据缓存在本地NVMe SSD盘中,因此MyScale在为用户提供高性能的向量搜索的同时 , 大大节约了内存的使用 。在亚马逊云科技的公开测试中,MyScale超过了Pinecone、Weaviate、Qdrant、Zilliz等专有向量数据库,提供了最佳的性价比(QPS per dollar) 。
在部署MyScale云服务时,可以使用Crossplane来实现对亚马逊云科技上的EC2和EKS服务的部署和管理 。首先,通过Crossplane的AWS Provider配置了对应的亚马逊云科技账户信息,使得Crossplane能够访问和操作亚马逊云科技资源 。然后,定义EC2和EKS的YAML配置文件 , 通过这些文件,可以定义需要的服务器和Kubernetes集群的参数,如实例类型、集群大小等 。通过应用这些配置文件,Crossplane的AWS Provider会调用AWS API来创建和配置这些资源 。
【一文了解托管在亚马逊云科技的向量数据库MyScale】不仅如此,Crossplane还能够定期同步这些资源的状态,可以通过Kubernetes的接口来监控和管理这些资源 。当需要修改或删除这些资源时 , 只需要修改对应的YAML文件并重新应用,Crossplane就会自动完成对应的操作 。通过使用Crossplane,能够以一种声明式、统一和自动化的方式来管理云资源,大大提升工作效率和准确性 。
在数据安全方面,MyScale采用了Teleport,一种先进的远程访问管理系统 。Teleport能够为开发者和运维人员提供通过密文连接安全地访问Kubernetes集群的能力 。这不仅提升了系统的安全性,也提升了操作的便捷性 。更重要的是,Teleport具有全面的审计功能 , 能够详细记录所有会话和事件,这对于进行安全分析和满足合规性要求非常有帮助 。这就意味着可以对任何操作有完全的可视化 , 从而更好地控制和保护MyScale云服务系统,为用户提供安全可靠的服务 。
小结
这篇文章介绍了MyScale,一个在亚马逊云科技上托管的向量数据库 。MyScale基于开源的在线分析处理(OLAP)数据库ClickHouse开发,集成了自主研发的多尺度树图(MSTG)向量索引算法,可以提供优秀的数据管理和结构化数据查询能力,同时也提供了性价比突出的向量搜索功能 , 以及结构化和非结构化联合分析、处理的功能,可以被广泛应用于图像检索、视频分析、自然语言理解等AI驱动的场景 。




推荐阅读