通过向量存储、AutoML 和 Lakehouse 增强功能,以及 JSON 和 JAVAScript 支持,MySQL HeatWave 有效提高了易用性
Oracle 宣布将对 MySQL HeatWave 进行革新,包括支持向量存储、生成式 AI、新增数据库内机器学习功能、MySQL Autopilot 增强功能、新增 HeatWave Lakehouse 功能、支持 JavaScript、加速 JSON 查询以及支持新的分析运算符 。目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高 。通过生成式 AI 和向量存储功能 , 客户可以使用自然语言与 MySQL HeatWave 交互 , 并高效地在 HeatWave Lakehouse 中搜索各种格式的文档 。
文章插图
甲骨文公司首席企业架构师 Edward Screven 表示:“此次宣布推出的 MySQL HeatWave 增强功能,是我们在解决客户数据、分析和 AI 等紧迫问题的又一个重要里程碑 。我们之前在 HeatWave 中添加了具有高性价比、自动化机器学习、湖仓一体和多云功能的实时分析 。现在,向量存储和生成式 AI 为客户带来了强大的 LLM , 客户可以用一种直观的方式来与企业中的数据交互,并获得业务所需的准确结果 。”
为满足希望对各种数据类型和数据源执行分析、事务处理、机器学习和生成性 AI 的客户,MySQL HeatWave 中增加了额外的功能,适用于与 MySQL 兼容的工作负载和非 MySQL 工作负载 。
生成式 AI 和向量存储(私有预览)
向量存储以各种格式(如 PDF)摄取文档 , 并将其存储为通过编码器模型生成的嵌入 。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,识别相似度高的文档,然后这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案 。
MySQL HeatWave AutoML
MySQL HeatWave 所提供的数据库内机器学习包含全自动化的训练模型管道 。客户无需将数据迁移到单独的机器学习服务中,即可轻松、安全地将存储在 MySQL HeatWave 中的数据用于机器学习训练、推断和解释 。具体新增功能如下:
· HeatWave Lakehouse 支持:客户可以利用 HeatWave AutoML训练、推断和解释 MySQL 数据库的数据,以及现在才开始支持的对象存储的数据,并为机器学习提供更多的数据 。
· 文本列支持:客户可以对文本列执行机器学习任务(包括异常检测、预测、分类、回归和推荐系统),进一步扩大 HeatWave AutoML 的可用数据语料库 。
· 增强型推荐系统:现在 , HeatWave AutoML 支持贝叶斯个性化排序 (BPR),可以基于隐式反?。ㄈ绻郝蚶?泛弯?佬形?┖拖允椒蠢 。ㄈ缙婪帧⒌阍蓿├瓷?筛鲂曰?萍龇桨?。例如,分析人员可以预测用户可能会喜欢的商品、特定商品能够吸引的用户以及某个商品的评分 。
· 训练进度监视器:客户现在可以使用 HeatWave AutoML 监视模型训练的进度,从而更好地管理资源 。
MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的内置功能,使用机器学习驱动的自动化来提高性能和可扩展性 , 并且无需具备数据库调优的专业知识即可操作 。该功能将学习如何执行查询,以改进未来查询的执行计划 。MySQL Autopilot 新的增强功能包括:
· MySQL Autopilot 索引(限量发布):帮助客户减少耗时的任务,包括为联机事务处理(OLTP) 工作负载创建合适的索引,以及随着工作负载的不断变化而持续维护索引 。MySQL Autopilot 可使用机器学习技术,根据各个应用工作负载进行预测,自动判断客户需要从表中创建或删除的索引,以此优化 OLTP 吞吐量 。此外,Autopilot 索引功能还可根据推荐的索引来预测预期的改进效果,不仅无需创建索引 , 也不会对用户的租户产生计算或存储成本 。
· 自动压缩:帮助客户判断适合该列的压缩算法,加速数据压缩和解压,进而提高加载和查询性能 。通过减少内存使用量 , 客户可以将成本降低多达 25% 。
【Oracle 通过向量存储和全新的生成式 AI 功能,持续推动 MySQL HeatWave 创新】· 自适应查询执行:帮助客户在查询开始执行后,优化查询的执行计划,将临时查询的性能提高多达 25% 。该功能使用部分查询中获取的信息,调整数据结构和系统资源,然后根据运行时实际的数据分布,单独优化每个 HeatWave 节点的查询执行 。
· 自动加载和卸载:Autopilot 可自动将应用工作负载中使用的列加载到 HeatWave,并自动卸载从未查询或很少查询的表 。这有助于释放内存 , 降低客户的成本,并且无需手动执行此任务 。
推荐阅读
- 通过线程池方式改造Stream.parallel并行流
- 怎么看是不是熟普洱
- 教你顺利通过面试关的秘诀
- 怎么在微信上询问面试是否通过 微信怎么问hr面试结果
- 如何通过 C# 比较两幅图片的相似度?
- 深入了解:MySQL与Oracle的差异及各自优势
- 火山引擎向量数据库:抖音大规模实践
- 有氧运动是否一定会掉肌肉?如何通过合理的方式减脂不掉肌肉?
- 对方通过搜索微信号添加是怎么加的 对方通过搜索微信号添加和搜索微信号添加的区别
- 在SpringBoot中通过Canal实现MySQL与Redis的数据同步