IT之家 10 月 13 日消息,据 VMWare 中国研发中心公众号发文,VMware Greenplum 7 目前已经正式推出,这是一个“统一分析和人工智能”平台,支持向量数据并行处理,号称“可与最新大语言模型方法(LLM)集成”、“能够可帮助企业充分利用其数据资源”。
VMware 声称,Greenplum 核心是以开源 PostgreSQL 项目为基础,将商业智能(BI)和人工智能(AI)功能无缝集成在同一平台上,能够统一数据分析和人工智能需求,所有的操作都可以通过用户熟悉的 SQL 数据库界面来实现。
VMware 认为,Greenplum 在部署方面具有显著的灵活性,在数据处理上也有一定优势,能够管理“各种类型的数据”,此外还集成了增强的安全功能,从而使企业能够高效快速地应对复杂的挑战。
IT之家附 VMware Greenplum 7 主要更新内容如下:
开放源代码和 PostgreSQL 12 的衍生
VMware Greenplum 7 建立在开源代码的基础上,利用了现代 PostgreSQL 版本的功能、可靠性和灵活性。与前一版本相比,Greenplum 7 植根于 PostgreSQL 12,并整合了近 5 年以来 PostgreSQL 的发布版本。
多种索引类型
VMware Greenplum 7 支持多种索引类型,包括 B 树索引、哈希索引、位图索引、块范围索引、文本索引、地理空间索引和 AI 向量索引。该功能可优化数据检索和查询性能。Greenplum 查询优化器自 2009 年以来不断改进,在第 6 版中取得了良好的性能记录,在第 7 版中得到了扩展,提供了全面的索引选择支持。
利用 PXF 增强数据联合
VMware Greenplum 7 中的平台扩展框架(PXF) 经过改进,实现了卓越的数据联合。企业现在可以通过 JDBC 查询亚马逊简单存储服务(S3)对象存储、Hadoop 分布式文件系统(HDFS)和其他关系数据库中的数据集。它利用 PostgreSQL 的外来数据封装器 API 来并行访问远程数据源,提供抽象数据模型来管理远程数据的安全性和统计数据,以优化查询。
增强文本搜索
VMware Greenplum 7 扩展了文本搜索功能,同时支持词法搜索和人工智能驱动的语义搜索,以提供更准确的搜索结果。词法搜索支持基于关键字的传统文本搜索,对于语义搜索,则由人工智能和向量 embeddings 提供支持。
升级地理空间分析
VMware Greenplum 7 通过集成 PostGIS 版本 3 升级了地理空间分析功能。这一改进大大提高了地理空间查询的速度和特征丰富度。
行级安全权限
该功能是对 VMware Greenplum 中已有的基于角色的安全模型以及表级和列级权限的补充。
用于增强数据建模的生成列
VMware Greenplum 7 中引入了生成列,从而改进了数据抽象和建模,解决了安全特征保留数据屏蔽等用例问题。
改进的 DBA 查询功能
Greenplum 7 对 DBA 查询功能进行了大量改进,包括 UPSERT 支持、带有事务的用户定义函数,以及对 ALTER TABLE 的改进以减少数据重写。
增强的半结构化和非结构化数据分析
Greenplum 7 除支持 XML 文档外,还支持半结构化数据处理,如增强的 JSON 和数组数据处理功能。全文搜索和基于文本的词法搜索索引可实现高效的文本存储、索引和搜索。此外,向量嵌入可实现非结构化数据的浓缩和高效表示,允许跨多种语言对匹配的文档、图像和视频进行相似性搜索,包括多语言搜索。
PostgreSQL 扩展生态系统
更全面的 PostgreSQL 扩展支持,如高级密码检查、模糊字符串匹配、Hyperloglog、用于网络数据的 Ip4r、用于媒体数据的 Isn、纳秒时间戳、稀疏向量、用于透视的 Tablefunc、用于唯一标识符的 UUID 以及用于人工智能向量嵌入的 pg_vector,已全部支持。
先进的资源管理
Greenplum 7 引入了一系列高级资源管理功能。这些功能可确保在高负载情况下的稳健性能。
VMware vSphere 部署模型
Greenplum 7 可以参考推荐的架构部署在裸机或公共云环境中。也可利用 Greenplum 7 版本中提供的自动部署模式无缝集成到 vSphere 私有云环境中。
多数据中心灾难恢复解决方案
作为多数据中心灾难恢复解决方案的一部分,数据通过事务日志归档进行复制,从而实现比 Greenplum 以前版本更高效、更低的恢复点目标(RPO)和恢复时间目标(RTO)灾难恢复解决方案。
新的扩展 PostgresML
提供新的用户定义函数,使用户可以在 VMware Greenplum 中使用数以万计的开源人工智能 / 机器学习预训练模型。
参考