• 公司介绍
  • 技术团队
  • 资质荣誉
  • 联系我们
  • 产品展示

    Rapids产品系列介绍



    Rapids 品牌


    • “Rapids”是柏睿公司大数据产品的统一品牌

    • 产品和解决方案重点:

      • –  面向大数据

      • –  承诺为企业客户提供基于标准SQL查询语言的高性能、高效率大数据处理和分析的产品和全套解决方案

      • –  为结构化、半结构化和非结构化数据提供跨异构数据源的统一分析能力的创新技术


    Rapids主要产品:


    Rapids 产品系列:


    在“Rapids”品牌下的系列产品

    1. RapidsDB: 实时分布式在线分析内存数据库

    2. Rapids Hadoop: 以开源Hadoop技术为基础的新一代企业大数据平台,与 RapidsDB紧密集成,充分整合Hadoop生态体系内的各种数据处理、分析工 具形成完整的大数据处理和分析流程及平台

    3. Rapids StreamDB: 具备实时处理、分析流数据能力的数据分析引擎,为 RapidsDB提供结构化的实时流数据数据源

    4. Rapids ParallelR: 在RapidsDB内部的分布式结构化数据上直接运行分布式 并行R算法,在数据库内部直接执行建模、机器学习等运算。

    5. Rapids Manager: 基于Web的图形化Rapids产品管理和查询工具。



    Rapids非产品技术


    • RapidsSE: 基于内存的分布式数据存储,是RapidsDB的自有分布式内存数据 存储,通过存储端的索引、过滤和表连接运算,极大提高RapidsDB的运行性 能。

    • Rapids Shell: 命令行SQL查询分析和管理工具。



    >>>RapidsDB ——a real time in-memory MPP analytical database

    • RapidsDB is:

    • 兼容ANSI SQL 标准

    • 基于内存的运算方式提供实时大规模分析能力,分布式海量运算架构使 RapidsDB能够按需扩容

    • 集中于实时复杂结构化内存数据的分析运算

    • 通过Rapids Federation的连接器技术提供RapidsDB对异构数据(流数据),

    • 海量数据(Hadoop)的分析支持能力

    • 通过Rapids Federation的连接器技术,提供对OLTP和OLAP混合运算环境的

    • 支持

    • 结合ParallelR,提供对大数据分析进行并行R运算的支持

    • 结合自有RapidsSE分布式内存数据存储技术,提供高性能大数据分析的支 持。



    Rapids Federation (Rapids联邦数据库)A federation to reach all data sources

    • Federation 是RapidsDB内存数据库的核心基础技术 • Rapids Federation作为一个独立产品,提供:

    • – 对各种外部数据源的专用或通用连接器组件,使外部数据源能够作为一个 独立的数据存储连接RapidsDB,被RapidsDB对该数据源结合其他数据源进 行统一分析

    • – 通过Rapids Federation ,RapidsDB成为一个支持“OLTP, OLAP”的混合数据 库,可以对OLTP数据库在无需数据转移(ETL)的过程而即时进行分析; RapidsDB也可以把一个数据源的数据或分析结果无缝、轻松地插入到某个 数据源

    • – 使生产数据的实时分析成为可能

    • – 使企业内部的广泛异构数据源能够被逻辑整合,通过标准的SQL查询语言

    • 进行快速分析

    • Rapids

    Rapids Federation

    A list of supported federated connectors

    • 已发布连接器 – VoltDB连接器

    – MemSQL连接器 – Hadoop连接器

    • 将提供连接器 – Hive连接器

    – Kafka连接器

    – 通用JDBC连接器(提供:Oracle, DB2, Spark支持)


    Rapids Hadoop

    企业级数据仓库(EDW):大数据平台 • Rapids Hadoop 完全基于 Apache Hadoop

    – 安装包极小,避免其他发行版那种复杂安装和运维的困境 • 仅包含必须的软件组件

    • 基于实际生产案例最佳实践的预配置设置

    – 完整的EDW和ETL工具集合

    • 以“认证”和“发行”两种方式把创建EDW和组建完整数据流程的工具(ETL)融合

       进来形成闭环的整体解决方案

    • 发行:Hive, YARN, Pig, HBase, Ambari

    • 认证:Impala, Kafka, Flume, ELK, Hortonworks,Kettle

    – 差异化 SQL on Hadoop 技术

    • 整合Rapids Hadoop Connector,使Hadoop大数据平台与RapidsDB紧密整合,对Hadoop上的海量数据,结合企业其他业务数据进行实时分析Rapids

    Rapids StreamDB

    An analytical streaming solution

    • Rapids StreamDB是一个与RapidsDB紧密集成的流数据实时分析、 处理的数据库产品

    • 对通用流数据进行持续处理和分析

    • 基于行或者时间窗口对流数据进行持续重复分析

    • 为RapidsDB提供“结构化”之后的流数据源,使RapidsDB具备对流数据的 实时分析能力

    • StreamDB可以以MPP的方式动态扩展,以支持不同的流数据业务环境Rapids

    Rapids ParallelR

    A concurrent parallel R computing framework

    • 产品定位:

    • 以分布式运行的R运算框架突破了传统R运算单机运行的限制,把最广泛应

      用的统计和建模运算直接带入基于内存的分布式关系数据库中,直接避免 传统上数据裁减,输出,倒入,运算等繁杂过程

    • 当前状况:

    • – RapidsDB的数据能够简易加载到ParallelR的并行运算框架内进行并行R运算

    • – 支持四大类数十种统计算法,远远多于SparkR的算法支持范围,已经能够 提供更广泛的应用范围

    • 未来发展:

    • 整合并行R运算框架进入RapidsDB内部运算引擎,完全避免被分析数据的

      二次加载

    • 通过用户定义函数(UDF)方式直接在查询语句中执行并行R运算Rapids

    Rapids Manager——A GUI to manage all

    • Rapids Manager 是一个基于Web的集中管理工具,将用以提供对 全部Rapids产品的集中管理

    • RapidsDB

    • Rapids Hadoop

    • Rapids Streaming

    • 并包括以下功能: – 监控

    • 部署

    • 查询编辑和开发




    Rapids Data Platform(简称RDP)是一个实时大数据分析领域的高性能分析应用平台。RDP采用了“内存计算(In-MemoryComputing)”技术,从功能上可以划分为:Rapids Hadoop(企业版大数据存储管理引擎)、Rapids DB(分布式实时在线处理引擎)、Rapids Stream内首创流数据库)、Rapids Manager(统一的管理控制台)等4个模块,实时、迅捷的为客户挖掘隐藏在大数据当中的潜在价值。




    柏睿数据
    © 2011-2015 Boraydata Inc. 保留所有权利。
    隐私政策 | 服务条款