Apache Geode - 数据管理平台

概览 Apache Geode 是一个数据管理平台,提供实时的、一致的、贯穿整个云架构地访问数据关键型应用. Geode 池化了服务器上的内存, CPU, 网络资源, 和本地磁盘,跨多个进程来管...

收藏 341
更新于 2021/09/04
Apache Geode

SandDance - 数据可视化工具

SandDance 是微软研究院( Microsoft Research )微软车库( Microsoft Garage )推出的免费数据可视化应用。SandDance 是一款以 Web 为基础...

收藏 233
更新于 2019/10/12

Apache Beam - 大数据批处理和流处理标准

Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。 这个项目的名称表明了设计:...

收藏 252
更新于 2021/11/23
Apache Beam

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 445
更新于 2022/05/05
Linkis

Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 196
更新于 2021/08/25
Apache HAWQ

MapReduce - 大规模数据集软件架构

MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言借来的,还有...

收藏 71
更新于 2020/12/10

HTools - Hadoop集群监控工具

HTools是一款专业的Hadoop管理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。...

收藏 235
更新于 2013/12/24

FastCFS - 基于块存储的通用分布式文件系统

FastCFS 是一款基于块存储的通用分布式文件系统,可以作为MySQL、PostgresSQL、Oracle等数据库和云平台的后端存储。 支持的操作系统 Linux: Kernel versi...

收藏 87
更新于 2022/04/25

OpenSOC - 安全大数据分析框架

OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...

收藏 262
更新于 2014/12/20

Crate - 数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...

收藏 368
更新于 2022/03/17
Crate

Alink - 基于 Flink 的通用算法平台

Alink是基于Flink的通用算法平台。 开源算法列表 pyAlink

收藏 97
更新于 2021/04/07

Sketchify - 手绘风格数据可视化工具

Sketchify是一个js工具,可将任何包含SVG图形的DOM元素转换为手绘风格的效果。它基于Rough.js 用法 将由svg组成的现有图形转换为草图模式。运行以下代码: const o...

收藏 172
更新于 2019/11/25

DataX Web - 分布式数据同步工具

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据...

收藏 222
更新于 2020/07/01

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 143
更新于 2016/03/10

TipDM - 数据库建模平台和挖掘工具

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据...

收藏 162

Apache Iceberg - 跟踪超大规模表的新格式

Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...

收藏 48
更新于 2020/05/28
Apache Iceberg

formDesigner - 拖拽式表单设计器

formDesigner是一个基于vue+ElementUI的表单设计器,让表单拖拽更加简单方便。

收藏 127
更新于 2022/02/07

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 133
更新于 2018/12/14
Apache Griffin

Heka - 数据收集和整理工具

来自 Mozilla 的 Heka 是一个用来收集和整理来自多个不同源的数据的工具,通过对数据进行收集和整理后发送结果报告到不同的目标用于进一步分析。

收藏 79
更新于 2014/03/07

Apache Airflow - 数据管道监控工具

Airflow 被 Airbnb 内部用来创建、监控和调整数据管道。任何工作流都可以在这个使用 Python 编写的平台上运行(目前加入 Apache 基金会孵化器)。 Airflow 允许工作...

收藏 87
更新于 2021/10/31
Apache Airflow

没有更多内容

加载失败,请刷新页面