SandDance - 数据可视化工具

SandDance 是微软研究院( Microsoft Research )微软车库( Microsoft Garage )推出的免费数据可视化应用。SandDance 是一款以 Web 为基础...

收藏 230
更新于 2019/10/12

Apache Beam - 大数据批处理和流处理标准

Apache Beam 是 Apache 软件基金会越来越多的数据流项目中最新增添的成员,是 Google 在2016年2月份贡献给 Apache 基金会的孵化项目。 这个项目的名称表明了设计:...

收藏 249
更新于 2021/02/26
Apache Beam

Rain - Rust 实现的分布式计算框架

Rain 是一个 Rust 实现的轻巧且强大的分布式计算框架,适用于处理大规模的基于任务的管道。 Rain 旨在降低分布式计算世界的入门门槛,目的是提供一个轻巧而强大的分布式框架,该框架具有直观...

收藏 52
更新于 2018/07/11
Rain

Apache HAWQ - 大规模并行 SQL 分析处理引擎

HAWQ 是一个Hadoop原生大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库类似,接受SQL,返回结果集。 Apache HAWQ 具有大规模并行处理很多传统数据库以及其他数...

收藏 196
更新于 2021/08/25
Apache HAWQ

HTools - Hadoop集群监控工具

HTools是一款专业的Hadoop管理工具,不管您是非专业IT人士,还是多年经验的技术人员,本工具都会为您提供优质的管理服务和轻松的操作过程, 释放无谓的工作压力,提高Hadoop的管理水平。...

收藏 235
更新于 2013/12/24

MapReduce - 大规模数据集软件架构

MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(化简)",和他们的主要思想,都是从函数式编程语言借来的,还有...

收藏 70
更新于 2020/12/10

Linkis - 计算中间件

Linkis是一个打通了多个计算存储引擎如:Spark、TiSpark、Hive、Python和HBase等,对外提供统一REST/WebSocket/JDBC接口,提交执行SQL、Pyspar...

收藏 436
更新于 2021/09/14
Linkis

OpenSOC - 安全大数据分析框架

OpenSOC:安全大数据分析框架。OpenSOC已经加入Apache工程改名为Apache Metron。 思科在 BroCON 大会上亮相了其安全大数据分析架构 OpenSOC,引起了广泛关...

收藏 263
更新于 2014/12/20

Crate - 数据存储系统

Crate Data 是一个开源的大规模的可伸缩的数据存储系统,无需任何系统管理需求。提供强大的搜索功能。用于存储各种表格数据、非结构化数据和二进制对象。并可通过 SQL 进行检索。易于安装和使...

收藏 361
更新于 2021/09/11
Crate

Sketchify - 手绘风格数据可视化工具

Sketchify是一个js工具,可将任何包含SVG图形的DOM元素转换为手绘风格的效果。它基于Rough.js 用法 将由svg组成的现有图形转换为草图模式。运行以下代码: const o...

收藏 171
更新于 2019/11/25

WhereHows - 数据发现和管理工具

WhereHows 是 LinkedIn 公司一个用于大数据发现和管理的工具,集成了所有主要的数据处理系统,可以进行分类收集和元数据操作。方便内部员工发现公司内部的数据,跟踪数据集的移动和查看各...

收藏 142
更新于 2016/03/10

FastCFS - 基于块存储的通用分布式文件系统

FastCFS 是一款基于块存储的通用分布式文件系统,可以作为MySQL、PostgresSQL、Oracle等数据库和云平台的后端存储。 支持的操作系统 Linux: Kernel versi...

收藏 75
更新于 2021/07/08

Alink - 基于 Flink 的通用算法平台

Alink是基于Flink的通用算法平台。 开源算法列表 pyAlink

收藏 94
更新于 2021/04/07

Heka - 数据收集和整理工具

来自 Mozilla 的 Heka 是一个用来收集和整理来自多个不同源的数据的工具,通过对数据进行收集和整理后发送结果报告到不同的目标用于进一步分析。

收藏 79
更新于 2014/03/07

Apache Iceberg - 跟踪超大规模表的新格式

Apache Iceberg 是一种新的表格格式,用于存储和分析大型的、移动缓慢的表格数据。它的工作方式类似于 SQL 表,它旨在改进内置在 Hive、Presto 和 Spark 中的事实上的...

收藏 46
更新于 2020/05/28
Apache Iceberg

TipDM - 数据库建模平台和挖掘工具

TipDM数据挖掘建模平台是基于Python引擎、用于数据挖掘建模的开源平台。平台提供数量丰富的数据分析与挖掘建模组件,用户可在没有编程基础的情况下,通过拖拽的方式进行操作,将数据输入输出、数据...

收藏 158

Apache Griffin - 开源数据质量解决方案

Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案。在Hadoop, Spark, Storm等分布式系统中,提供了一整套统一的流程来定义和检测数据集的质量并及时报告...

收藏 134
更新于 2018/12/14
Apache Griffin

Apache Eagle - Hadoop 数据安全方案

Apache Eagle 是 eBay 公司推出的分布式实时安全监控引方案,该项目已正式加入 Apache 成为孵化项目。Apache Eagle 提供一套高效分布式的流式策略引擎,具有高实时、...

收藏 177
更新于 2017/06/05
Apache Eagle

Apache Airflow - 数据管道监控工具

Airflow 被 Airbnb 内部用来创建、监控和调整数据管道。任何工作流都可以在这个使用 Python 编写的平台上运行(目前加入 Apache 基金会孵化器)。 Airflow 允许工作...

收藏 83
更新于 2021/10/13
Apache Airflow

DataX Web - 分布式数据同步工具

DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,降低用户使用DataX的学习成本,缩短任务配置时间,避免配置过程中出错。用户可通过页面选择数据源即可创建数据...

收藏 216
更新于 2020/07/01

没有更多内容

加载失败,请刷新页面