编辑推荐

加载中

Hue - Hadoop 图形化用户界面

Hue 是运营和开发Hadoop应用的图形化用户界面。Hue程序被整合到一个类似桌面的环境,以web程序的形式发布,对于单独的用户来说不需要额外的安装。

收藏 586
更新于 2014/11/10
Hue

Nanocubes - 大数据可视化工具

Nanocubes 是一个大数据可视化的工具,32Tb Twitter数据,在一台16GB内存的机器上流畅、交互式地可视化。 运行 Nanocubes 你需要一个支持 WebGL 的浏览器,目前...

收藏 369

Curve - 分布式存储系统

CURVE 是网易开源的高性能、高可用、高可靠分布式存储系统,具有非常良好的扩展性。基于该存储底座可以打造适用于不同应用场景的存储系统,如块存储、对象存储、云原生数据库等。CURVE 的设计开发...

收藏 312
更新于 2020/12/04
Curve

FastCFS - 基于块存储的通用分布式文件系统

FastCFS 是一款基于块存储的通用分布式文件系统,可以作为MySQL、PostgresSQL、Oracle等数据库和云平台的后端存储。 支持的操作系统 Linux: Kernel versi...

收藏 75
更新于 2021/07/08

ZNBase - NewSQL 分布式数据库

ZNBase 是浪潮打造的一款分布式数据库产品,具备强一致、高可用分布式架构、分布式水平扩展、高性能、企业级安全等特性,自研的原生分布式存储引擎支持完整 ACID,支持 PostgreSQL 协...

收藏 47
更新于 2021/08/16
ZNBase

Apache Arrow - 内存数据交换格式

Apache Arrow是Apache基金会下一个全新的开源项目,同时也是顶级项目。它的目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。 用户在应用大数据分析时除了将Hadoop等大...

收藏 107
更新于 2021/07/31
Apache Arrow

ROOT-framework - 欧洲核子研究中心-数据处理框架

ROOT 是一个模块化的科学软件工具包,它是一个数据处理框架,提供了大数据处理、统计分析、可视化和存储所需的所有功能,主要使用 C++ 编写而成,同时可集成 Python 和 R 等其它语言。 ...

收藏 104
更新于 2019/08/20

Scribe - Facebook大量数据处理

Scribe旨在帮助Facebook处理服务器上的大量数据,正像Scribe网页所述“如经常访问Facebook,请使用Scribe。”具体而言,Scribe就是一台服务器,实时收集用网站日志信息。

收藏 70

openLooKeng - 高性能数据虚拟化引擎

openLooKeng 是一款高性能数据虚拟化引擎,提供统一 SQL 接口,具备跨数据源/数据中心分析能力以及面向交互式、批、流等融合查询场景。同时增强了前置调度、跨源索引、动态过滤、跨源协同、...

收藏 123
更新于 2021/10/22

AresDB - 基于 GPU 运算的实时分析存储引擎和查询引擎

AresDB 是 Uber 开源的一个基于 GPU 运算的实时分析存储引擎和查询引擎。具备低查询延迟、高数据刷新率和高效内存和磁盘存储管理。AresDB 要求 CUDA Toolkit 的支持。...

收藏 46
更新于 2019/01/31
AresDB

Apache Trafodion - 分布式SQL引擎

概览 Trafodion提供了一个基于Hadoop平台的交易型分布式SQL引擎。它是一个擅长处理交易型负载的Hadoop大数据解决方案。其主要特性包括: 完整的ANSI SQL 92/99语言支...

收藏 135
更新于 2021/05/16
Apache Trafodion

Annoy - 求近似最近邻的库

Annoy 是 Spotify 开源的高维空间求近似最近邻的库,在 Spotify 使用它进行音乐推荐。最邻近搜索(Nearest Neighbor Search, NNS)又称为“最近点搜索”...

收藏 12
Annoy

Vespa - 开放大数据服务引擎

Vespa 是雅虎开源的针对大数据集的低延迟计算引擎。它存储和索引数据,以便在服务时间对数据进行查询、选择和处理。 Vespa 可实现: 使用类似 sql 的查询和非结构化搜索来选择内容 组织所...

收藏 10
Vespa

MR4C - C++ 的 MapReduce​ 框架

MR4C 是 Google 开发的 C++ 的 MapReduce 框架,你可以在 Hadoop 架构中执行本地代码。 依赖: tested with Ubuntu 12.04 and Cent...

收藏 46
更新于 2015/02/24

WDT - 数据传输工具

WDT 是一个嵌入式函数库( embeddedable library),也是命令行工具,旨在尽可能快速地用多个 TCP 路径在 2个系统之间传送文件。WDT 意思是 Warp speed Da...

收藏 16

MacroBase - 数据分析工具

MacroBase 是一个数据分析工具,利用机器学习优先处理大型数据集。 具体来说,MacroBase 是一个新的分析监督引擎,旨在进行大型数据集和数据流优先处理。与传统的分析引擎不同,Macr...

收藏 16
MacroBase

Typesense - 搜索引擎

Typesense 是一种快速、可容忍错字的搜索引擎,用于构建令人愉悦的搜索体验。 开源 Algolia 替代方案和更易于使用的 ElasticSearch 替代方案。 特征 Typo Tole...

收藏 30
更新于 2021/06/26
Typesense

Apache MADlib - 大数据机器学习工具

Apache MADlib 是为数据科学提供的 SQL 大数据机器学习工具。Apache MADlib 拥有强大的大数据分析能力。Apache MADlib 支持 Postgres, Pivot...

收藏 19

SF1R - 海量数据引擎

什么是SF1R SF1R是一个分布式的存储搜索一体化海量数据引擎。SF1R来自于iZENECloud团队多年的 研发成果,并且已经在商业网站上经受住了严苛的考验。2014年,iZENECloud...

收藏 21

Pothos framework - 数据流拓扑图开发框架

Pothos 项目是一个完善的数据流框架,用于创建互相连接的数据处理模块拓扑图。数据处理的拓扑图可以进行图形化的设计和测试,并应用到设备网络。 Pothos framework API 是平滑的...

收藏 9

没有更多内容

加载失败,请刷新页面

返回顶部
顶部