开源的高性能大数据流算法库 Apache DataSketches

Apache-2.0
Java 查看源码»
跨平台
Apache
2021-02-05
Alias_Travis

Apache DataSketches 是开源的高性能大数据流算法库,主要针对大规模计算环境。Apache DataSketches 的专用流算法库(也被称为 sketches)包含小型数据结构,并可大规模处理数据。对于那些想要生成精确结果,但又无法承受大量时间和计算资源消耗的查询,sketches 是一个理想的选择。而对于那些能够接受近似结果的客户,sketches 也是附带实时分析交互式查询的唯一可行选择。

特性:

  • 快速:sketches 算法可一次处理适用于实时和批处理的数据。围绕 sketches 设计系统可以简化系统的体系结构,并减少所需的总体计算资源。
  • 大数据:该库专门为必须处理海量数据的生产系统而设计的。该库包括适用于 Apache Hive、Apache Pig 和PostgreSQL(C ++)。具有跨语言(Java,C ++,Python)和平台的特性。
  • 分析:内置的 Theta Sketch 集运算符(Union,Intersection,Difference)生成 sketches,从而启用基数的完整集表达式,例如(A∪B)∩(C∪D)\( E∪F)。这种功能以及可预测的准确性为快速查询提供了前所未有的分析能力。
加载中

Apache 软件基金会将 DataSketches 提升为顶级项目

紧跟着 Apache Superset 和 Apache ECharts 的步伐,Apache 软件基金会(ASF)近日宣布将 Apache DataSketches 提升为顶级项目(Top-Level Project,TLP)。 Apache DataSketches 是开源的高...

02/05 08:44

没有更多内容

加载失败,请刷新页面

没有更多内容

暂无问答

datasketches-辅助Hive计算分位数

1. 将下面三个jar包添加进hive的hive.aux.jars.path目录里面 org.apache.datasketches datasketches-hive 1.1.0-incubating...

2020/09/09 17:12
180
0
apache

#apache ##apache介绍 apache是个开源的网页服务器,也是个模块化的服务器。 apache可以支持SSL技术,支持多个虚拟主机。 apache是以进程为基础的架构,进程要比线程消耗更多的系统开支,...

2018/02/23 11:49
69
0
Apache

1.常见命令 1.1 sudo apachectl -v  //一般来说Mac系统都会自带Apache环境,此命令的用处是查看当前系统的Apache版本 1.2 sudo apachectl -k start //启动Apache 此步骤过后就可以查看Apc...

2018/05/04 13:32
54
0
apache

Apache是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。同时Apache音译为阿帕奇,是北美...

2012/07/11 10:47
348
0
Apache

Apacche web服务器(lamp架构) http超文本协议 统一资源标识符 URI 统一资源定位符 URL 其实包含了这些东西 http://www.sina.com.cn:80/admin/index.php ssl 安全套接字(声明一个协议) ht...

2019/05/23 11:37
36
0
Apache

SOS,spark!xxx网站打开奇慢,快点给看看,赶紧帮个忙解决。 于是代班超人紧急出动,SSH登录后台,按照俺一贯的二把刀操作手法: 1、检查内存使用情况 free -m 2、查看当前进程情况 top 以上...

2009/05/08 00:19
238
0
Apache Windows下Apache安装步骤

1.apache官网下载Apache HTTP Server服务器 我相信有些朋友刚用apache服务器时,都希望从官网上下载,而面对着官网上众多的项目和镜像以及目录,也许有点茫然。下面是具体步骤: ①、打开apa...

2020/09/03 19:41
151
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部