-
Apache Flink 漫谈系列 - 持续查询(Continuous Queries)
所属栏目:[教程] 日期:2018-11-13 热度:54
一、实际问题 我们知道在流计算场景中,数据是源源不断的流入的,数据流永远不会结束,那么计算就永远不会结束,如果计算永远不会结束的话,那么计算结果何时输出呢?本篇将介绍Apache Flink利用持续查询来对流计算结果进行持续输出的实现原理。 二、数据管[详细]
-
数据湖对初创公司分析工作至关重要的五个原因
所属栏目:[教程] 日期:2018-11-13 热度:153
与更成熟的公司相比,早期的初创公司有着截然不同的分析需求。数据湖基础设施可以使工作变得更容易。 你可能对数据湖这个术语并不熟悉,但如果你在早期阶段的初创公司中,你可能很快就会熟悉。 虽然数据仓库和数据集市往往迫使企业进入狭隘的数据范式和孤[详细]
-
苏宁数据仓库应对数据爆发式增长的技术演进
所属栏目:[教程] 日期:2018-11-13 热度:127
【51CTO.com原创稿件】为什么需要数据仓库 随着公司业务不断发展,数据种类和存储呈现爆发式增长,繁多的业务数据如何被各业务中心分析和使用,如何有效组织和管理大量业务数据,减少大数据平台相近逻辑重复计算、相近数据重复存储,都将面临巨大挑战。 数[详细]
-
影响网络速度的两个重要因素:网络带宽和网络延迟!
所属栏目:[教程] 日期:2018-11-09 热度:135
随着网络的普及,用户对响应速度快慢越来越重视了,网站越快,用户的黏性和转化率也会越高。 简单来说,就是要提高速度!影响网站速度的因素有很多,这里主要针对网络通信方面来介绍,即带宽与延迟。 网络带宽和网络延迟有时可互换使用,但它们实际上描述了[详细]
-
Apache Flink 漫谈系列 - 流表对偶(duality)性
所属栏目:[教程] 日期:2018-11-04 热度:145
实际问题 很多大数据计算产品,都对用户提供了SQL API,比如Hive, Spark, Flink等,那么SQL作为传统关系数据库的查询语言,是应用在批查询场景的。Hive和Spark本质上都是Batch的计算模式(在《Apache Flink 漫谈系列 - 概述》我们介绍过Spark是Micro Batchi[详细]
-
未来互联网+大数据时代,DT革命互联网大数据应用简析
所属栏目:[教程] 日期:2018-11-04 热度:57
未来应该是移动互联网+大数据并存的时代,未来企业之间的竞争是数据的竞争。本文从互联网大数据发展现状、市场规模、需求分析、商业大数据价值、信息安全性、企业发展形态等方面简要分析在DT时代下互联网大数据应用。 大数据已经渗透到当今每个行业和业务[详细]
-
数据科学家应当了解的五个统计基本概念
所属栏目:[教程] 日期:2018-11-04 热度:109
本文讲述了数据科学家应当了解的五个统计基本概念:统计特征、概率分布、降维、过采样/欠采样、贝叶斯统计。 从高的角度来看,统计学是一种利用数学理论来进行数据分析的技术。象柱状图这种基本的可视化形式,会给你更加全面的信息。但是,通过统计学我们[详细]
-
TCP协议疑难杂症全景解析
所属栏目:[教程] 日期:2018-11-04 热度:184
说明: 1).本文以TCP的发展历程解析容易引起混淆,误会的方方面面 2).本文不会贴大量的源码,大多数是以文字形式描述,我相信文字看起来是要比代码更轻松的 3).针对对象:对TCP已经有了全面了解的人。因为本文不会解析TCP头里面的每一个字段或者3次握手的[详细]
-
现在是时候彻底改变公司对待物联网的方式了
所属栏目:[教程] 日期:2018-11-02 热度:129
物联网( IoT )正在对企业进行数字化改革。在过去几年中,各行业的公司满怀希望地开始了物联网之旅,重点是改进和自动化现有流程解决悬而未决问题。 既然这些公司已经获得了流程、生产力和成本效益,现在是时候进入下一阶段了:利用物联网创造新的价值主张[详细]
-
数据挖掘领域十大经典算法之—CART算法(附代码)
所属栏目:[教程] 日期:2018-10-31 热度:174
简介 CART与C4.5类似,是决策树算法的一种。此外,常见的决策树算法还有ID3,这三者的不同之处在于特征的划分: ID3:特征划分基于信息增益 C4.5:特征划分基于信息增益比 CART:特征划分基于基尼指数 基本思想 CART假设决策树是二叉树,内部结点特征的取[详细]
-
Commvault助力山东省立医院搭建一体化数据管理平台
所属栏目:[教程] 日期:2018-10-31 热度:121
2018年是医疗支付转型和医疗IT转型的拐点之年,新兴医疗健康服务体系、新的医疗IT系统得到了空前充足的发展动力和全新的发展空间。 IDC在近期一份针对中国医疗行业未来5年的IT市场预测提到,伴随医联体、分级诊疗的体系建设持续深入,社保医疗保险进行整合[详细]
-
回顾那些年2G给我们带来的阴影
所属栏目:[教程] 日期:2018-10-31 热度:117
图片来源:视觉中国 毫无疑问,5G在今天是越来越热了。各种关于它的话题不断飞舞,炒作与实锤接连爆出。 如果此时我们想要感受一下什么叫只见新人笑,不见旧人哭,那最好的办法就是去看看5G的老前辈,差不多我们所有人都朝夕相伴过的2G 是不是觉得这个词已[详细]
-
物联网对大数据的影响
所属栏目:[教程] 日期:2018-10-31 热度:108
大数据和物联网交织在一起,我们周围的每台设备都连接到云端,实时共享数据。智慧农业、电子医疗、智能零售、智能家居、智慧城市、智能环境是当今世界中的一些物联网应用,这些行业应用生成大量数据,旨在改善其业务流程,增强客户体验,并在日益激烈的竞[详细]
-
数据科学项目管理中的“黄金标准”
所属栏目:[教程] 日期:2018-10-31 热度:70
大数据文摘出品 编译:茶西、陈同学、Aileen 如何建立一个数据科学项目管理?建立的标准又是什么? 我想大多数人至少承认这一点:你的研究需要让其他人能够轻松地理解你在项目中做了什么,并能复制这些结果。 此外,你还得对文件的命名方式多加注意,具体做[详细]
-
一文读懂5G基站和4G基站如何协同工作?
所属栏目:[教程] 日期:2018-10-31 热度:56
前两天,有网友留言问5G基站和4G基站如何协同工作,今天我们就来探讨探讨这个问题 5G和4G基站如何搞基? 众所周知,3GPP最新发布的5G NSA标准采用LTE与5G NR新空口双连接(LTE-NR DC)的方式,以4G作为控制面的锚点,4G基站(eNB)为主站,5G基站(gNB)为从站,[详细]
-
二、三层交换机与路由器的区别
所属栏目:[教程] 日期:2018-10-31 热度:137
网线最大传输距离 计算机网络往往由许多种不同类型的网络互连连接而成。如果几个计算机网络只是在物理上连接在一起,它们之间并不能进行通信,那么这种互连并没有什么实 际意义。因此通常在谈到互连时,就已经暗示这些相互连接的计算机是可以进行通信的,[详细]
-
组建网络规模的大小决定如何选取交换机
所属栏目:[教程] 日期:2018-10-31 热度:190
在这个创企不断冒出的环境里,越来越多的新区域需要构建网络环境,不论是大的园区还是小到办公室或是同一桌子上的几个电脑,这些都是需要网络设备的支持才能组成的。而交换机就是其中必不可少的设备,这次我们就来看看在不同网络规模下如何区分交换机的不[详细]
-
数据中心存储系统故障了?怎么办!
所属栏目:[教程] 日期:2018-10-31 热度:88
存储系统作为如今大数据云计算时代的根基,它的稳定才是支撑起如此海量数据的根本。所以各大相关行业对于这部分非常重视,所以在此针对存储系统的故障处置简单提出自己学习总结的一些思路。 首先在处理存储系统发生的可能故障前必须对于整个存储系统的架构[详细]
-
比拼生态和未来,Spark和Flink哪家强?
所属栏目:[教程] 日期:2018-10-26 热度:91
【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道 概 况 Spark 是最活跃的 Apache 项目之一。从 2014 年左右开始得到广泛关注。Spark 的开源社区一度达到上千的活跃贡献者。最主要推动者是 Databricks,由最初的 Spark 创造者们成立的公司。[详细]
-
电信业成为最大AI市场 2021年将迎来重要拐点
所属栏目:[教程] 日期:2018-10-26 热度:105
【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道 Informa旗下全球知名市场研究公司Tractica/Ovum对30个领域近300个真实的AI使用场景进行了研究,结果表明,电信、大众、广告、商业服务和医疗保健领域的AI采用率在2018-2025年期间将处于领先[详细]
-
普通用户家中装宽带不为人知的小门道
所属栏目:[教程] 日期:2018-10-26 热度:120
【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道 最近两年宽带是家家必备的东西!三大运营商接连降速,并且在流量上打出不限量的小旗号。那么在装宽带的时候你知道这些不为人知的门道吗? 1. 宽带速度 大家最关心的就是上网的速度了,上网速[详细]
-
WiFi速度怎么时快时慢 究竟为哪般?
所属栏目:[教程] 日期:2018-10-26 热度:158
【51CTO技术沙龙】10月27日,让我们共同探索AI场景化应用实现之道 网速慢几乎成了每个宽带运营商收到客户投诉频率最高的话题,目前大多数消费者使用的WiFi速度一般仅是其路由器带宽上限50%左右。 WiFi速度跟这些因素有关 WiFi信号拥堵。用户在通过WiFi接入[详细]
-
分享:数据可视化专家的七个秘密
所属栏目:[教程] 日期:2018-10-26 热度:185
数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法能提升视野,少走弯路。 数据可视化, 特别是基于Web的数据可视化的时代已经到来了。[详细]
-
大数据的阴暗面
所属栏目:[教程] 日期:2018-10-26 热度:131
数据无疑是企业创新的关键,为企业做出明智商业决策提供了巨大的机会。但是,当企业采用大数据时,他们也应该考虑大数据的阴暗面。 大数据具有巨大力量来改变企业及其经营的方式。今天,企业正在贪婪地寻找在日益激烈竞争环境中脱颖而出的方法,大数据为他[详细]
-
Hadoop,Zookeeper这些名字都是怎么来的呢?
所属栏目:[教程] 日期:2018-10-26 热度:76
首先我们要明白,Apache 是一个 http 服务器,而我们熟悉的另一种说法Apache Hadoop中的 Apache 则指的是 Apache 软件基金会。Apache是 Apache 软件基金会中的一个项目。 关于其名字,流传最广的解释是(也是最显而易见的):这个名字来自于一个事实:当Apac[详细]
