现如今的信息化社会,已经被各类信息资源所充斥,如何有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件,数据处理是管理信息系统必不可少的核心部分。从人工管理阶段到文件系统阶段再到现在的数据库系统阶段,数据处理在近几十年经历了质的飞跃。

【51CTO.com原创稿件】现如今的信息化社会,现已被各类信息资源所充满,怎么有效地办理和运用各类信息资源,是进行科学研讨和决议计划办理的前提条件,数据处理是办理信息体系必不可少的中心部分。从人工办理阶段到文件体系阶段再到现在的数据库体系阶段,数据处理在近几十年阅历了质的腾跃。

偶数科技CEO常雷近来承受51CTO的专访时表明,新一代的数据库应该与AI大脑层面相对应,更符合人工智能运用场景。所以,偶数科技抓住了这个关键,开端研制根据HAWQ的第四代数据仓库,而且拿到了由红点和红杉领投的天使轮和A轮两轮融资。

数据库的演化

谈新一代数据库之前,咱们先来看看数据库的演化。从数据库体系的研讨、开发到现在,历经了几十年的时刻,从最开端的***代同享存储型数据库,第二代MPP型数据库,再到第三代选用存储与核算别离架构的数据库共阅历了三次演化。

·同享存储型数据库,为节约资源、下降开发者本钱,呈现了同享存储型数据库,数据存储在高端同享存储中。传统的Oracle数据库等归于同享存储型数据库,也是最早的买卖型数据库。这品种型的数据库在节点数多时存储会成为瓶颈。

·MPP型数据库,是现在许多公司在运用的数据库,包含Teradata和Vertica等。由于操作体系和文件体系等底层根底不是很老练,Teradata运用的是专有硬件,主攻软硬件一体机,而且更改了许多的操作体系以及文件体系代码。2000年左右呈现了根据x86架构的MPP型数据库,包含Vertica,Greenplum等。这些根据x86架构的MPP型数据库运用的是一般服务器,没有专有硬件做支撑,软件架构方面仍是和Teradata相似。

·存储与核算别离架构数据库,这类数据库典型的代表有HAWQ和Hive等。第三代数据仓库的长处是可扩展性好,可是大部分引擎比方Hive等功能较差,兼容性不是很好,所以客户用起来很困难。

人工智能场景下, 根据HAWQ的新一代剖析型数据库

常雷表明,二十世纪九十年代前后,数据处理不仅仅局限于存储和办理数据,而是着眼于用户所需求的各种数据处理方式。剖析数据库是面向剖析运用的数据库,能够对数据进行在线计算、在线剖析、随即查询等开掘信息数据价值的作业,在处理海量数据方面有必定的优势。但在人工智能场景中,大多剖析型数据库仍是略显费劲,迭代立异火烧眉毛。由偶数科技打造的根据HAWQ的Oushu Database专为人工智能海量数据处理上具有得天独厚的优势。

HAWQ 偶数科技构建新一代数据仓库,与AI使用场景更符合  数据仓库 AI 分析型数据库 第1张

新一代剖析型数据库处理不同范畴数据处理瓶颈

跟着大数据和人工智能运用的层出不穷,对新一代数据库的海量数据处理才能以及剖析才能提出了更高的要求。金融、安防、制造业等等,各个职业对数据库功能进步都有十分火急的需求,新一代剖析型数据库的诞生处理了这个需求。

在人工智能的运用场景下,如安防范畴,新一代数据库能够经过图像辨认、人脸辨认能够进行更深层面的认知和推理;在人员身份的辨认、人类轨道剖析等方面,可对视频、图片、电子车牌等不同品种的数据进行剖析、磕碰、发现潜在联络,抽取有价值的信息,对可疑行为宣布预警,而且对案子进行相关,帮忙进步公安部门案子的侦破功率。

针对实时数据等实践事例,如企业内部***别到***其他实时物联网传感器数据,新一代数据库摒弃了繁琐的Storm等计划,处理了许多编程和不能够彻底习惯物联网传感器数据的问题。

别的,新一代数据仓库也处理了全球规划布置需求。现如今任何一个中心运用都离不开数据剖析和人工智能,比方传统银行的买卖体系和信用卡反诈骗体系,在数据仓库完成两地三中心和异地多活方面,对办理PB级数据的数据仓库体系是很大的应战。

新一代剖析型数据库的运用场景

常雷以为,现在的数据库运用需求产生了巨大的改变,这也正好说明晰数据库商场将会产生一个巨大的革新关键。偶数科技在这个关键点推出了两款中心产品Oushu Database和LittleBoy,Oushu Database根据Apache HAWQ,LittleBoy是一款人工智能产品,和Oushu Database无缝集成。能够运用到金融范畴、税务数据、公检法数据、电网数据等数据巨大的范畴。

金融范畴涉及到企业到银行借款的传统事务,银行首要要对企业做尽职调查和检查,然后再经过评委会进行评价,这些审阅进程需求全人工操作;假如涉及到个人借款和小微企业借款事务,能够对假贷人信息进行主动审阅,由于假贷人的信息相对来说比较简单获取;假如涉及到公司事务,那么就会涉及到杂乱的数据,银行需求把一切的内部数据和外部数据会集起来,然后依照主题等对内部数据先进行整合,再集成外部数据集。偶数科技运用数据存储、办理、剖析以及人工智能算法建模,能够垂手可得的协助客户构建模型流程以及模型的办理和上线,不再需求曾经冗杂的审阅进程,大大缩短了审阅时刻。

采访的***,常雷表明:“微软加速器对偶数科技协助很大。一方面,研制上微软加速器和偶数科技现已达成了一些协作,偶数科技现已将产品移植到微软加速器的Azure公有云上;另一方面,微软加速器举荐了许多不同职业的客户资源,而且在办理、财政、招聘、PR 等方面的训练也对偶数科技进行了辅导。”

转载请说明出处
知优网 » 偶数科技构建新一代数据仓库,与AI使用场景更符合

发表评论

您需要后才能发表评论