大数据技术面临的三个重要技术问题,我们一起来看看。

 大数据技能面对的三个重要技能问题(大数据技能面对的三个重要技能问题是) 大数据 技术 信息 第1张

大数据技能面对的三个重要技能问题,咱们一起来看看。当今,大数据的到来,现已成为现实生活中无法躲避的应战。每逢咱们要做出决议计划的时分,大数据就无处不在。大数据术语广泛地出现也使得人们逐渐理解了它的重要性。大数据逐渐向人们展示了它为学术、工业和政府带来的巨大机会。与此同时,大数据也向参加的各方提出了巨大的应战,首先是大数据技能面对的三个重要问题:

一、怎么使用信息技能等手法处理非结构化和半结构化数据

大数据中,结构化数据只占 15%左右,其他的 85%都对错结构化的数据,它们很多存在于交际网络、互联网和电子商务等领域。另一方面,或许有 90%的数据来自开源数据,其他的被存储在数据库中。大数据的不确定性体现在高维、多变和强随机性等方面。股票交易数据流是不确定性大数据的一个典型比方。

大数据影响了很多研讨问题。非结构化和半结构化数据的个别体现、一般性特征和基本原理尚不明晰,这些都需求经过包含数学、经济学、社会学、计算机科学和办理科学在内的多学科穿插来研讨和评论。给定一种半结构化或非结构化数据,比方图画,怎么把它转化成多维数据表、面向对象的数据模型或许直接根据图画的数据模型?值得注意的是,大数据每一种表明方式都仅出现数据自身的旁边面体现,并非全貌。

假如把经过数据发掘提取 “粗糙常识” 的进程称为 “一次发掘” 进程,那么将粗糙常识与被量化后片面常识,包含详细的经历、常识、天性、情境常识和用户偏好,相结合而发生“智能常识”进程就叫做“二次发掘”。从“一次发掘”到“二次发掘”相似事物“量”到“质” 的腾跃。

因为大数据所具有的半结构化和非结构化特色,根据大数据的数据发掘所发生的结构化的 “粗糙常识”(潜在方式)也伴有一些新的特征。这些结构化的粗糙常识能够被片面常识加工处理并转化,生成半结构化和非结构化的智能常识。寻求 “智能常识” 反映了大数据研讨的中心价值。

二、怎么探求大数据杂乱性、不确定性特征描述的描写办法及大数据的体系建模

这一问题的打破是完成大数据常识发现的条件和要害。从久远视点来看,按照大数据的个别杂乱性和随机性所带来的应战将促进大数据数学结构的构成,然后导致大数据一致理论的齐备。从短期而言,学术界鼓舞开展一种一般性的结构化数据和半结构化、非结构化数据之间的转化准则,以支撑大数据的穿插工业使用。办理科学,尤其是根据***化的理论将在开展大数据常识发现的一般性办法和规律性中发挥重要的效果。

大数据的杂乱方式导致许多对 “粗糙常识” 的衡量和评价相关的研讨问题。已知的***化、数据包络剖析、希望理论、办理科学中的功效理论能够被使用到研讨怎么将片面常识融合到数据发掘发生的粗糙常识的 “二次发掘” 进程中。这儿人机交互将起到至关重要的效果。

三、数据异构性与决议计划异构性的联系对大数据常识发现与办理决议计划的影响

因为大数据自身的杂乱性,这一问题无疑是一个重要的科研课题,对传统的数据发掘理论和技能提出了新的应战。在大数据环境下,办理决议计划面对着两个 “异构性” 问题:“数据异构性” 和 “决议计划异构性”。传统的办理决议方式取决于对业务常识的学习和日益堆集的实践经历,而办理决议计划又是以数据剖析为根底的。

大数据现已改动了传统的办理决议计划结构的方式。研讨大数据对办理决议计划结构的影响会成为一个揭露的科研问题。除此之外,决议计划结构的改动要求人们去讨论怎么为支撑更高层次的决议计划而去做 “二次发掘”。不管大数据带来了哪种数据异构性,大数据中的 “粗糙常识” 仍可被看作 “一次发掘” 的领域。经过寻觅 “二次发掘” 发生的 “智能常识” 来作为数据异构性和决议计划异构性之间的桥梁是十分必要的。探求大数据环境下决议计划结构是怎么被改动的,相当于研讨怎么将决议计划者的片面常识参加到决议计划的进程中。

大数据是一种具有躲藏规律的人工天然,寻觅大数据的科学方式将带来对研讨大数据之美的一般性办法的探求,虽然这样的探求好不容易,可是假如咱们找到了将非结构化、半结构化数据转化成结构化数据的办法,已知的数据发掘办法将成为大数据发掘的东西。

转载请说明出处
知优网 » 大数据技能面对的三个重要技能问题(大数据技能面对的三个重要技能问题是)

发表评论

您需要后才能发表评论