通过大选前的最后几轮民意调查,大多数人认定共和党人唐纳德·特朗普将败给民主党上希拉里·克林顿。然而事实并非如此。这次失败的预测,可能会令人们对于部分热门技术领域产生疑虑,包括大数据分析与客户关系管理。

【51CTO.com快译】 民意查询成果再次印证一句老话:“进来的是废物,出去的也一定是废物”。

特朗普取胜,大数据技能失利?并非如此(特朗普取胜,大数据技能失利?并非如此失败)  特朗普 大数据 第1张

2016年2月5日,唐纳德·特朗普在南卡罗来纳州佛罗伦萨的一场集会上

经过大选前的***几轮民意查询,大多数人确定共和党人唐纳德·特朗普将败给民主党上希拉里·克林顿。

但是现实并非如此。这次失利的猜测,或许会令人们关于部分抢手技能范畴产生疑虑,包含大数据剖析与客户关系办理。

不能言之过早,部分数据专家指出。他们一起表明,问题在于民意查询及FiveThirtyEight等天气预报方还需求更多重视数据搜集而非数据处理。

数据剖析机制在奥克兰竞技队的钱球模型中运作杰出,但棒球数据计算与推举投票有着巨大差异,CRM剖析师兼Beagle Research集团创始人Denis Pombriant表明。计算学家现已搜集到“一个多世纪周期内极为牢靠的”棒球数据,而民意查询数据现在尚不完善,他解说称。

全部数据剖析作业都取决于“杰出、明晰且有用的数据,正由于如此,其现在仅在棒球范畴具有杰出的辅导作用,”他在上星期三的研究报告中指出。“假如不对数据加以进行收拾,那么其将再次印证IT范畴的一句老话,‘进来的是废物,出去的也一定是废物。’”

民意查询其实并不归于真实的大数据,企业战略集团资深剖析师Nik Rouda弥补称。“民意查询数据在样本规划上不成问题,但在数据总量、数据类别以及前史测验等层面尚不契合实时剖析、机器学习以及其它先进剖析机制的要求,”他经过邮件表明。“在我看来,选用更多大数据技能应该能够带来更抱负的猜测定论。”

两支竞选团队彻底能够依托选民散布、个人资料以及“行为剖析机制带来明晰的微观定论”,Rouda表明。“这实践上归于传统剖析计划的失利,而非数学方法的失利或许大数据的失利。”

他主张称,猜测各方应当更多将民意查询数据与交际媒体加以结合。相比之下,数字处理计划则更擅长于供给更为纤细的财政性方针。

需求指出的是,在大多数全国性民意查询中,希拉里仅以小幅度优势制胜,其优势仅存在于差错规模内。到上星期三上午,希拉里在超越1.185亿张投票中抢先18万5千票,但其至少在27个州内落败,其间包含数个本来猜测其取胜的州。终究电子计票成果则显现,她的总得票数并不及特朗普。

但是,过错的猜测成果好像并非单纯源自差错规模,普林斯顿推举财团主管Samuel Wang教授指出——该财团曾在上星期二早晨猜测希拉里的取胜机率高达99%。

民意查询成果源自“一项系统性过错,”Wang在邮件中解说称。“整个民意查询投票组都被封闭。这是一项巨大的过错,且对定论的影响比率高达4%左右。”

Wang指出,他依然在对这些成果进行评价。产生猜测过错的原因之一,或许在于优柔寡断选民集体的摇晃情绪。

“民意查询人员运用了‘未决议’这样的字眼,但这实践意味着此类选民无法表达自己的偏好——他们乃至自己也没有意识到这一点,”他指出。

在竞选初期,约有20%的共和党选民抱有这种“未决议”情绪,Wang指出。“关于他们,投票给特朗普确实是个困难的挑选,由于他们不知道该忠于党派态度仍是对立急进提名人,”他弥补道。“终究,或许是对党派的忠实让他们下定了决计。”

Wang与Ovum大数据剖析师Tony Baer都主张称,民意查询作业或许轻视了那些难以触及的选民。美国的许多居民现已不再运用固定电话,这使得查询正确方针变得愈加困难,Baer表明。

别的,人们在民意查询中给出的定论或许并非出自良心。民意查询有或许得到“过错的信号”,Baer在邮件中指出。

“当具有满足巨大的数据集时,咱们能够找到关于任何事物的信号,”他弥补称。“因而,这就强调了正确数据集以及提出正确问题的重要性,意味着咱们需求使用更多不同的数据集测验自己的假定。”

在被问及对特朗普取胜作何感触时,Baer表明他“和其他人相同感到困惑。”

原文标题:Is Trump's unexpected victory a failure for big data? Not really,作者:Grant Gross

【51CTO译稿,协作站点转载请注明原文译者和出处为51CTO.com】

转载请说明出处
知优网 » 特朗普取胜,大数据技能失利?并非如此(特朗普取胜,大数据技能失利?并非如此失败)

发表评论

您需要后才能发表评论