中国IDC圈1月3日报道:大数据正在改变我们的生活,影响我们思考和解决问题的方式,为了适应时代的潮流,组织必须学会用数据说话,如果坐拥大量的数据却束手无策或无动于衷,那和没有数据是一样的。但是,在进行数据分析时,完全的自我创造是不可取的,因为有大量可以遵循和借鉴的经验能节约大量的时间和成本。最近, OrionX.net 的联合创始人Shahin Khan 就发表了一篇文章,介绍了他的 团队从大数据、物联网和云计算市场上总结的经验和规律 。

保留数据的成本要比删除数据的成本低。另外,还要有多个备份。正因为保留了足够多的数据,大数据才成为可能,因此无论如何都不要删除数据,因为你不知道什么时候会用到它,删除这些数据会有哪些法律风险。保留数据的成本很低,另外,如果将来发生了什么事情,你也能从这些数据中找到证据。

无论开始收集数据的动机是什么,它们都会导致你收集更多的数据。大部分数据收集工作关注于正在进行的活动,但一旦知道了如何使用这些数据,获取更多数据的意愿就会增加。

大数据系统开始较小,但慢慢会变大,没有中间大小。很少有中等规模的大数据系统,一旦某个项目的理念被证明是有前景的,那么它很快就会变大,并在迅速发展的同时孵化新项目。

数据必须流向有价值的地方,要考虑功能的上下文有什么价值。未使用的数据是一种闲置的资产,很有可能会造成价值的贬值。如果将大数据看做是工作流,那么必须将数据流向最有价值的地方。

永远都不要假设你知道原因是什么,有什么影响。大数据的大部分应用场景都是有价值的,值得付出努力,但是它的因果关系非常复杂,数据的不完整、用户的偏见不可避免。

有关数据与无关数据之间的比率将逐渐趋向于零。数据有很多,但通常情况下大部分都是无用的,只有一少部分有价值。收集的数据越多,这种现象越明显,也就是说无关数据的增长速度要远高于相关数据的增长速度。

分析的最终目的是合成。分析完成之后便需要合成,当然这需要引入机器学习和认知算法。

时间=金钱=数据。数据是一种资产,虽然它可以升值,但大多数时候随着新数据替代老数据,历史数据的价值会越来越低,因为它的相关性会越来越差。所以必须知道数据的“利率”,知道它贬值的速度有多快。

容量大—速度快—种类多—价值密度低 vs. 不可再现—不相关—不完整—不正确。数据的质量直接影响数据挖掘的质量。

给你足够的数据,你就能证明事物的“正反两面”。数据量越大,从中找到有价值信息的难度就越大,数据的复杂性、不合理的动机和无知都可能会造成无效的结论;但另一方面,数据越多,支持假设的证据就会越充分,通过完全科学的方法,有时这种支持率甚至会逐渐接近100%。

大数据的结论开始通常是有趣但无用的,但最终会变成有效且有用的。在新媒体时代,有趣但肤浅的内容要比深刻有见地的内容多得多,价值挖掘需要对数据有深刻的理解,但这需要时间。

随着数据量的增长,大数据和 高性能计算(HPC) 需要结合在一起。

如果有200行数据,可以使用电子表格;但如果有20亿行数据,就必须使用HPC。此外,随着数据量的增长,还需要数学和科学的知识将数据转换成模型。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2023-08-24 09:38:00
大数据资讯 关注县域数据能力建设,抢占产数业务发展先机
2023年《数字中国建设整体布局规划》正式发布,数据能力已成为我国区域发展的底座和创新引擎。 <详情>
2023-03-30 11:15:07
云资讯 分布式时代已至,数据如何更有价值?
无论是连通各大集群内大型超大型数据中心,还是连接边缘侧小型、边缘数据中心,分布式云计算都已成为这张算力网络最重要的支撑。在此背景下,云计算步入分布式时代。 <详情>
2023-03-01 19:27:00
市场情报 FlagOpen大模型技术开源体系,开启大模型时代“新Linux”生态
大数据+大算力+强算法=大模型”是当前人工智能发展的主要技术路径。语言大模型ChatGPT成为现象级应用,人工智能进入普及应用的新时期。 <详情>
2023-01-09 09:36:46
大数据资讯 我国互联网广告数据匿名实施服务正式上线
《指南》形成的“技术保障、评估规制、过程控制”的互信制衡机制,适用于各类互联网广告业务,包括广告投放、程序化交易、广告监测等应用场景下的数据匿名化处理。 <详情>
2022-12-30 10:10:19
大数据资讯 中国移动磐维数据库正式发布
未来,随着数据库功能和稳定性等进一步增强,磐维数据库将在中国移动内外部的广泛应用中积累更多复杂业务场景实践经验,进一步提升数据库产品的核心技术能力,助力数智化转 <详情>
从算力变革到AI生产力创新 首届酒仙桥论坛丨AIDC创新驱动生产力新变革论坛成功举办
2025-04-22 10:19:00
Rambus 通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护
2025-04-16 10:55:15
油城算力攀“新峰” 丝路云网架“金桥” ——克拉玛依市算力产业发展纪实
2025-04-15 10:57:00
筑AI生产力底座 酒仙桥论坛丨AIDC创新驱动力新变革专场将于4月16日隆重举行
2025-04-11 18:26:00
26亿!普洛斯中国首支数据中心基金完成募集 AI驱动算力资产升温
2025-04-07 16:10:47
科智咨询:寒冬将尽,春山可望!AI引领中国IDC市场进入新一轮增长周期
2025-04-03 12:04:48
原创|中国智算中心建设“过剩论”的另一面
2025-04-02 11:38:00
AI重塑云基础设施 亚马逊云科技获评IDC全球IaaS评估报告双第一
2025-04-01 19:48:00
中信集团在港成立人工智能科创中心 助力香港发展新质生产力
2025-04-01 19:36:00
普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
2025-04-01 18:19:39
投资20亿元、2000P,华池中科超级云智算中心一期项目开工
2025-04-01 14:13:15
“全球重点区域算力产业考察年度行”活动之——走进张家口:把脉算力新高地
2025-04-01 14:11:08
联想AI服务三大品牌首次集中亮相 覆盖三大客群全面抢滩AI服务
2025-03-31 17:51:00
预估1.2亿 中国电信芜湖大数据中心A1楼机电建设招标
2025-03-31 14:06:38
追踪AI算力领域热点产业资讯|《算力产业核心内刊》企业Pro版正式发布!
2025-03-31 14:02:37