我们爱民主、我们爱自由、我们也爱财富!我们尊孔子、我们尊老子、我们同尊管子!

安德管仲网管仲论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

微信扫一扫 分享朋友圈

已有 1417 人浏览分享

开启左侧

《大数据时代BIG DATA》读书笔记

[复制链接]
1417 0
一、思维变革
大数据时代处理数据理念上的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。
随机抽样调查方法的缺陷:
①当样本数量达到了某个值之后,我们从新个体身上得到的信息会越来越少。
②随机抽样的成功依赖于采样的绝对随机,但是实现采样的随机性非常困难。
③随机采样不适合考察子类别的情况。
④随机抽样虽然能更快更容易地发现问题,但不能回答事先未考虑到的问题。
大数据分析“样本=总体”应用:
信用卡诈骗报警;非法操控相扑比赛结果分析。
大数据的简单算法比小数据的复杂算法更有效(IBM vs.谷歌翻译)
二、商业变革
从最不可能的地方提取数据:
Mattew Fontaine Maury的导航图
奥伦·埃齐的机票价格预测
谷歌的流感爆发的预测
日本先进工业技术研究所的坐姿与汽车防盗系统。

一本书的扫描pdf版是书的数字化,一本书的word版才是数据化。数字化是指计算机能识别,而数据化以后我们可以进行模糊搜索。
微博、Twitter、Facebook 上数据的挖掘
验证码(全称“全自动区分计算机和人类的图灵测试”)
数据废气:用户在线交互的副产品,包括浏览了哪些页面、停留了多久、鼠标光标停留的位置、输入了什么信息等。

大数据价值链:
基于数据本身的公司——Twitter
基于技能的公司——(咨询公司、技术供应商或者分析公司)Teradata天睿公司
基于思维的公司——Jetpac

大数据技术的发展将会使大小公司获利,但对中等规模的公司不利。大公司有规模优势,而小公司能享受到非固有资产规模带来的好处

三、管理变革
三大隐私保护政策(告知与许可、模糊化、匿名化)在大数据时代都失效了

告知与许可——数据的很多用途是潜在的,收集的时候也不知道会用来干嘛,等知道时,“告知”的成本太高或者根本无法实现;
模糊化——此地无银三百两
匿名化——数据量和种类的增多,大数据促进了数据的交叉检验
大数据威胁到了我们的隐私和自由,它也加剧了“过于依赖数据”的旧威胁。

管理变革1:个人隐私保护,从个人许可到数据使用者承担责任
管理变革2:个人动因VS预测分析
     个人动因:人们选择自我行为的自由意志/个人可以并应该为他们的行为而非倾向负责。
管理变革3:击碎黑盒子,大数据算法师的崛起
管理变革4:反数据垄断大亨
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1

关注

2

粉丝

312

主题
精彩推荐
热门资讯
网友晒图
图文推荐

小黑屋|Archiver|安德管仲网 ( 粤ICP备20002412号 )

GMT+8, 2024-12-22 10:05 , Processed in 0.053557 second(s), 23 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.