用谷歌流感趋势跟踪流感

人们在患病期间搜索有关流感的信息并不奇怪。 谷歌找到了一种方法来挖掘这一趋势,并用它来估计各地区的流感活动。 他们发现,搜索趋​​势数据实际上比传统CDC(疾病控制中心)流感爆发跟踪方法快两周。

谷歌流感趋势将为您提供美国当前疫情级别的估计值或按州分类。 您还可以看到过去几年的趋势,并寻找一个地方在您附近寻找流感疫苗。

大数据

Google流感趋势是可以用“大数据”发现的一个例子,这个术语用于描述大量的结构化或非结构化数据集,这些数据集太大而且复杂,不能用传统方法检查。

对数据的传统分析通常涉及将收集的内容保存为可管理的大小。 研究人员使用较小的统计样本,对较大的群体进行猜测。 例如,通过调用相对较少的人并向他们提出问题来进行政治投票。 如果抽样类似于较大的群体(比如说马萨诸塞州的所有选民),那么小群体的调查结果可以用来对较大群体进行猜测。 你需要有一个非常干净的数据集,并知道你在寻找什么。

另一方面,大数据使用尽可能大的数据集 - 例如Google中的所有搜索查询。 当你使用一个很大的数据集时,你也会得到“杂乱”的数据:不完整的条目,猫通过键盘走过的搜索条目,等等。 没关系。 大数据分析可以考虑到这一点,并最终得出结论,否则可能找不到结论。

其中一项发现是Google流感趋势,它考察流感症状的搜索查询的峰值。 你并不总是谷歌,“嗨,我有流感,好吧Google,我附近的医生在哪里?” 你倾向于搜索诸如“头痛和发烧”之类的东西。 谷歌流感趋势的强大之处在于其他非常混乱和大量搜索查询的轻微上升趋势。

这不仅仅是一种新鲜事物,因为它比CDC更快地发现流感峰值。 CDC依靠医生和医院的积极流感测试。 这意味着人们必须生病得足以造访足以引起流感测试高峰的医生,然后实验室必须报告这一趋势。 当你能够动员治疗的时候,人们已经生病了。