武汉大学-乔梦玲-3-基于社交媒体的突发事件应急信息挖掘与分析.pdf

武汉大学-乔梦玲-3-基于社交媒体的突发事件应急信息挖掘与分析.pdf

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主题3. 数据挖掘与知识发现 基于社交媒体的突发事件应急信息挖掘与分析 * 乔梦玲,王艳东 ,王腾 武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉,430079 ,ydwang@whu.edu.cn 摘要:社交媒体越来越多地被看作是随人们移动的传感器,感知周围发生的事件。当突 发事件发生时,大量含有位置信息的文字迅速地充斥整个社交网络。本研究尝试将社交 媒体引入突发事件应急信息的挖掘研究中来。本文探讨突发事件应急信息挖掘与分析的 一种新思路:基于社交媒体的,建立实时应急主题分类模型,从大量、实时的文本流中 快速提取、定位应急信息;针对不同主题,利用统计分析和空间分析方法,探寻突发事 件的时间趋势和空间分布,为应急响应提供决策支持。 关键词:社交媒体,应急信息,短文本分类,时空分析,地理信息系统 1 绪论 1.1 研究背景 近几年,各种社交网站发展迅速,使得社交媒体数据成为了一种重要的数据源。本 文将社交媒体数据与灾害应急的相关领域知识结合,可用于检测灾害事件的发生以及了 解事件发生的状况[1]等。 本文旨在探讨如何利用社交媒体数据,在突发事件发生的时候,通过挖掘与分析, 得到有价值的应急信息以辅助决策者做出应急响应,合理分配应急资源。本文利用新浪 微博数据,建立了基于新浪微博文本数据的应急主题分类模型,从实时、大量的文本流 中快速分辨、定位突发事件的实况、救援等应急信息。针对不同主题,探寻突发事件随 时间的发展趋势并分析可能的影响。同时,利用空间聚类分析找出突发事件的空间分布 规律和异常区域,为应急决策提供依据。 1.2 应急信息的主题分类与定位 针对微博数据文本简短、主题多样、高时效性、丰富的空间信息等特征,本文提出 一种基于社交媒体文本流的应急主题实时分类与定位模型。该模型将主题模型 LDA [2](Latent Dirichlet Allocation)与支持向量机SVM[3] (Support Vector Machine) 结合起来,实现对文本流的实时分类与定位。 突发事件以“7.21”北京特大暴雨为例。利用应急主题实时分类与定位模型,我们 将采集到的与 “7.21”北京特大暴雨相关的微博进行主题分类与归纳,最终得到“交通 状况”、“天气预报”、“灾情信息”、“损失与影响”、“救援信息”、“内涝原因”6 个应急 信息相关的主题。 2 突发事件的时空分析 2.1 突发事件趋势分析 在突发事件趋势分析部分,本文分析了突发事件发生前后一段时间的微博数量总体 变化趋势(图1)和微博主题的变化趋势(图2)。 图1 “7.21”北京特大暴雨时间趋势季节性分解 图2 不同主题下微博比例随时间变化曲线 图1 为加入季节性趋势分解后得到的暴雨发生后的微博数量变化情况。在暴雨发生 时,微博的数量激增,在21 日的22 时(图中A 点)达到最大值,并且维持在较高的水 平上。此后的两天暴雨依然是比较热门的话题,表现为在较高的水平上周期波动,然而, 在26 日(图中B 点),北京市气象局发布了暴雨预警,引起人们对北京暴雨的再次关注, 微博数据在短期内数据激增。但是,当天北京市只是降了小雨,所以这次暴雨预警事件 也就慢慢的趋于平缓。 图2 为暴雨发生后微博主题的变化趋势。在暴雨来临之前(图中A 点),微博主要 以天气为主;然后在暴雨袭来的时候,人们关注的重点是灾情本身和极端的恶劣天气, 在22 日的19 时(图中B 点),暴雨已经慢慢退去的时候,带来的巨大损失和影响开始 成为微博讨论的热门话题。 2.2 探寻空间分布模式 为了探索突发事件的空间分布模式,通过对带有GPS 信息的微博点进行聚类,以揭 示突发事件在空间上的分布规律,有助于决策者了解突发事件的空间格局,做出正确的 应急决策。 图3 为7 月21 日13 时-14 时带有GPS 信息的暴雨微博的聚类结果,由图可见在交 通高峰时段,暴雨微博点沿地铁呈线状分布,这与人们的正常空间活动相符合。 图3 暴雨微博点聚类图 参考文献: [1] Crooks A, Croitoru A, Stefanidis A, et al. # Earthquake: Twitter as a distributed se

文档评论(0)

别拿青春赌明天 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档