基于数据挖掘SVM模型的pre-incident事故预防预测分析报告

原文连接   http://tecdat.cn/?p=1614

In order to solve the problem of safety accidents in production and life, we can use the current rapid development of DM (Data Mining) technology to realize the accident prediction of the monitoring system through the multi-dimensional analysis of the accident information, improve the performance of the monitoring system and form the safety warning mechanism.

Accident prediction requires meaningful and reliable information, and a large number of raw information flows must be analyzed and processed during the crisis.

Based on the above background, tecdat researchers focus on the collection of accident information data and analyze the relevant information, through the time, place, semantic and other different dimensions of the analysis of valuable information, and try to machine learning method to predict the occurrence of the accident.

▍时间维度事故分析

经过时间维度(日期和时间)的事故分析,咱们能够洞察到不一样类型的事故发生的高峰时间和高发月份,从而进行有效预防。

经过对结果的可视化,能够发现不一样时间和月份的事故发生率有必定的差别,所以在后续的预测模型中能够构建相应的时间伪变量从而提升精度。

▍不一样事故类型

经过对全部事故数据类型的占比分析,咱们能够发现出行的事故发生率是最高的,也远远高于其余类型,其次是触电事故等。(注:部分事故重属多个类型)

▍事故报告语义分析

经过对事故报告的语义分析,咱们能够发现报告中频繁出现的关键词,从中洞察到某类事故发生后一般会关联到哪些关键词,分析其背后的缘由,从而进行有效的预防。

▍安全事故预测模型

在得到事故的不一样维度基本特征以后,咱们经过SVM算法使用这些特征来预测不一样类型的事故发生的可能性,采起有针对性的措施,避免未知事故发生带来的损失,达到补救的效果。

▍技术

SVM(Support Vector Machine)用于构建、验证和测试数据集的模型。

在Spark / MLLib / Scikit-Learn / HDFS中重构实现处理较大的数据集。

▍结果

模型预测精度精度达到82.5%。

相关文章
相关标签/搜索