Verbesserung der Katastrophenreaktion durch Twitter-Daten

Vorstellung der Pläne zur Verbesserung der Pflegeausbildung am 28.01.19 (March 2019).

Anonim

Twitter-Daten könnten den Katastrophenhilfsteams Echtzeitinformationen geben, um Hilfe zu leisten und Leben zu retten, dank eines neuen Algorithmus, der von einem internationalen Forscherteam entwickelt wurde.

Ein Team von Forschern aus Penn State, dem indischen Technologieinstitut Kharagpur und dem Qatar Computing Research Institute hat einen Algorithmus entwickelt, der Twitter-Daten analysiert, um kleinere katastrophenbedingte Ereignisse, so genannte Unterereignisse, zu identifizieren und hochgenaue Echtzeitdaten zu generieren Zusammenfassungen, die verwendet werden können, um Antwortaktivitäten zu leiten.

Die Gruppe präsentierte ihre Arbeit - "Identifizieren von Unterereignissen und Zusammenfassen von Informationen aus Mikroblogs während Katastrophen" - heute (10. Juli) bei der 41. Internationalen Vereinigung für Computing Machinery Special Interest Group auf Information Retrieval Konferenz für Forschung und Entwicklung in Information Retrieval in Ann Arbor, Michigan.

"Wir betrachten die Krise, wie es sich ereignet", sagte Prasenjit Mitra, Associate Dean für die Forschung in Penn State College für Informationswissenschaften und Technologie und ein Mitwirkender der Studie.

"Die beste Quelle, um während einer Katastrophe rechtzeitig Informationen zu erhalten, sind soziale Medien, insbesondere Microblogs wie Twitter", sagte Mitra. "Zeitungen müssen noch drucken und Blogs müssen noch veröffentlicht werden, so dass Twitter eine nahezu Echtzeitansicht einer Veranstaltung von den Betroffenen ermöglicht."

Die Analyse dieser Daten und ihre Verwendung zur Erstellung von Berichten zu einem Unterthema einer Katastrophe - wie zum Beispiel Infrastrukturschäden oder Notunterkünfte - könnte humanitäre Organisationen dabei unterstützen, besser auf die unterschiedlichen Bedürfnisse von Einzelpersonen in einem betroffenen Gebiet zu reagieren.

Angesichts der Menge der produzierten Daten ist es nicht immer praktisch, diesen Prozess unmittelbar nach einer Krise manuell zu managen. Es besteht auch häufig Bedarf für einzigartige Aktualisierungen in Bezug auf bestimmte Themen innerhalb und zwischen Organisationen.

"Mehrere Arbeiten zur katastrophenspezifischen Zusammenfassung der letzten Zeit haben Algorithmen vorgeschlagen, die meist eine generelle Zusammenfassung des gesamten Ereignisses liefern", schreiben die Forscher in ihrer Arbeit. "Verschiedene Interessengruppen wie Rettungskräfte, Regierungsbehörden, Feldexperten, (und) normale Menschen haben jedoch unterschiedliche Informationsbedürfnisse."

In der Studie sammelte die Gruppe mehr als 2, 5 Millionen Tweets, die während dreier großer globaler Katastrophen veröffentlicht wurden: Taifun Hagupit, der 2014 auf die Philippinen kam, Flut 2014 in Pakistan und Erdbeben 2015 in Nepal. Dann trainierten Freiwillige des Büros der Vereinten Nationen für die Koordinierung humanitärer Angelegenheiten ein maschinelles Lernsystem, indem sie die Tweets manuell in verschiedene Unterveranstaltungen wie Nahrung, Medizin und Infrastruktur einordneten.

Sobald das System Tweets mit hoher Genauigkeit identifizieren kann, erlauben die Forscher dem System, große Datenmengen schnell und genau ohne menschliches Eingreifen zu kategorisieren. Wenn sich Ereignisse entwickeln, werden jedoch neue Kategorien von Inhalten angezeigt, die einen Neustart des Prozesses erforderlich machen.

"Ab einem bestimmten Punkt gibt es eine Tendenz zum Thema. Die Themen verschieben sich von der unmittelbaren Reaktion, wie zum Beispiel Menschen, bis hin zu anhaltenden Auswirkungen wie Krankheiten oder Transportproblemen", erklärte Mitra. "Wenn sich das Thema ändert, beobachten wir die Genauigkeit der Maschine. Wenn sie unter einen bestimmten Schwellenwert fällt, kategorisiert die Task Force manuell weitere Tweets, um die Maschine weiter zu schulen."

Ihr Algorithmus "Dependency-Parser-based SUB-event detection", bekannt als DEPSUB, identifizierte Nomen-Verb-Paare, die Unterthemen darstellen - wie "Brückenkollapse" oder "Personen gefangen" - und ordnete sie basierend auf ihrer Häufigkeit in Tweets. Dann erstellten sie einen Algorithmus, um Zusammenfassungen über das breite Ereignis und die identifizierten Unterereignisse zu schreiben. Schließlich bewerteten menschliche Evaluatoren die Nützlichkeit und Genauigkeit von Sub-Ereignissen, die von DEPSUB identifiziert wurden, und automatisch generierten Zusammenfassungen mit denen, die durch andere existierende Methoden erstellt wurden.

Die Evaluatoren fanden sowohl DEPSUB als auch ihren zusammenfassenden Algorithmus im Vergleich zu anderen führenden Algorithmen relevanter, nützlicher und verständlicher. Zukünftig hoffen die Forscher, ihre Arbeit auf spezielle Situationen anzuwenden, z. B. Informationen über vermisste Personen zusammenzufassen und spezifische Informationen aus Tweets zu ziehen, die eine ausführlichere Beschreibung und Visualisierung eines Ereignisses ermöglichen.

"Mit einem gut trainierten System ist kein menschliches Eingreifen erforderlich, um Twitter-Daten zu kategorisieren oder zusammenzufassen", sagte Mitra. "Dieses automatisierte System ist ein erster Schritt, um den Mitarbeitern der Hilfsorganisationen ein Gerüst zu geben, das sie verfeinern können, um eine bessere Gesamtübersicht eines Ereignisses zu erstellen und um einen genaueren Blick auf einen Teil dieses größeren Ereignisses zu werfen."

menu
menu