Was sagen Ihre Kunden nochmal? 5 Wege, wie Sie Informationen aus Tweets, Kommentaren und Rezensionen gewinnen
30 Nov. 2015 | von Anne-Kathrin Stolz
Kunden liefern durch ihre Kommentare, Tweets und Rezensionen jede Menge wertvolles Feedback. Es ist an den Unternehmen dieses Feedback schnell ausfindig zu machen und zu verwerten, um so gezielt auf Beschwerden zu reagieren und Trend-Themen ihrer Zielgruppe aufzufassen. Leichter gesagt als getan? In diesem Beitrag lernen Sie unterschiedliche Methoden kennen, die Sie bei der Analyse von Text-Daten unterstützen.
So einfach geht Text Mining
Im nachfolgenden Whitepaper „Worte mit Wert: So ziehen Sie Stimmungen und Bewertungen Ihrer Kunden aus Textdaten“ testen wir diese Methoden in der Praxis mithilfe unserer Datenanalyse-Software FastStats.
1. Selektieren
Mit einer Selektion erstellen Sie eine Abfrage, die jeden Datensatz auswählt und zählt, der ein bestimmtes Wort, eine gewisse Wortfolge oder aber ein bestimmtes Muster enthält.
Beispielsweise möchte eine Fluggesellschaft alle Tweets zählen, priorisieren und beantworten, die die Wörter „delay“ oder „delayed“ erwähnen.
Der obenstehende Text stammt natürlich nicht von einer Fluggesellschaft, sondern von Film-Rezensionen, hilft aber trotzdem dem Verständnis. Diese Art der Text-Analyse ist natürlich nur dann sinnvoll, wenn Sie wissen, nach welchen Wörtern Sie suchen.
2. Häufigkeit von Wörtern
Haben Sie eine große Menge an auszuwertenden Texten, kann es helfen im ersten Schritt die Wörter zu extrahieren, die am häufigsten verwendet werden. So bekommen Sie einen ersten Eindruck der wichtigsten Themen. Diese Methode inkludiert das Zerlegen der Text-Beiträge in einzelne Wörter, das Auszählen der Häufigkeit der Wörter und das Aufstellen einer Rangfolge. Die Ergebnisse können in einer Tabelle oder für den visuellen Betrachter in einer Word Cloud dargestellt werden. Zweiteres nutzt die Schriftgröße, um die relativen Häufigkeiten zu verdeutlichen.
Diese Methode funktioniert sehr gut, wenn Sie Rezensionen von zum Beispiel zwei Produkten vergleichen oder eben die Essenz aus einer großen Anzahl von Kommentaren herausfiltern wollen.
Die obenstehenden Word Clouds wurden für Horrorfilme und Komödien erstellt. Bei dieser Art der Analyse sollten Sie allerdings allgemein gebräuchliche Wörter sowie generische Wörter Ihres Themas ausschließen - beispielsweise schließt ein Reiseveranstalter das Wort „Hotel“ aus. Um Hashtags zu analysieren, müssen Sie einfach nur auf Wörter mit einem vorangestellten „#“ filtern.
3. Wörter scoren
Wenn wir Rezensionen lesen, können wir relativ schnell, basierend auf unserer Erfahrung, dem Themenbereich und der Zielgruppe, entscheiden, ob es sich um eine gute, schlechte oder neutrale Meinung handelt. Sind Sie mit großen Mengen an Rezensionen konfrontiert, ist es hilfreich, diesen Prozess zu automatisieren. Eine Methode ist es, ein Modell zu entwickeln, das Schlüsselwörter erkennt, die typischerweise mit positiven oder negativen Kommentaren assoziiert werden. Mithilfe dieses Modells können neue Kommentare gescort werden.
Das Modell wird über Schlüsselwörter und Werte definiert. Basierend auf unserem Sprachverständnis können wir diesem in unserem Beispiel folgende Score-Werte zuordnen:
• Großartig = 8
• Einzigartig = 8
• Lustig = 6
• Lacher = 6
• Überbewertet = -5
• Schlecht = -8
• Langweilig = -10
Für Rezensionen mit diesem einfachen Modell würde das bedeuten:
• „großartiger Film mit einer einzigartig lustigen Wendung“ --> 8 + 6 + 8 = 22
• „überbewertet – ein paar Lacher aber total langweilig“ --> -5 + 6 – 10 = -9
Sie können das Modell verbessern, indem Sie die Werte so definieren, dass sie auf der Wahrscheinlichkeit basieren, ob ein Schlüsselwort in einer guten bzw. schlechten Bewertung vorkommt.
Wenn Sie diese Methode in FastStats anwenden, wird die Software in der Lage sein, die Score-Werte basierend auf einem Sample von Datensätzen zu berechnen.
4. Sprach-Feinheiten berücksichtigen
Das Problem beim Scoring einzelner Wörter ist, dass der Feinsinn unserer Sprache außen vor gelassen wird. Das Wort „schlecht“ erhält den Wert -8, das macht allgemein vielleicht Sinn, aber es gibt einen großen Unterschied zwischen „außergewöhnlich schlecht“, „einfach schlecht“ oder „gar nicht mal schlecht“. Das Modell kann dahingehend verbessert werden, indem auch „Qualifizierungswörter“ wie „sehr“, „eher“ oder „nicht“ erkannt werden, die das Scoring des Stichwortes beeinflussen.
Das FastStats „TextModel“ erlaubt die Eingabe von vorab gescorten Qualifizierungswörtern. Ohne Zweifel wird hier die Komplexität unserer Sprache nicht vollständig erfasst und gegenüber Sarkasmus müssen wir uns ebenfalls geschlagen geben. Nichtsdestotrotz ist es möglich, in einem begrenzten Themenbereich mit einer halbwegs einfachen Sprache ein gewisses Level an Automatisierung zu erreichen.
5. Stimmungen erkennen
Interessiert Sie die Stimmung eines Rezensenten zu einem bestimmten Themenbereich, können Sie eine ähnliche Scoring-Strategie anwenden. Produziert Ihr Unternehmen Fahrräder und Sie haben vor kurzem die Produktion von Aluminiumrahmen auf Stahlrahmen umgestellt, dann dürfte Sie interessieren, ob die Adjektive rund um das Wort „Rahmen“ eher eine positive oder eine negative Stimmung transportieren. Stellen Sie fest, dass die Mehrheit Ihrer Kunden eine negative Meinung darüber hat, können Sie dies in Ihre weitere Produktion einfließen lassen.
Nicht vergessen:
• Filtern Sie die am häufigsten genutzten Wörter aus Kommentaren und Bewertungen heraus und Sie erhalten wertvolle Einblicke in Kundentrends und Stimmungen.
• Durch automatisiertes Scoring von Wörtern können Sie Stimmungen hinter Kundenbewertungen messen und dementsprechend reagieren.
• Scoring von Wörtern um einen bestimmten Themenbereich hilft Ihnen Stimmungen im Markt zu Ihren Produkten und Dienstleistungen zu bewerten.
Profitieren Sie von unserem kostenlosen Whitepaper „Worte mit Wert: So ziehen Sie Stimmungen und Bewertungen Ihrer Kunden aus Textdaten”, indem Sie verstehen, was Ihre Kunden im Netz über Sie sagen.