Sentimentanalyse:
Emotionen statt Fakten
Je weiter sich partizipative Medien ausbreiten, desto größere Bedeutung erhält die maschinelle Analyse der Emotionen, die über Tweets, Status-Updates, Kommentare und Blogbeiträge transportiert werden.
Mit dem Aufstieg des sozialen Internets steigt aber nicht nur der Bedarf an Möglichkeiten, um Status-Updates und Nutzer-Kommentare bei sozialen Netzwerken, Microbloggingdiensten, in Blogs und auf Videosites durchsuchbar zu machen. Auch das Interesse, die Stimmung und Emotionen solcher Äußerungen aufzufangen, ist groß.
Für Unternehmen, Organisationen und Personen ist es nämlich nicht nur interessant, wer wo und wann auf sie bezogene Inhalte bei Facebook, Twitter, Tumblr, Posterous, YouTube und vielen anderen Social-Web-Plattformen publiziert hat, sondern auch, ob es sich dabei um Kritik oder Lob, um positive oder negative Äußerungen handelte.
“Sentiment Analysis” oder “Sentimentanalyse” nennt sich die Technologie, um derartige Schlüsse ziehen zu können. Grundlage sind Analysen von Polarität, Subjektivität oder der Art gewählter Wörter. Anhand dessen lassen sich mit Hilfe von Algorithmen zumindest tendenzielle Auskünfte über die Emotionen geben, die durch einen bestimmten Text ausgedrückt werden.
Zwar ist die Zielgenauigkeit heutiger Dienste zur Sentimentanalysen eher schwankend und weit von hundert Prozent entfernt, aber selbst im aktuellen Entwicklungsstadium eröffnen sich bereits einige spannende Anwendungsszenarien.
Tweetfeel beispielsweise ist ein kostenloses Analyse-Tool für Twitter, um zu beliebigen Suchwörtern die allgemeine Stimmungslage der diese enthaltenden Tweets unter die Lupe zu nehmen. Passend zur Vielzahl der Erwähnungen der gerade abgeschlossenen US-Fernsehserie Lost in meinem persönlichen Twitter-Stream zeigt eine Tweetfeel-Suche nach “Lost” den allgemeinen Tenor zur Sendung in der Twittersphäre.
Aktuell erhalte ich ein Verhältnis von rund 63 Prozent negativer Tweets. Wie man an den dazu eingeblendeten Twitter-Nachrichten sehen kann, orientiert sich Tweetfeel primär an eindeutigen Wörtern wie “love”, “hate” oder “better”. Eine Analyse deutschsprachiger Tweets ist mit dem Service somit nicht möglich.
Ein anderes Beispiel ist ContextSense, ein Werkzeug, das beliebige Websites hinsichtlich ihrer allgemeinen Polarität analysiert und das Ergebnis als Prozentwert zwischen 0 (negativ) und 1 (positiv) ausgibt. Leider stellt auch hier die Sprache eine Barriere dar: ContextSense scheint sich lediglich auf englische Sites anwenden zu lassen, wie die ebenfalls angebotene Analyse der behandelten Themenkomplexe für netzwertig.com zeigt: So will der Service bei uns Inhalte über Robotik und Astrologie gefunden haben….
Einen weiteren spannenden Ansatz präsentiert RankSpeed, eine Suchmaschine, bei der man Suchbegriffe mit zusätzlichen, emotionsgeladenen Adjektiven erweitert. So lässt sich mit RankSpeed nach “Smartphones” suchen, die “excellent”, “easy” oder “cool” sind. RankSpeed analysiert dazu die Äußerungen in Blogs und Twitter und erlaubt die herkömmliche Websuche sowie eine Produktsuche.
Über die Qualität der Suchergebnisse kann man zwar geteilter Meinung sein, aber RankSpeed gibt immerhin einen inspirierenden Vorgeschmack auf das, was mit einer fortschreitenden Entwicklung der Sentimentanalyse sowie einer weiteren Ausbreitung partizipative Medien alles möglich sein wird.
Voraussetzung für eine nützliche und akkurate Emotionsanalyse ist eine möglichst umfangreiche Datenbank an Wörtern und Sprachen, die zudem unterschiedlichste Abkürzungen, Umgangssprache sowie sich ständig verändernden Jugendslang beherrscht. Hinzu kommt semantische Technologie, um den Gesamtkontext verstehen zu können. Es soll ja nicht pauschal jedes Status-Update mit den zwei Wörtern “love” und “lost” in die Sentimentanalyse zum Serienfinale von Lost einbezogen werden, denn letztlich kann es im jeweiligen Tweet auch um etwas ganz anderes gehen.
Die Sentimentanalyse wird sich in den nächsten Jahren noch stark weiterentwickeln. Mittelfristig könnte das Verfahren zu einem der wichtigsten Tools für Firmen, Marktforscher, Werber, Politiker und Organisationen werden. Dann reicht ein Klick, um aggregiert zu erfahren, welche Emotionen Menschen zu einem beliebigen Zeitpunkt im Bezug auf eine Marke, ein Produkt, einen Service oder eine Partei mit sich herumtragen.
(Illustration: stock.xchng)

















Artikel per Feed
Artikel per E-Mail
Artikel bei Twitter
Facebook-Seite
Intelligente Ideen haben damit zum Beispiel auch Meta-Bewertungsdienste http://www.trustyou.de oder diverse social Media Analytics tools, die im Unternehmensumfeld eingesetzt werden.
Danke für die Zusammenfassung.
Dann lasst mal Anfangen ein Tool zu schreiben, das die Ergebniss dieser Tools nutzt, um mit intelligenten Bots und (menschlichen) Agenten diese Ergebnisse durch generierten Content zu beeinflussen.
Schöne Zusammenstellung. Wichtig bei Sentimentanalysen finde ich, dass richtige Textanalytics-Systeme dahinterstecken, die nicht nur die Wörter, sondern die Sätze interpretieren. Damit auch “netzwertig ist nicht schlecht” nicht als negativ gekennzeichnet wird. Wenn man dann so ein System anwirft liefert es bei internationalen Brands eine gutes Gefühl was abgeht und wie sich die Stimmung in der Zeit entwickeln hat. Beispiel BP: http://slideshare.net/ora…brand-analysis-on-bp
Automatische Sentimentanalysen machen aber nur Sinn, wenn sie sehr breit abgestützt sind. Eine Analyse auf der komplexen deutschen Sprache über einen mittelbekannten Brand nur in der Schweiz hat eine zu tiefe Datenbasis und Querschläger wie Sarkasmus fallen zu stark ins Gewicht. Tools, die behaupten, sie hätten das im Griff übertreiben. Am besten macht man einfach selber mal einen Test.
Deshalb setzen wir bei orange8 hier auf manuelle Sentimenteinschätzungen, die wir für unsere Kunden erledigen. Und auch die manuelle Einschätzung ist manchmal gar nicht so einfach. Ich denke daher, dass Programme das nie so differenziert wie ein Mensch hinkriegen wird.
Für globale Brands ist es aber eine praktische Bereicherung.
Danke für eure Ergänzungen!
Gerade durch die Kürze des Ausdrucks, besonders sinnfällig bei Diensten, die von vornherein zeichenbegrenzt sind (z.B. Twitter oder twick.it), wird eine echte semantische Sinnanalyse von Aussagen im Zusammenhang ihrer Äußerung erschwert. Ob etwas positiv oder negativ gemeint ist, darüber entscheidet dort, wo jedes Zeichen zählt, oft nur dieser Zusammenhang von ganzen threads. Das aber bedeutet, dass eine Filterung nach Keywords hier nicht viel bringt. Die semantische Analyse von user generated internet content steht – ob es sich um Emotionen oder anderes handelt – vor großen Herausforderungen, bevor das Web 3.0 ausgerufen werden kann. Wenn Kontext immer mehr den Inhalt mitbestimmt, wie propagiert wird, dann hilft eine Suche nach Schlüssewörtern herzlich wenig. Ein im starken Sinne verstehendes Web wird daher noch eine Weile brauchen.
Das Interessante an der Sentimentanalyse ist der Fakt, dass die meisten Tools und 3rd Party APIs dies nicht hinbekommen. Gerade Tippfehler, Variationen, Ironie usw…werden normalerweise nicht erkannt. Wir nutzen bei auch Menschen, um die Resultate der Sentiment APIs nochmals zu überprüfen. Anders geht es leider (noch) nicht.
Ich denke auch, dass ein menschlicher Eingriff sinnvoll ist. Gleichzeitig ist das dann natürlich nicht mehr genau so ein Big Deal wie maschinelle Sentimentanalyse. Wenn sie denn funktioniert ;)
Ist Jonathan Harris “We feel fine” (2006) bekannt?
http://www.wefeelfine.org/
Danke für die kurze Übersicht.
Nach allem was ich bis jetzt gesehen habe und mir vor allem von irgendwelchen Vertrieblern erzählen lassen musste, ist das meiste was im Unternehmensumfeld eingesetzt ist statistischer Firlefanz, der mehr zufällig agiert. Von linguistischen Analysen auf Satzebene ist da nicht viel zu spüren. Ich versuche genau diese linguistische Tiefe in mein System zu integrieren, indem ich auf der einen Seite positive und negative Wörter kenne und lerne, aber auf der anderen Seite auch jede menge Regeln auf Satzebene benutze, um die Tonalität anzupassen (Verneinung, Konjunktiv etc..) Das ganze steckt im allgemeinen (vor allem auf deutsch) aber noch so in den Kinderschuhen, dass das ganze als “REIN AUTOMATISCHER SERVICE” auf keinen Fall verkauft werden darf. Die kleinen Spielerreien wie Tweetfeel und dergleichen sind natürlich völlig OK und lustig..
Nick
Hallo Martin,
toller Artikel. Habe ihn kurzerhand in meinem letzten Blog-Post verlinkt. http://bit.ly/semantic_web Darin berichte ich über das Interview mit Peter Kruse über die Entwicklung des Internets.
Ebenso, interessanter Artikel! Danke für den Hinweis.