Sentimentanalyse:
Emotionen statt Fakten

Je weiter sich partizipative Medien ausbreiten, desto größere Bedeutung erhält die maschinelle Analyse der Emotionen, die über Tweets, Status-Updates, Kommentare und Blogbeiträge transportiert werden.

Ähnlich wie das statische Web und herkömmliche Internetsites durchsucht werden können, lässt sich auch das Social Web nach Schlüsselworten filtern. Die Echtzeitkomponente sowie die Frage der Gewichtigung solcher Suchergebnisse stellen hierbei zwar neue Herausforderungen dar, aber sowohl etablierte Suchmaschinen als auch spezialisierte Anbieter des Real-Time-Web tun alles, um diese Nuss zu knacken.

Mit dem Aufstieg des sozialen Internets steigt aber nicht nur der Bedarf an Möglichkeiten, um Status-Updates und Nutzer-Kommentare bei sozialen Netzwerken, Microbloggingdiensten, in Blogs und auf Videosites durchsuchbar zu machen. Auch das Interesse, die Stimmung und Emotionen solcher Äußerungen aufzufangen, ist groß.

Für Unternehmen, Organisationen und Personen ist es nämlich nicht nur interessant, wer wo und wann auf sie bezogene Inhalte bei Facebook, Twitter, Tumblr, Posterous, YouTube und vielen anderen Social-Web-Plattformen publiziert hat, sondern auch, ob es sich dabei um Kritik oder Lob, um positive oder negative Äußerungen handelte.

“Sentiment Analysis” oder “Sentimentanalyse” nennt sich die Technologie, um derartige Schlüsse ziehen zu können. Grundlage sind Analysen von Polarität, Subjektivität oder der Art gewählter Wörter. Anhand dessen lassen sich mit Hilfe von Algorithmen zumindest tendenzielle Auskünfte über die Emotionen geben, die durch einen bestimmten Text ausgedrückt werden.

Zwar ist die Zielgenauigkeit heutiger Dienste zur Sentimentanalysen eher schwankend und weit von hundert Prozent entfernt, aber selbst im aktuellen Entwicklungsstadium eröffnen sich bereits einige spannende Anwendungsszenarien.

Tweetfeel beispielsweise ist ein kostenloses Analyse-Tool für Twitter, um zu beliebigen Suchwörtern die allgemeine Stimmungslage der diese enthaltenden Tweets unter die Lupe zu nehmen. Passend zur Vielzahl der Erwähnungen der gerade abgeschlossenen US-Fernsehserie Lost in meinem persönlichen Twitter-Stream zeigt eine Tweetfeel-Suche nach “Lost” den allgemeinen Tenor zur Sendung in der Twittersphäre.

Aktuell erhalte ich ein Verhältnis von rund 63 Prozent negativer Tweets. Wie man an den dazu eingeblendeten Twitter-Nachrichten sehen kann, orientiert sich Tweetfeel primär an eindeutigen Wörtern wie “love”, “hate” oder “better”. Eine Analyse deutschsprachiger Tweets ist mit dem Service somit nicht möglich.

Ein anderes Beispiel ist ContextSense, ein Werkzeug, das beliebige Websites hinsichtlich ihrer allgemeinen Polarität analysiert und das Ergebnis als Prozentwert zwischen 0 (negativ) und 1 (positiv) ausgibt. Leider stellt auch hier die Sprache eine Barriere dar: ContextSense scheint sich lediglich auf englische Sites anwenden zu lassen, wie die ebenfalls angebotene Analyse der behandelten Themenkomplexe für netzwertig.com zeigt: So will der Service bei uns Inhalte über Robotik und Astrologie gefunden haben….

Einen weiteren spannenden Ansatz präsentiert RankSpeed, eine Suchmaschine, bei der man Suchbegriffe mit zusätzlichen, emotionsgeladenen Adjektiven erweitert. So lässt sich mit RankSpeed nach “Smartphones” suchen, die “excellent”, “easy” oder “cool” sind. RankSpeed analysiert dazu die Äußerungen in Blogs und Twitter und erlaubt die herkömmliche Websuche sowie eine Produktsuche.

Über die Qualität der Suchergebnisse kann man zwar geteilter Meinung sein, aber RankSpeed gibt immerhin einen inspirierenden Vorgeschmack auf das, was mit einer fortschreitenden Entwicklung der Sentimentanalyse sowie einer weiteren Ausbreitung partizipative Medien alles möglich sein wird.

Voraussetzung für eine nützliche und akkurate Emotionsanalyse ist eine möglichst umfangreiche Datenbank an Wörtern und Sprachen, die zudem unterschiedlichste Abkürzungen, Umgangssprache sowie sich ständig verändernden Jugendslang beherrscht. Hinzu kommt semantische Technologie, um den Gesamtkontext verstehen zu können. Es soll ja nicht pauschal jedes Status-Update mit den zwei Wörtern “love” und “lost” in die Sentimentanalyse zum Serienfinale von Lost einbezogen werden, denn letztlich kann es im jeweiligen Tweet auch um etwas ganz anderes gehen.

Die Sentimentanalyse wird sich in den nächsten Jahren noch stark weiterentwickeln. Mittelfristig könnte das Verfahren zu einem der wichtigsten Tools für Firmen, Marktforscher, Werber, Politiker und Organisationen werden. Dann reicht ein Klick, um aggregiert zu erfahren, welche Emotionen Menschen zu einem beliebigen Zeitpunkt im Bezug auf eine Marke, ein Produkt, einen Service oder eine Partei mit sich herumtragen.

(Illustration: stock.xchng)

Mehr lesen

fflick: Twitter-Aggregator für Filmkritiken

5.8.2010, 0 Kommentarefflick:
Twitter-Aggregator für Filmkritiken

Viele User veröffentlichen Filmkritiken bei Twitter. Der neue US-Dienst fflick aggregiert diese und bewertet sie anhand einer Sentimentanalyse.

Sentimentanalyse von Tweets: \

22.7.2010, 2 KommentareSentimentanalyse von Tweets:
"Manic Thursday"

US-Forscher haben Tweets hinsichtlich ihrer Stimmungslage untersucht. Eine Erkenntnis: Am Donnerstagabend erreicht die Laune von Twitter-Nutzern einen Tiefpunkt.

Influencer Marketing in Deutschland: Klout-Konkurrent PeerIndex  belohnt digitalen Einfluss

10.5.2012, 0 KommentareInfluencer Marketing in Deutschland:
Klout-Konkurrent PeerIndex belohnt digitalen Einfluss

In den USA erhalten digitale Multiplikatoren über die Reputationsplattform Klout Vergünstigungen und Sonderangebote. Der Londoner Wettbewerber PeerIndex will mit PeerPerks auch Europas digitale Influencer belohnen.

Talentakquisition statt Verfall: Das heimliche Platzen  der Social-App-Blase

7.5.2012, 5 KommentareTalentakquisition statt Verfall:
Das heimliche Platzen der Social-App-Blase

Die Zahl der Startups, die Nutzer miteinander vernetzen wollen, übersteigt die Nachfrage und Zeit der Anwender bei weitem. Viele Apps haben keine Zukunft. Akquisitionen, bei denen es vor allem um das Team geht, verdecken dies.

Klout: Umstritten, aber unausweichlich

27.4.2012, 22 KommentareKlout:
Umstritten, aber unausweichlich

Klout, das bekannteste Onlinewerkzeug zur Reputationsmessung, bietet viel Angriffsfläche. Trotzdem ist es an der Zeit, seine künftige Bedeutung im Wirtschaftsleben zu akzeptieren.

11 Kommentare

  1. Philipp
    schrieb am 27. Mai 2010 um 16:20 Uhr (#)

    Intelligente Ideen haben damit zum Beispiel auch Meta-Bewertungsdienste http://www.trustyou.de oder diverse social Media Analytics tools, die im Unternehmensumfeld eingesetzt werden.

  2. dasparadoxon
    schrieb am 27. Mai 2010 um 23:18 Uhr (#)

    Danke für die Zusammenfassung.

    Dann lasst mal Anfangen ein Tool zu schreiben, das die Ergebniss dieser Tools nutzt, um mit intelligenten Bots und (menschlichen) Agenten diese Ergebnisse durch generierten Content zu beeinflussen.

  3. Mike Schwede
    schrieb am 28. Mai 2010 um 14:23 Uhr (#)

    Schöne Zusammenstellung. Wichtig bei Sentimentanalysen finde ich, dass richtige Textanalytics-Systeme dahinterstecken, die nicht nur die Wörter, sondern die Sätze interpretieren. Damit auch “netzwertig ist nicht schlecht” nicht als negativ gekennzeichnet wird. Wenn man dann so ein System anwirft liefert es bei internationalen Brands eine gutes Gefühl was abgeht und wie sich die Stimmung in der Zeit entwickeln hat. Beispiel BP: http://slideshare.net/ora…brand-analysis-on-bp

    Automatische Sentimentanalysen machen aber nur Sinn, wenn sie sehr breit abgestützt sind. Eine Analyse auf der komplexen deutschen Sprache über einen mittelbekannten Brand nur in der Schweiz hat eine zu tiefe Datenbasis und Querschläger wie Sarkasmus fallen zu stark ins Gewicht. Tools, die behaupten, sie hätten das im Griff übertreiben. Am besten macht man einfach selber mal einen Test.

    Deshalb setzen wir bei orange8 hier auf manuelle Sentimenteinschätzungen, die wir für unsere Kunden erledigen. Und auch die manuelle Einschätzung ist manchmal gar nicht so einfach. Ich denke daher, dass Programme das nie so differenziert wie ein Mensch hinkriegen wird.

    Für globale Brands ist es aber eine praktische Bereicherung.

  4. Schreibt hier auf dem Blog Martin Weigert
    schrieb am 28. Mai 2010 um 15:13 Uhr (#)

    Danke für eure Ergänzungen!

  5. Tobias Knobloch
    schrieb am 28. Mai 2010 um 15:32 Uhr (#)

    Gerade durch die Kürze des Ausdrucks, besonders sinnfällig bei Diensten, die von vornherein zeichenbegrenzt sind (z.B. Twitter oder twick.it), wird eine echte semantische Sinnanalyse von Aussagen im Zusammenhang ihrer Äußerung erschwert. Ob etwas positiv oder negativ gemeint ist, darüber entscheidet dort, wo jedes Zeichen zählt, oft nur dieser Zusammenhang von ganzen threads. Das aber bedeutet, dass eine Filterung nach Keywords hier nicht viel bringt. Die semantische Analyse von user generated internet content steht – ob es sich um Emotionen oder anderes handelt – vor großen Herausforderungen, bevor das Web 3.0 ausgerufen werden kann. Wenn Kontext immer mehr den Inhalt mitbestimmt, wie propagiert wird, dann hilft eine Suche nach Schlüssewörtern herzlich wenig. Ein im starken Sinne verstehendes Web wird daher noch eine Weile brauchen.

  6. Stefan
    schrieb am 28. Mai 2010 um 15:41 Uhr (#)

    Das Interessante an der Sentimentanalyse ist der Fakt, dass die meisten Tools und 3rd Party APIs dies nicht hinbekommen. Gerade Tippfehler, Variationen, Ironie usw…werden normalerweise nicht erkannt. Wir nutzen bei auch Menschen, um die Resultate der Sentiment APIs nochmals zu überprüfen. Anders geht es leider (noch) nicht.

  7. Schreibt hier auf dem Blog Martin Weigert
    schrieb am 28. Mai 2010 um 15:43 Uhr (#)

    Ich denke auch, dass ein menschlicher Eingriff sinnvoll ist. Gleichzeitig ist das dann natürlich nicht mehr genau so ein Big Deal wie maschinelle Sentimentanalyse. Wenn sie denn funktioniert ;)

  8. Marcus Haberkorn
    schrieb am 29. Mai 2010 um 13:13 Uhr (#)

    Ist Jonathan Harris “We feel fine” (2006) bekannt?
    http://www.wefeelfine.org/

  9. Nick Nickson
    schrieb am 4. August 2010 um 13:18 Uhr (#)

    Danke für die kurze Übersicht.
    Nach allem was ich bis jetzt gesehen habe und mir vor allem von irgendwelchen Vertrieblern erzählen lassen musste, ist das meiste was im Unternehmensumfeld eingesetzt ist statistischer Firlefanz, der mehr zufällig agiert. Von linguistischen Analysen auf Satzebene ist da nicht viel zu spüren. Ich versuche genau diese linguistische Tiefe in mein System zu integrieren, indem ich auf der einen Seite positive und negative Wörter kenne und lerne, aber auf der anderen Seite auch jede menge Regeln auf Satzebene benutze, um die Tonalität anzupassen (Verneinung, Konjunktiv etc..) Das ganze steckt im allgemeinen (vor allem auf deutsch) aber noch so in den Kinderschuhen, dass das ganze als “REIN AUTOMATISCHER SERVICE” auf keinen Fall verkauft werden darf. Die kleinen Spielerreien wie Tweetfeel und dergleichen sind natürlich völlig OK und lustig..

    Nick

  10. Sean Kollak
    schrieb am 16. August 2010 um 15:28 Uhr (#)

    Hallo Martin,
    toller Artikel. Habe ihn kurzerhand in meinem letzten Blog-Post verlinkt. http://bit.ly/semantic_web Darin berichte ich über das Interview mit Peter Kruse über die Entwicklung des Internets.

  11. Schreibt hier auf dem Blog Martin Weigert
    schrieb am 16. August 2010 um 15:36 Uhr (#)

    Ebenso, interessanter Artikel! Danke für den Hinweis.

Pingbacks

Pingbacks anzeigen...

Diesen Artikel kommentieren

Wir sind sehr an einer offenen Diskussion interessiert, behalten uns aber vor, beleidigende Kommentare sowie solche, die offensichtlich zwecks Suchmaschinenoptimierung abgegeben werden, zu editieren oder zu löschen. Mehr dazu in unseren Kommentarregeln.