Brandwatch Blogparade

Brandwatch, einer unserer Kunden, veranstaltet im Moment eine Blogparade, in der um offenes Feedback zu ihrem Tool gebeten wird. Statt einen generellen Produkttest zu machen, haben wir uns entschlossen, lieber etwas Licht auf ein dunkles Kapitel von solchen Tools zu werfen: die Abfragesprache.

Brandwatch ist ein wirklich mächtiges Social Media Monitoring Tool, das große Datenmengen, nicht zuletzt ALLE öffentlichen Twittermessages, durchsuchbar macht. Die Abfrage- und Auswertungsmöglichkeiten sind fast unbegrenzt. Die Ergebnisse jeder Abfrage werden grafisch ansprechend auf konfigurierbaren Dashboards präsentiert.

Brandwatch nimmt dem Nutzer viele Dinge ab. An einer Stelle muss aber der Nutzer selbst viel Aufwand investieren und zwar bei der Erstellung der Suchanfragen.

Boolesche Logik: Eine mächtige Waffe

Wie die meisten Social Media Monitoring Tools setzt Brandwatch auf die Power von booleschen Queries, die mithilfe von 22 Operatoren erstellt werden können. Man kann auch eine vereinfachte strukturierte Suche verwenden, bei der man boolesche Ausdrücke umschifft.

Aber nur wer sich detaillierter mit boolescher Logik auseinandersetzt, hat tatsächlich ein mächtiges Werkzeug zur Erstellung komplexer und präziser Anfragen in der Hand. Diese Woche habe ich mir ein Webinar von Brandwatch zum Thema Queryerstellung angesehen, das für Experten sehr aufschlussreich war, Laien aber auch klarmachte, wie schwierig es sein kann, gute Anfragen zu basteln.

Da Suchabfragen und boolesche Logik sozusagen mein täglich Brot sind, fiel es mir nicht schwer, die Bedeutung der vielen vertrauten "OR", Klammern und Sterne zu erfassen.

In dem Moment, in dem ich mir die Kundenbrille aufsetzte, wurde aber klar: Die Komplexität von booleschen Ausdrücken wird Marketing Experten und Product Manager - und damit potenzielle Kunden von Social Media Monitoring Tools - eher abschrecken.

Ein Gradmesser für die Komplexität des Themas ist die Verständlichkeit des zugehörigen Wikipedia Artikels.

Na, alles verstanden?

Nicht lockerlassen!

Ich möchte daher boolesche Ausdrücke mit Operatoren, die Brandwatch anbietet, an einem kleinen Beispiel für Boole- Dummies erklären.

Stellen wir uns folgendes Szenario vor: Wir wollen herausfinden, was in sozialen Netzwerken über Defekte und Probleme von Autos der Marke 'Jaguar' geschrieben wird. Wir versuchen zuerst unsere Suchintention natürlichsprachlich zu formulieren.

Wir suchen Jaguar in Zusammenhang mit der Erwähnung von Problem(en) oder Defekt(en).

Nun "übersetzen" wir das für Brandwatch in eine boolesche Anfrage:

jaguar AND (problem OR problems OR defect OR defects OR failure OR failures OR breakdown OR breakdowns OR malfunction OR malfunctions)

Die Synonyme und Pluralformen für 'Defekt' bilden eine ODER- Gruppe, d.h. diese Wörter sind austauschbar und es genügt, wenn eines davon im Resultat vorkommt.

Als Ergebnis liefert Brandwatch Tweets, Facebookbeiträge und Webseiten, in denen das Wort 'Jaguar' vorkommt und zusätzlich mindestens eines der Synonyme für 'Defekt'.

Unbefriedigend ist, dass in vielen Resultaten in einer Textstelle von 'Jaguar' die Rede ist und an ganz anderer Stelle von 'Problemen' in Bezug auf einen unterschiedlichen Sachverhalt.

Es sollen nur Vorkommen von Jaguar in engem Zusammenhang mit Problemen gefunden werden.

jaguar NEAR/15 (problem OR problems OR defect OR defects OR failure OR failures OR breakdown OR breakdowns OR malfunction OR malfunctions)

Zur Konfiguration der Nähebeziehung mit NEAR findet man in der Dokumentation der booleschen Operatoren bei Brandwatch die passenden Infos.

Das neue Ergebnis enthält aber immer noch Treffer, die wir ausschließen wollen, darunter Tweets und Artikel zu einem Viagraprodukt namens 'Jaguar', zur Konsole 'Atari Jaguar', zu den 'Jaguar Kicks' im Computerspiel Street Fighter, eine Seite zum Onlinespiel EVE, sowie Berichte über die Gefahr von Raubtieren in Belize.

Wir wollen also weder Viagra, noch Street Fighter noch Raubtiere finden:

NOT (viagra OR atari OR "street fighter" OR streetfighter OR animal OR carnivore OR predator)

Die Anführungszeichen um die Worte „Street Fighter” stellen hierbei sicher, dass dieser Begriff als Einheit gefunden wird. Zwischen 'Street' und 'Fighter' darf kein anderes Wort stehen.

Die EVE- Seite https://zkb.pleaseignore.com/ wollen wir überhaupt nicht finden:

NOT site:"zkb.pleaseignore.com"


Die komplette Anfrage können wir so formulieren:

(jaguar NEAR/15 (problem OR problems OR defect OR defects OR failure OR failures OR breakdown OR breakdowns OR malfunction OR malfunctions)) AND NOT (viagra OR atari OR "street fighter" OR streetfighter OR animal OR carnivore OR predator OR site:"zkb.pleaseignore.com")

Man beachte die Klammern, die hier gesetzt werden und dem Gruppieren der einzelnen Bedingungen dienen.

Wenn man die einzelnen Operatoren und das Grundprinzip einmal verstanden hat, ist der Weg zum Verständnis der Klammerung nicht mehr weit.

Suchintention verstehen

Man muss sich bewusst machen, dass man nicht einfach 'Jaguar' sucht, sondern den Abstraktionsschritt machen zu:

Wir suchen ein Vorkommnis des Begriffs 'Jaguar' mit der Zusatzbedingung, dass in der Nähe ein Synonym von 'Störung' bzw. 'Defekt' erwähnt wird.

Außerdem müssen einige Bedeutungen von 'Jaguar' ausgeschlossen werden. Welche das sind, wird durch den Textkontext bestimmt. In unserem Fall soll im Kontext von 'Jaguar' nicht von Pillen, Computerspielen oder Tieren die Rede sein.

Je mehr Einschränkungen wir auf die initiale Anfrage nach 'Jaguar' setzen, desto weniger Treffer bekommen wir. Eventuell verlieren wir sogar Treffer, die relevant wären (der sogenannte „Recall” sinkt).

Durch jede sinnvolle Einschränkung steigt jedoch die Präzision der Suchergebnisse, also die Wahrscheinlichkeit, mit der die Resultate der Suchintention entsprechen.

Die finale Anfrage an Brandwatch könnte zwar noch weiter getunt werden. Die zurückgelieferten Ergebnisse entsprechen nun aber größtenteils unserer Suchintention.

Brandwatch zeigt uns an, von welchen Seiten die Treffer kommen (u.a. http://www.jaguarforums.com/, nice!) und welche Begriffe besonders häufig in den Resultaten vertreten waren (siehe Illustration re.).

Auf dieser Basis sollten wir entscheiden können, ob ein Jaguar eine sinnvolle Investition ist und wissen außerdem, was „Recall” und „Precision” bedeuten.

Im besten Fall konnte ich aber vor allem dazu beitragen, dass boolesche Logik – sei es in Brandwatch oder in anderen Kontexten – für den einen oder anderen nun ein Stück weniger böhmisches Dorf oder gar eine Bedrohung ist.

Share: