Topicmarks:
Automatisierte Textzusammenfassungen

Topicmarks aus Zürich extrahiert auf Basis einer semantischen Spracherkennungsanalyse die wichtigsten Fakten aus beliebigen englischsprachigen Texten.

Manchmal hat man Zeit und Muße, um sich in Ruhe umfangreiche Artikel, Blogpostings, Dokumente, Studien oder anderes Textmaterial zu Gemüte zu führen. Es gibt aber auch Situationen, da muss es schnell gehen, oder der einem vorliegende Beitrag ist zwar wichtig, aber trocken und umständlich formuliert, so dass die eigenen Gedanken leicht abschweifen. Oder – der wohl häufigste Fall: Man hat solche Unmengen an lesenswertem Stoff gesammelt, dass man nicht mehr weiss, wo anfangen mit lesen.

Topicmarks heißt ein junger Dienst der phiScape, der in diesen und ähnlich gelagerten Situationen Rettung verspricht. Der in Beta-Phase befindliche Webservice erlaubt es, beliebige (vorläufig nur englischsprachige) Texte automatisiert zusammenzufassen. So soll Nutzern innerhalb von wenigen Minuten ein Überblick über die in einem Text enthaltenen Informationen gegeben werden.

Um mit Topicmarks kostenlos die Zusammenfassung eines Textdokuments zu erstellen, können Nutzer entweder eine Office-Datei in gängigen Formaten (inkl. PDF) auf der Website hochladen, direkt den zu sezierenden Text in ein Formular einfügen oder den Link zu einer Seite im Web angeben. Notwendig ist eine einmalige Registrierung oder der Login mit einem Yahoo- oder Google-Konto.

Texte können auch per E-Mail (eingebettet in die Mail oder als Anhang) eingesandt oder aus Evernote importiert werden. Um mit einem Klick die Analyse eines Onlinebeitrags zu initieren, stellt Topicmarks zudem ein Browser-Bookmarklet bereit.

Ist eine Analyse veranlasst worden, setzt Topicmarks seine semantischen Spracherkennungsalgorithmen in Gang, was je nach Wörteranzahl einige Minuten oder länger in Anspruch nehmen kann. Steht die Kurzfassung zur Verfügung, benachrichtigt Topicmarks darüber per Mail und liefert den Link zum so genannten “Text Knode” – so heißen bei Topicmarks die Zusammenfassungen von Texten.

Jeder Text Knode besteht aus verschiedenen Elementen: Einer listenförmigen Übersicht der im Text erwähnten Fakten, einer kompakten Zusammenfassung in mehreren Absätzen, einer Aufschlüsselung der wichtigsten Stichwörter in Tagcloud- und Indexform sowie aus Meta-Informationen zum Text.

Zum Vergrößern klicken

Zum Vergrößern klicken

Sämtliche analysierten Texte werden auf dem Topicmarks-Dashbard dargestellt und dort dauerhaft archiviert. Text Knodes erhalten einen kryptischen, aber frei zugänglichen Link, der jedoch erst etwas umständlich freigelegt werden muss, z.B. indem man auf den Twitter-Button klickt, woraufhin ein Tweet mit der URL zum Knode generiert wird (Beispiel: http://topicmarks.com/t/TGxwRHxJfDI1MDM5fFV8MjUwMzl8Y2VafA).

Momentan ist die Nutzung von Topicmarks kostenfrei. Mittelfristig strebt der Dienst an, von Intensivanwendern eine Gebühr zu verlangen. Was die Unterstützung weiterer Sprachen neben Englisch betrifft, sind die Topicmarks-Macher ehrlich und unterstreichen, dass die englischsprachige Version ein großer Erfolg werden müsste, bevor die Ausweitung auf andere Sprachen finanziert werden kann, weil dafür aufgrund der unterschiedlichen Struktur von Sprachen völlig neue Algorithmen notwendig sind.

Ich habe einige Texte mit Topicmarks getestet, die Resultate variierten dabei von brauchbar bis unbrauchbar. Insgesamt kann ich mir aber gut vorstellen, mit Topicmarks die Kernpunkte aus Texten zu extrahieren, die ich nicht vollständig lesen möchte und bei denen es auch nicht so schlimm ist, wenn ich die ein oder andere Passage verpasse.

Link: Topicmarks

 

Martin Weigert

Martin Weigert ist der leitende Redakteur von netzwertig.com.

Mehr lesen

Knowledge Graph: Google als semantische Entdeckungsmaschine

17.5.2012, 11 KommentareKnowledge Graph:
Google als semantische Entdeckungsmaschine

Unter dem Namen “Knowledge Graph” hat Google ein Feature vorgestellt, das die Suche auf ein neues Niveau hebt: Begriffe sind nicht mehr nur Zeichenfolgen, sondern haben eine Bedeutung und einen Zusammenhang.

Integration mit dem Google Reader: Topicmarks liefert  zusammengefasste RSS-Artikel

8.8.2011, 0 KommentareIntegration mit dem Google Reader:
Topicmarks liefert zusammengefasste RSS-Artikel

Topicmarks liefert automatisch erstellte Zusammenfassungen von Onlinetexten in englischer Sprache. Mittels einer neuen Integration des Google Readers lassen sich so zukünftig Beiträge aus den eigenen RSS-Feeds auf das Wesentliche reduzieren.

Linkwertig: Turntable.fm, Semantische Web, Google Health

27.6.2011, 0 KommentareLinkwertig:
Turntable.fm, Semantische Web, Google Health

Turntable.fm blockiert Zugriffe aus Europa, Überblick über RDFa, Microdata und Microformats und mehr.

Siri: Apples bescheidener Diener  und unscheinbarer Revolutionär

5.10.2011, 17 KommentareSiri:
Apples bescheidener Diener und unscheinbarer Revolutionär

Das iPhone 4S bringt den sprachgesteuerten persönlichen Assistenten Siri mit. Apple läutet damit eine Ära ein, in der wir mit unseren Computern, Tablets und Smartphones sprechen.

Integration mit dem Google Reader: Topicmarks liefert  zusammengefasste RSS-Artikel

8.8.2011, 0 KommentareIntegration mit dem Google Reader:
Topicmarks liefert zusammengefasste RSS-Artikel

Topicmarks liefert automatisch erstellte Zusammenfassungen von Onlinetexten in englischer Sprache. Mittels einer neuen Integration des Google Readers lassen sich so zukünftig Beiträge aus den eigenen RSS-Feeds auf das Wesentliche reduzieren.

Technischer Fortschritt: Ist die Welt reif  für eine Einheitssprache?

21.4.2011, 52 KommentareTechnischer Fortschritt:
Ist die Welt reif für eine Einheitssprache?

Sprachpuristen kämpfen gerne gegen Einflüsse aus anderen Sprachen. Gleichzeitig reißt der technische Fortschritt immer mehr Barrieren der Verständigung zwischen Völkern nieder.

Integration mit dem Google Reader: Topicmarks liefert  zusammengefasste RSS-Artikel

8.8.2011, 0 KommentareIntegration mit dem Google Reader:
Topicmarks liefert zusammengefasste RSS-Artikel

Topicmarks liefert automatisch erstellte Zusammenfassungen von Onlinetexten in englischer Sprache. Mittels einer neuen Integration des Google Readers lassen sich so zukünftig Beiträge aus den eigenen RSS-Feeds auf das Wesentliche reduzieren.

9 Kommentare

  1. Seit OS X gibt es zumindest auf dem Mac standardmässig den Dienst “Zusammenfassen” unter dem Applikationsmenü verfügbar für jede Software mit Text. Eventuell muss man den Dienst unter Einstellungen>Tastaturkurzbefehle>Dienste hinzufügen. Hier können Texte absatzweise und satzweise einstellbar gekürzt werden. Auch mehrsprachig. Die Ergebnisse sind jedoch nicht wirklich überzeugend.

  2. Ich gebe mein Hirn an der Garderobe ab und lasse Andere für mich denken. Nein, im Ernst, es wird ohnehin immer schwieriger, in Ruhe zuzuhören oder zu lesen. Es erfordert nun einmal Anstrengung und Zeit, zu verstehen, was der Andere wirklich meint. Diese Dienste werden unsere Probleme vergrößern.

  3. Ich frage mich: Wollen wir das? Die Informationsflut, die es zu bändigen gilt wird dann noch unkontrollierter wachsen. Wissen wird dann nicht mehr aufgeschrieben, um gelesen zu werden, sondern um daraus “Facts” und “Summaries” abzuleiten. Schreiben wir doch gleich nur noch das auf, was wichtig ist.

  4. Technologischer Fortschritt bringt immer auch Nebenwirkungen mit sich. Ich finde, dass diese jedoch nicht automatisch die Betrachtung der Vorzüge überlagern sollten.

    Im Übrigen: Aufzuhalten sind Entwicklungen wie diese ohnehin nicht. Insofern stellt sich die Frage, ob wir (als Gesellschaft) dies wirklich wollen, am Ende nicht.

  5. Ja und nein:
    Ja: Ich bin begeistert von der Vorstellung, die drei Paper, die ich heute lesen wollte, in knappen Zusammenfassungen vor mir zu haben, und dann nur noch die Stellen lesen zu müssen, die wirklich wichtig sind. Das Semantic Web wird (wenn auch nicht in naher Zunkunft), unseren Umgang mit Wissen und Infos entscheidend verändern. Vorzüge sehe ich da, und zwar viel.

    Nein: Technologien sind für den Menschen und nicht andersrum. Die Frage “Wollen wir das” stellt sich für mich immer. Wie eine Gesellschaft die technologischen Möglichkeiten nutzen möchte, ist für mich eine sehr wesentliche Frage, die zu disktutieren ist.
    P.S.: Kommentare auf wissensdialoge.de willkommen!

  6. Ich nehme an, der Service funktioniert am besten bei suchmaschinenoptimierten Texten, die klar um Keywords herum aufgebaut sind. Schon die klassische Stilvorgabe, Wortwiederholungen zu vermeiden, dürfte das Programm vor ein Problem stellen. Der Schreiber, der seinen Stil gegen die Zumutungen von SEO verteidigt, wird sich bestätigt fühlen: Was als “content” verfügbar gemacht wird, mit dem lässt sich vollautomatisch auch alles machen.

  7. Kostenfreie Nutzung, das bedeutet:
    1) “Login mit einem Yahoo- oder Google-Konto”. Haha, damit sie meine E-Mails gleich auch den interessierten Organisationen zusammengefasst bereitstellen können?

    2) “Sämtliche analysierten Texte werden auf dem Topicmarks-Dashbard dargestellt und dort dauerhaft archiviert.” Und damit können andere User sich gleich an den Texten der Mitmenschen erfreuen. Wer dort mehr hochlädt als eine öffentliche Website, handelt ziemlich fahrlässig.

    Alles in allem also gar nicht beunruhigend, dass es keinerlei Hinweise auf Nutzungsbedingungen/Terms of use auf der Site gibt.

    Aber immerhin gibt es hier einen aufschlussreichen Testbericht: “die Resultate variierten dabei von brauchbar bis unbrauchbar”. Das ist eine ziemlich gekonnte Zusammenfassung!

  8. Das ist auf jeden Fall ein sehr interessanter, wenn auch unglaublich schwer zu realisierender Ansatz, insofern ein Anspruch auf hohe Qualität gegeben ist und dauerhaft vom System erfüllt werden soll. Wir setzen bei Liviato auf das Wissen und die Kreativität unserer Nutzer, die Inhaltsangaben von Büchern verfassen.

3 Pingbacks

  1. [...] Der Schweizer Dienst Topicmarks kann englischsprachige Texte auf die wesentlichen Aussagen reduzieren. Martin Weigert stellt ihn auf netzwertig.com vor. [...]

  2. [...] Topicmarks aus Zürich extrahiert auf Basis einer semantischen Spracherkennungsanalyse die wichtigsten Fakten aus beliebigen englischsprachigen Texten. Topicmarks fasst mehrseitige Texte in 3 bis 50 Sätzen zusammen. Der Service befindet sich zur Zeit in einer Betaphase und ist kostenlos. Unser Schwesterblog netzwertig.com hat den Dienst getestet. [...]

  3. [...] Topicmarks: Automatisierte Textzusammenfassungen » netzwertig.com – (Tags: tools ) [...]