Thema: semantisches web

 

Alle 9 Artikel zum Thema semantisches web auf netzwertig.com:

Worum dreht sich der Hype um die semantische Suche von Yahoo eigentlich genau?

Michael Osl, 21. März 2008 um 12.50 Uhr, 7 Kommentare Kommentare

Yahoo Die Ankündigung von Yahoo, in Kürze semantische Inhalte in den Ergebnissen ihrer Suche aufzubereiten, hat in den englischsprachigen A-Blogs wahrlich eine kleine Welle von Euphoriestürmen ausgelöst. TechCrunch etwa sprach davon, dass man nun davon ausgehen könne, dass sich das Web jetzt in Windeseile selbst organisieren werde. ReadWriteWeb krönte die Nerds und sah sich in seiner Prognose bestätigt, dass 2008 das Jahr des semantischen Webs werde. Aber rechtfertigt die Ankündigung von Yahoo wirklich eine derartige Welle der Begeisterung?

Tatsächlich könnte die Unterstützung von semantischen Formaten durch die großen Suchmaschinenanbieter der entscheidende Anstoß sein, der den Stein ins Rollen bringt und das Thema semantische Web endgültig massenkompatibel macht. Derzeit mangelt es einfach noch an einer wirklichen Killer-Applikation, welche die wahren Vorteile der neuen Technologie aufzeigt. Das ist auch der Grund, warum die Anwendung von semantischen Web-Standards wie RDF derzeit noch mehr als verhalten erfolgt, von einigen wenigen Idealisten und technologischen Vorreitern mal abgesehen. Das klassische Henne-Ei-Problem eben. » weiterlesen

Google Trends:
Wie steht es um Web 2.0, Blogs, Datenschutz & Co?

Martin Weigert, 25. Februar 2008 um 18.43 Uhr, 12 Kommentare Kommentare

Google TrendsDie von Suchmaschinen am Ende eines jeden Jahres veröffentlichten Statistiken über häufig recherchierte Begriffe werden immer mehr zu wichtigen Trend- und Erfolgsmessern. Die Idee dahinter ist so simpel wie einleuchtend: Was häufig im Netz gesucht wird, bewegt die Menschen. Von Vorteil ist hier Googles Dominanz im Suchmaschinenmarkt: 90 Prozent aller Internetsuchen in Deutschland werden über Google durchgeführt, in den USA sind es immerhin mehr als die Hälfte. Bei Analysen des Suchverhaltens von Google-Nutzern kann man sich somit sicher sein, dass jeder Nutzertyp und jede soziale sowie demografische Gruppe enthalten ist. Umso schöner, dass das Unternehmen mit Google Trends Teile seiner Suchstatistik 365 Tage im Jahr zur Verfügung stellt. Damit können Nutzer sich die Entwicklung der Suchanfragen zu einem bestimmten Begriff über einen längeren Zeitraum anzeigen lassen. » weiterlesen

Neues von Freebase

Michael Osl, 24. August 2007 um 17.11 Uhr, 8 Kommentare Kommentare

Freebase Logo
Mein letzter Artikel über Freebase ist nun doch schon wieder einige Monate alt. Grund genug sich anzusehen, was sich in dieser Zeit alles getan hat sowie eine aktualisierte Bewertung des Potentials von Freebase und dessen Rolle im semantischen Web vorzunehmen. Außerdem gilt es, wieder einige neue Einladungen unters Volk zu bringen.

» weiterlesen

Semantisches Web Teil 3:
konkrete Anwendungsbeispiele

Michael Osl, 25. Juni 2007 um 9.55 Uhr, 3 Kommentare Kommentare

Nachdem sich der letzte Teil der Semantic Web-Serie etwas mehr der Theorie widmete, stelle ich in diesem Beitrag einige Applikationen und Anwendungsbeispiele aus der Praxis vor, die auf Semantic Web-Ansätzen beruhen.

Obwohl die Verbreitung von semantischen Webanwendungen bei privaten Unternehmen immer mehr an Fahrt gewinnt, können dennoch hauptsächlich öffentliche Behörden als Vorreiter dieser neuen Technologie bezeichnet werden. So wie etwa die US-Raumfahrtbehörde NASA, welche ihre unglaublichen Datenbestände in mehr als 11 Rechenzentren verwaltet. Als wäre das nicht schon genug, liegen all diese unterschiedlichen Daten auch noch in allen möglichen und unmöglichen Formaten vor. Um diesem Problem Herr zu werden, bedient man sich immer öfter semantischer Web-Anwendungen.
» weiterlesen

Semantisches Web Teil 2:
Die technische Umsetzung

Michael Osl, 30. Mai 2007 um 18.43 Uhr, 4 Kommentare Kommentare

In meinem erstem Artikel der Semantic Web-Serie habe ich die Grundidee hinter dem semantischen Web beschrieben. Im zweiten Artikel der Serie möchte ich mich nun dem aktuellen Stand der technischen Umsetzung widmen.

Bevor ich das mache möchte ich allerdings betonen, dass ich kein ausgewiesener Experte in diesem Fachgebiet bin, sondern nur ein an der Thematik interessierter Anwender. Ebenso lässt sich in dem begrenzten Rahmen hier nicht jede Facette bis ins letzte Detail beschreiben, vielmehr möchte ich einen kompakten Überblick über das Thema geben. » weiterlesen

Semantisches Web Teil 1:
Was steckt hinter dem Begriff?

Michael Osl, 11. Mai 2007 um 21.27 Uhr, 4 Kommentare Kommentare

Der Begriff «Semantisches Web« ist zwar nicht wirklich neu aber trotzdem für viele noch eine nebulöse graue Wolke. Da das Thema aber immer mehr an Fahrt gewinnt (siehe etwa diesen oder auch diesen Artikel bei Heise) ist das Grund genug für zweinull.cc, sich dem Thema semantisches Web in einer Serie von insgesamt vier Beiträgen etwas ausführlicher zu widmen.

In diesem Artikel werde ich allerdings erstmal nicht allzu weit ins Detail gehen, sondern nur die grundsätzliche Idee hinter dem semantischen Web vorstellen. Der zweite Artikel wird sich mit der heutigen technischen Umsetzung befassen, der dritte Beitrag wird konkrete Anwendungsbeispiele vorstellen und im vierten Artikel letztendlich werde ich auf Kritikpunkte und Gefahren eingehen, welche die neue Technologie mit sich bringen könnte.

Ausgangslage – Das Web von heute

Nehmen wir an, ich suche nach dem günstigsten Modell einer Digitalkamera und möchte dieses noch am selben Tag in einem Laden der Umgebung kaufen. Da ich neu in der Stadt bin, werde ich erst einmal damit beginnen, die Adressen verschiedener Elektrohändler aus meiner Umgebung zu suchen. Dazu benutze ich eine Online-Branchenauskunft. Anschließend trage ich die gewonnen Ergebnisse in eine Excel-Liste ein und besuche die Webseiten der einzelnen Händler, um die Preise meines gewünschten Kameramodells zu vergleichen. Zudem möchte ich wissen, wie lange die jeweiligen Läden heute geöffnet haben. Ich beginne also, der Reihe nach, die einzelnen Webseiten der Händler anzusurfen und die gewonnen Informationen in einer Liste zusammenzutragen. Obwohl die Internetauftritte der verschiedenen Händler sehr unterschiedlich gestaltet sind, ist es dennoch ein leichtes, Informationen wie die Öffnungszeiten einer Filiale daraus zu gewinnen. Das Zusammentragen der Liste ist zwar etwas mühselig, aber dennoch eine intellektuell leicht zu bewältigende Aufgabe.

Was für einen Menschen kein Problem darstellt, ist für einen Crawler hingegen nicht so ohne weiteres zu bewerkstelligen. Denn um gezielte Informationsketten wie die oben genannte aus verschiedenen Webseiten und Datenquellen extrahieren zu können, präsentieren sich die Daten viel zu unterschiedlich (siehe Screenshot) - Computer sind mit der heutigen Rechenleistung schlichtweg nicht in der Lage, jene Abstraktion herzustellen, die notwendig ist, um etwa aus einer beliebigen Webseite eines Online-Shops den Preis eines bestimmen Digitalkameramodells zu ermitteln. Aber wäre es nicht fantastisch, wenn es doch eine Möglichkeit gäbe, dass ein Computerprogramm diese Daten verarbeiten kann? So könnte ich, anstatt aufwändig händisch eine Liste zusammenzutragen, einfach eine Anwendung diese Arbeit für mich erledigen lassen. Genau hier kommt die Idee des semantischen Webs ins Spiel.

online_shops.jpg

Blickt man auf verschiedene Webshops so erkennt man warum es so schwierig ist, Inhalte automatisch auszulesen: Angaben, wie etwa der Verkaufspreis, sind alle unterschiedlich formatiert und an verschiedenen Stellen eingebettet. Das semantische Web hilft, diese Daten im Hintergrund zu vereinheitlichen, ohne das Layout zu verändern.

Die Idee des semantischen Webs

Vereinfacht gesagt kann man sich das semantische Web so vorstellen, dass Informationen eben nicht nur für Menschen verarbeitbar aufbereitet werden, sondern diese auch für Maschinen lesbar gemacht werden. Man erklärt Robots und Crawlern sozusagen, worum es sich bei einem Inhalt handelt und in welcher Beziehung dieser zu anderen Informationen steht. Dies geschieht mit einheitlichen Formaten und Auszeichnungen, von welchen eines der Wichtigsten das «Resource Description Framework« (kurz RDF) ist, auf welches ich im zweiten Artikel dieser Serie ausführlich eingehen werde.

Durch die Vereinheitlichung von Daten im Hintergrund lassen sich diese dann beliebig kombinieren – egal aus welcher Quelle diese auch kommen. Ein Objekt vom Typ «Adresse« bleibt ein Objekt des Typs «Adresse«, egal auf welcher Webseite dieses definiert wird und wie es letztendlich auch formatiert ist. Dadurch lassen sich diese Daten auch webseitenübergreifend abfragen und auswerten. So kann ein Crawler das Netz beispielsweise nach allen Webseiten durchforsten, die vom Typ «Elektronikhändler« sind, deren Objekt «Adresse« auswerten und in einen Stadtplan einarbeiten. Auch das ist einer der Kernpunkte des semantischen Webs: Daten sind nicht mehr nur isoliert pro Webseite verfügbar, sondern das gesamte Web verschmilzt zu einem einzigen riesigen Datenspeicher.

Einen ersten Einblick, welche vielfältigen neuen Möglichen sich mit einer solchen Verknüpfung von Daten erzielen lassen, zeigen die vielfältigen so genannten Mash-Ups derzeit. Diese sprießen derzeit wie Pilze aus dem Boden und vermischen in der Regel Daten von zwei Web 2.0 Diensten so, dass daraus eine neue Anwendung geschaffen wird. Doch mit dem semantischen Web werden noch viel mehr Möglichkeiten geschaffen, die weit über heutige Mash-Ups hinausgehen werden. Kein Wunder also, dass nicht selten im selben Atemzug das Wort «Web 3.0« fällt, wenn von semantischen Webdiensten die Rede ist .

Welch großes Potential das semantische Web wird nicht zuletzt dadurch aufgezeigt, dass einer der größten Unterstützer des semantischen Webs niemand geringeres als das W3C ist, jenes Konsortium also, welches die Standard im Internet festlegt. Deren Vorsitzender und der Erfinder des Webs, Tim Berners-Lee, gilt als Galionsfigur und einer der treibenden Kräfte hinter der neuen Technologie. Auf der Webseite des amerikanischen BusinessWeek-Magazin findet sich ein lesenswertes und interessantes Interview mit Berners-Lee.

Sollte sich die Idee des semantischen Webs durchsetzen, so würde dies die Nutzung des Internets für uns alle drastisch effizienter machen. Doch bevor ich mich im dritten Teil den praktischen Anwendungsmöglichkeiten widme, wird im nächsten Teil zu lesen sein, welche Ansätze es von der technischen Seite gibt. In Kürze auf zweinull.cc!

Dieser Beitrag wurde ursprünglich im Blog zweinull.cc veröffentlicht. Im Mai 2008 wurden zweinull.cc und netzwertig.com zusammengeführt.

Fünf Einladungen für Freebase zu vergeben

Michael Osl, 9. Mai 2007 um 20.42 Uhr, 2 Kommentare Kommentare

Heute landete eine Mail von Freebase in meinem Posteingang, in der es unter anderem heißt:

“We’ve made some good progress in alpha and would like to continue to
grow the user community with your help.

All existing Freebase users have been granted 5 additional invitations. If you know anyone you’d characterize as a ‘data fanatic’, please invite them to join.”

Wer Freebase nicht kennt, findet eine umfassende Beschreibung in meinem Artikel “Ein erster umfassender Einblick in Freebase” vom 3. April 2007.

Alle “Daten-Fanaten” (Eine etwas unglückliche Übersetzung, ich geb’s zu ;)) also, die gerne einen Blick in einen der zukunftsträchtigsten Dienste des Webs werfen möchten, senden eine Mail an moe at zweinull punkt cc.

Dieser Beitrag wurde ursprünglich im Blog zweinull.cc veröffentlicht. Im Mai 2008 wurden zweinull.cc und netzwertig.com zusammengeführt.

Ein umfassender Einblick in Freebase

Michael Osl, 3. April 2007 um 19.14 Uhr, 11 Kommentare Kommentare

Neulich hatte ich ja über Freebase und dessen Entwicklungspotential berichtet. Nachdem ich nun eine Einladung erhalten habe (Danke, Jutta :)) und mich intensiver mit dem Dienst beschäftigen konnte folgt hier nun ein zweiter, detaillierter Bericht, der sowohl Einblicke in den Dienst gibt, wie er sich im Moment präsentiert als auch technische Hintergründe.

freebase banner

Das Freebase-Banner

Was ist Freebase?

Freebase ist eine globale Datenbank, die das Wissen der Welt in geordneter und strukturierter Form enthält. Es geht hier also weniger um enzyklopisches Wissen das in erster Linie für den menschlichen Leser gedacht ist, sondern vielmehr um eine Sammlung von Listen, Referenzen und Datensätzen - Eine Wikipedia für Maschinen sozusagen. Der Clou an der Sache ist, dass diese Datensammlung nicht lose aneinandergereiht ist, sondern alle Daten miteinander verknüpft werden. Ein Riesen-Schritt in Richtung semantisches Web, der ultimativen Alles-mit-Allem-Verknüpfung von Daten. Tim O’Reilly vergleicht in seinem Beitrag “Freebase Will Prove Addictive” diese Verbindungen mit den Synapsen eines menschlichen Gehirnes.

Hinter dem Projekt steckt die Metaweb Technologies mit Sitz in San Francisco. Das Unternehmen Metaweb hat eine Technologie und API namens Metaweb geschaffen, auf welcher die Freebase basiert. Das Unternehmen will, laut Eigenauskunft, ihr Geld mit dieser Metaweb-Technologie verdienen.

Der Aufbau von Freebase

Das System ist vollständig objektorientiert aufgebaut. Das heißt, jedes Element in Freebase ist ein Objekt, welches bestimmte Eigenschaften besitzt und mit anderen Objekten verknüpft ist. Jedes Objekt ist einem oder mehreren Typen zugeordnet und verfügt sowohl über eine eindeutige ID als auch einen optionalen Namen. Dieser ist allerdings nicht eindeutig und ist in erster Linie für Menschen gedacht.

Objekte, die dafür für den menschlichen Leser von Interesse sein können, werden “Topics” genannt. Diese bieten einem Objekt zum Beispiel die Möglichkeit, es mit Bildern aufzupeppen.

Die Typen selber sind in Domains hirarchiert, in der Typen ähnlicher Gebiete gruppiert werden. Derzeit gibt es Domains wie beispielsweise /business, /people oder /sports.

freebase_domains.gif

Natürlich würden einem diese einzelnen Objekte herzlich wenig nützen. Das Salz in der Objektsuppe sind die vielfältigen Verknüfpungen der Objekte zueinander. So ist Beispielsweise “Wien” mit “Österreich” genau so verknüpft wie “Arnold Schwarzenegger”, der aber auch mit dem Film “Terminator” verknüpft ist usw. Dadurch ergibt sich letztendlich eine riesige Wolke an Verknüpfungen.

freebase screenshot1

Hier ist das Objekt “Austria” geöffnet. Es gehört den beiden Typen “Location” und “Country” an.

Mehrsprachigkeit

Ein großer Pluspunkt ist, dass die Mehrsprachigkeit von Beginn an vorgesehen ist, gerade bei US-amerikanischen Diensten ist das nicht immer eine Selbstverständlichkeit. Die Mehrsprachigkeit ist konkret so implementiert, dass die Bezeichner der einzelnen Objekte in mehrern Sprachen hinterlegt sein können - was ja auch logisch ist. Mailand ist ja schließlich auch im englischen Sprachraum die zweitgrößte Stadt von Italien, auch wenn dort die Stadt “Milan” und das Land “Italy” genannt wird. Hier sehe ich auch Potential für semantische Übersetzungstools, welche Anhand des Kontexts die richtige Übersetzung eines Begriffes durchführen.

Lizensierung der Inhalte

Natürlich macht es wenig Spaß, Daten und Arbeit einem Unternehmen in den Rachen zu werfen, das anschließend mit den Daten machen kann, was es will.

Besonders wichtig ist es daher, dass die freie Zugänglichkeit der Daten gewährleistet ist. Im Falle der Freebase wird das durch die Lizensierung der Daten durch die Creative Commons erreicht.

Es werden allerdings drei Unterscheidungen getroffen, was die Typen von Inhalten betrifft: Zum einen die Daten als Ganzes, welche immer unter der Creative Commons Attribution license (CC-BY) lizensiert sind. Die Texte zu den einzelnen Datensätzen unterliegen entweder ebenfalls der CC-BY oder aber der GNU Free Documentation License. Die dritte Unterscheidung betrifft Medien-Daten wie Bilder usw. Diese sind in der Regel public domain, es können aber auch copyright-geschützte Bilder darunter sein, die unter die fair-use Regelung des amerikanischen Rechts fallen. Hier obligt es dem Anwender der Daten zu überprüfen, ob alle Copyrightbestimmungen eingehalten werden.

Verwendet man Daten aus der Freebase, so ist jedenfalls immer eine Namensnennung erforderlich, konkret geschieht dies durch einen Link auf www.freebase.com .

Wer soll das alles eingeben?

Dass die Masse sowohl die Eigendynamik als auch das sprichwörtliche Wissen haben kann, eine solche Datenbank zu erstellen und zu Pflegen sollte selbst den hartgesottenesten Kritikern spätestens seit der Wikipedia klar sein. Die große Kunst ist es nur, diese Masse auch zu mobilisieren.

Die Arbeit selber um einen guten Datenbestand aufzubauen besteht dabei meiner Meinung nach aus zwei Teilen: Zum einen müssen die Objekte erstmal alle Ihren Weg in die Freebase schaffen. Zum anderen müssen anschließend zwischen all diesen Objekten die Verknüpfungen hergestelllt werden.

Was den ersten Teil betrifft, also große Mengen an Grunddaten in das System zu bringen, so ist es unerlässlich, ausgereifte Importfunktionen zur Verfügung zu stellen. Der objektorientierte Ansatz kann es aber durchaus schwierig gestalten, solche Routinen zu schreiben. Ein anderer Weg, die Daten in das System zu bringen ist die API, auf die ich etwas weiter unten näher eingehe.

Der zweite Teil, das Verknüpfen der Daten, ist dagegen mit wesentlich mehr Handarbeit verknüpft. Beim Herumexperimentieren mit der Oberfläche stellt man jedoch fest, dass gerade jetzt in der Anfangsphase, in welcher sich viele Daten noch sehr lückenhaft präsentieren, die Hemmschwelle sehr gering ist, mal eben eine solche fehlende Verknüpfung herzustellen. Im Gegensatz zur Wikipedia muss man sich nämlich nicht erst grammatikalisch halbwegs sinnvolle Sätze ausdenken (was man unbedingt machen sollte bevor man einen Wikipedia-Artikel ergänzt) sondern klickt einfach ein paar mal um die Verknüfpung herzustellen und die Sache ist erledigt.

adding germany

Verknüpfungen herstellen: Hier ergänze ich im Objekt “German” das Feld “countries spoken in” um “Germany”. Natürlich habe ich anschließend noch Austria, Schweiz und Liechtenstein hinzugefügt ;)

Pflegen der Daten

Hauptsächlich gibt es derzeit ein enorm Ajax-lastiges Web-Interface, sowie eine leistungsfähige API, die hauptsächlich für die Nutzung durch automatisierte Dienste vorgesehen ist.

Das Web-Interface bietet Web 2.0 in Reinkultur: AJAX wohin das Auge blickt. Einige Dinge sind noch nicht ganz ausgereift, Metaweb schreibt sich das mit der Versionsbezeichung “alpha” gegenwärter aber auch nicht unbedingt auf die Fahnen. Es macht aber Spaß, sich durch die Oberfläche zu hanglen und ist vom ersten Ansatz her durchaus gelungen.

Die Freebase-API und Metaweb Query Language (MQL)

Die API ist über HTTP realisiert. Anfragen werden mit GET-Parametern gestellt, die Rückgabe der Daten folgt per HTTP-Response.

Die Anfragen werden mit Hilfe der “Metaweb Query Language” (MQL) formuliert. Es handelt sich hierbei um eine Abfragesprache, mit welcher die Daten dem Dienst sowohl entlockt als auch in ihm abgespeichert und verändert werden können. Die MQL orientiert sich an der bereits existierenden JSON-Syntax . Somit sollte es für die meisten Web-Entwickler keine große Hürde darstellen, sowohl die MQL-Syntax zu erlernen, als auch die Daten zu verarbeiten.

Vom Aufbau her gestaltet sich eine Anfrage immer so, dass man jene Teile eines Objektes, welche man kennt im Query angibt und jene Teile, die man abfragen möchte mit Platzhaltern versieht. Sendet man nun die Anfrage an den Server, so erhält man exakt den selben Datensatz zurück, jedoch um die fehlenden Daten ergänzt. Der Umstand, dass das Rad nicht neu erfunden wurde, sondern mit JSON auf bereits existierende Syntax aufgebaut wurde und man somit auf unzählige fertige Parser für alle erdenklichen Programmiersprachen zurückgreifen kann ist ein sehr kluger und durchdachter Schritt.

mql query

Der Query Editor - links die Abfrage, rechts das Ergebnis.

Einschränkungen der MQL

Allerdings hat die Sprache einige Einschränkungen: Oder-Bedigungen sind nur über Umwege durchzuführen und auch ausschließende Bedingungen sind nicht auf direktem Wege möglich. Dieser muss der Programmierer selber durchführen. Ein Beispiel: Man möchte alle Länder filtern, die mit “A” beginnen, aber nicht in Asien liegen. Hier muss man zwei Queries ausführen: Zuerst “Finde alle Länder mit A” und anschließend “Finde alle Länder in Asien, die mit A beginnen” um die Elemente des zweiten Queries vom ersten Ergebnis abzuziehen.

Die Metaweb Query Language bietet aber nicht nur lesenden sondern auch schreibenden Zugriff. Das heißt mit Zuhilfenahme der API können Daten auch automatisiert gepflegt und abgeglichen werden. Hier muss es natürlich Mechanismen geben, um die zwei leidigsten Themen des Web 2.0 zu verhindern: Spam und Vandalismus.

Selber experimentieren

Wer jetzt neugierig geworden ist und selber den Dienst ausprobieren möchte, für den dürfte die größte Hürde es darstellen, dass der Dienst derzeit nicht allgemein zugänglich ist. Wer aber eine Einladung ergattert, der kann sich in der Sandbox austoben. Dies ist eien 1:1 Kopie der “echten” Freebase, auf der munter experimentiert werden darf. Diese ist unter http://sandbox.freebase.com/ zu erreichen. Jede Woche werden die Daten dann neu abgeglichen.

Fazit

Die Idee einer solchen Datenbank ist unglaublich faszinierend und ein weiterer Schritt in Richtung umfassende Wissensgesellschaft. Nach der Wikipedia ist Wissen nicht nur mehr überall nachschlagbar, sondern auch jederzeit filterbar. Die Umsetzung durch Metaweb wirkt sehr rund und durchdacht und auch mit der Wahl, die Daten unter der Creative Commons zu lizensieren sind die Weichen für eine positive Entwicklung des Dienstes gestellt.

Letzten Endes ist es jedoch eine Frage die Massen des Webs zu dynamisieren und zu hoffen, dass dieser Dienst gut angenommen wird.

Dieser Beitrag wurde ursprünglich im Blog zweinull.cc veröffentlicht. Im Mai 2008 wurden zweinull.cc und netzwertig.com zusammengeführt.

Freebase:
Ein Dienst mit Riesen-Potential

Michael Osl, 22. März 2007 um 22.23 Uhr, 1 Kommentar Kommentare

Relativ unbeachtet (die Blogosphäre war ja mit trivialeren Dingen beschäftigt) startete unter freebase.com kürzlich ein neuer Dienst in die nicht-öffentliche Testphase der meiner Meinung nach über enormes Potential verfügt: Es werden dort gemeinsam Listen und Datenbanken erstellt - Geordnete, durchsuchbare und filterbare Daten also, die im Gegensatz also zur Wikipedia vor allem durch Maschinen nutzbar sind - was einen großen Schritt in Richtung Semantisches Web darstellen kann.

Angefangen von globalen Ortsdatenbanken mit Postleitzahlen und geographischen Positionen bis hin zu Strichcode-Sammlungen von Supermarktprodukten ist alles dabei alles denkbar und letztendlich kann auch die Wikipedia davon profitieren, wie etwa bei der Angabe von statistischen Daten zu Städten zum Beispiel. Die von den Usern erstellte Inhalte werden dabei laut den Nutzungsbedingungen unter der Creative Commons veröffentlicht - man darf also die Inhalte vervielfältigen und weiterverarbeiten, vorausgesetzt man nennt den Namen des Rechteinhabers.

Hinter dem Projekt steht die Metaweb Technologies Inc., welche im Juli 2005 von Veteranen aus bekannten Unternehmen wie Netscape, Alexa und Intel in San Francisco gegründet wurde und mit reichlich Venturekapital ausgestattet ist.

Leider kann man sich derzeit nicht registrieren, sondern muss eingeladen werden wenn man den Dienst testen möchten, deshalb hatte ich noch nicht die Möglichkeit hatte, mir das Ganze im Detail anzusehen, aber wer eine Einladung übrig hat, kann sie mir gerne zusenden ;)

Dieser Beitrag wurde ursprünglich im Blog zweinull.cc veröffentlicht. Im Mai 2008 wurden zweinull.cc und netzwertig.com zusammengeführt.

 
blogoscoop slug