Unternehmensweite Suche: die Verbindung von Daten und Wissen, Teil 1

Wir vom Blog-Team freuen uns natürlich sehr über die Veröffentlichung der GA-Version von DatAnswers, unserer Lösung für unternehmensweite Suche. Die Kurzbeschreibung von DatAnswers: eine Google-ähnliche Suche für Datei- und SharePoint-Daten....
Michael Buckbee
3 minute gelesen
Letzte aktualisierung 1. November 2021

Wir vom Blog-Team freuen uns natürlich sehr über die Veröffentlichung der GA-Version von DatAnswers, unserer Lösung für unternehmensweite Suche. Die Kurzbeschreibung von DatAnswers: eine Google-ähnliche Suche für Datei- und SharePoint-Daten. Genau wie Google ist Varonis der Meinung, dass Metadaten die Suche ungemein bereichern. Ein anderer Aspekt der unternehmensweiten Suche erhält allerdings nicht annähernd die Aufmerksamkeit, die er verdient hätte – nämlich das tief in unstrukturierten Dateiinhalten vergrabene Wissen.

Ja, auch hier spielen Metadaten eine Rolle.

Was macht man, nachdem man die Daten der ganzen Welt indiziert hat? Eine mittlerweile berühmte Antwort von Larry Page aus der Anfangszeit von Google lautet: „Oh, wir produzieren wirklich eine künstliche Intelligenz.“

In diesem Satz steckt viel Wahrheit! Google verwendet das kollektive Wissen von Millionen von Menschen, um eine Art künstliche Intelligenz (KI) zu erschaffen. Sie versuchen nicht, die Suche mithilfe von KI zu verbessern, sondern sie verwenden die Suche, um die KI zu verbessern.

Wo findet man also erste Ansätze dieser Intelligenz innerhalb einer Suche?

Ein Hinweis auf KI wird meist übersehen: die Liste mit automatischen Vorschlägen, die sich öffnet, sobald Sie ein Wort ins Suchfeld tippen.

In diesem ersten Beitrag unserer Blogserie zu Suche und Wissen gehen wir den automatischen Vorschlägen bei der Internetsuche auf den Grund und zeigen anschließend, wie man einige dieser Grundideen benutzen kann, um Informationen und Wissen aus Unternehmensdaten (und Metadaten) zu ziehen.

Das Wissen hinter der automatischen Suchwort-Vervollständigung

Selbstverständlich sind die Algorithmen der großen Suchmaschinen – Google, Microsoft, Yahoo (mit seiner Microsoft-Variante) – höchst geheim. Doch Beobachter konnten genügend Details herausfinden (lesen Sie dazu den Beitrag von SEO-Crack Rand Fishkin), um einige naheliegende Vermutungen zum Geheimrezept der Google-Suchvorschläge anzustellen.

Der offensichtlichste Ansatz, um das „kollektive Wissen“ anzuzapfen, besteht natürlich darin, automatische Vorschläge nach der Beliebtheit der Suchwörter zu erstellen. Laut Google ist ein wichtiges „Signal“ bei der Erstellung der Vorschläge, wie häufig dieselben Stichwörter bereits gesucht wurden.

Das klingt logisch. Wenn viele Personen ähnliche Suchwörter eingeben, erhält man einen zuverlässigen Einblick in die Suchabsicht eines Google-Benutzers.

Ein Beispiel: Am Sonntag, den 1. Februar – also am Super Bowl Sunday in den USA – zeigte Google die folgenden Vorschläge an:

Die Suche in Microsofts Bing hat

Die Suche in Microsofts Bing hat übrigens andere Ergebnisse ergeben. Tatsächlich verwendet Google noch eine weitere Methode für seine automatischen Suchwortvorschläge – aber dazu später mehr.

Es überrascht vielleicht nicht, dass Suchanfragen zum Thema Super Bowl an diesem Tag ganz vorne mit dabei waren. Mit Google Trends kann man sogar die Häufigkeit bestimmter Suchanfragen in unterschiedlichen Zeiträumen abfragen. Hier sieht man: „superbowl time“ ist eine sehr beliebte Suchanfrage.

Es gibt aber noch ein paar Feinheiten zu beachten. Eine davon ist, dass Google die Aktualität der Suchanfragen mit einbezieht. Es geht also nicht um die Beliebtheit der Suchwörter in den letzten sechs Monaten, sondern um die momentane Intensität.

So fand ich am Samstag dem 30. Januar, also dem Tag vor dem Super Bowl, „superbowl odds“ (Super Bowl-Gewinnchancen) in meiner Liste mit automatischen Vorschlägen.

Ich nehme an, dass viele Leute noch in letzter Minute Wetten abschließen wollten und deshalb die entsprechenden Suchwörter vorne lagen. Am Tag des großen Spiels selbst konzentrierten sich die Google-Benutzer laut den automatischen Vorschlägen auf banalere Details wie die Uhrzeit des Anpfiffs und – zumindest nach den Bing-Ergebnissen zu urteilen – auf Rezepte.

Die Lage, die Lage, die Lage

Der geografische Standort, an dem Sie sich bei der Eingabe von Suchwörtern befinden, ist ein weiterer wichtiger Faktor von Google Suggest. In den USA sind „super bowl“ und „football“ derzeit sehr häufige Suchwörter, doch in anderen englischsprachigen Ländern sind sie weitaus weniger beliebt.

Der Ort spielt hier eine große Rolle. Als ich „ski“ in Google Trends eingab, fiel mir auf, dass dieses Suchwort im Westen und Nordosten der USA weitaus beliebter ist als in anderen Regionen. Das ist nicht weiter überraschend. Google informiert mich darüber, dass dies als Teil einer Suche nach „ski resorts“ (Skigebiete) angezeigt wurde.

Mit dieser Suchkombination schlug Google mir als Benutzer

Mit dieser Suchkombination schlug Google mir als Benutzer aus New Jersey die Suchanfragen „ski resorts in vermont“ und „ski resorts in pa“ vor, als hätte sie Suchmaschine meine Gedanken gelesen. Gute Arbeit, Google!

Konzeptbasierte Suche

Bei diesen letzten Vorschlägen für Skifahrer passiert aber noch mehr im Hintergrund. Google scheint zu verstehen, dass „ski resorts“ mehr als nur eine Aneinanderreihung von Stichwörtern ist. Es weiß, dass es Orte sind, an die Menschen reisen und die etwas mit Schnee zu tun haben.

„ski resorts near nyc“ (Skigebiete in der Nähe von New York City; siehe Screenshot) ist eigentlich eine zusammenhängende Suchabfrage, nicht nur die Suche nach einzelnen Stichwörtern. Wenn Sie sich die Ergebnisse ansehen, werden Sie feststellen, dass Google Skigebiete im Umkreis von etwa 150 Kilometern des Ballungsraums New York anzeigt. Und es liefert eine Karte mit Markierungen für jedes Skigebiet. Gibt man „ski resorts in vermont“ ein, zeigt Google die Schneeverhältnisse in einer praktischen Tabelle an. Ein nettes Detail.

Willkommen in der Welt des Semantic Web, das Google vor gut einem Jahr mit seinem Hummingbird-Update in die Suchmaschine integriert hat. Die Google-Algorithmen haben die Bedeutung der Stichwörter erfasst, sie zugeordnet, mit anderen Konzepten verknüpft und dann mit ähnlichen Konzepten aus dem Web abgeglichen.

Für diese beeindruckenden Rechenvorgänge, die doch sehr an künstliche Intelligenz erinnern, hat Google eine separate Struktur zu Hilfe genommen, die als semantisches Schema bezeichnet wird. Ein solches Schema sagt der Suchmaschine, dass „ski resorts“ ein Ort mit Attributen wie Adresse und Telefonnummer ist und dass Skifahren etwas mit Schnee zu tun hat, der wiederum über Attribute wie Tiefe, Feuchtigkeitsgrad usw. verfügt.

Dies ermöglicht die Feinabstimmung der Suche und verhilft Google schließlich zu relevanten Ergebnissen.

Was bedeutet das für die unternehmensweite Suche

Es gibt Organisationen und Unternehmen, die diese hilfreichen Schemata bereitstellen. Und es spricht nichts dagegen, sie auch für die unternehmensweite Suche zu nutzen. Genau wie Google kann theoretisch auch die unternehmensweite Suche die Bedeutung von Stichwörtern erfassen und relevante Dateiinhalte finden.

In unserem nächsten Blog-Eintrag nehmen wir die automatischen Suchvorschläge noch genauer unter die Lupe. In der Zwischenzeit können Sie schon ein Mal darüber nachdenken, welche Entsprechung der Ort der Google-Suche in der unternehmensweiten Suche hätte.

Ein Tipp: Metadaten spielen hier eine wichtige Rolle!

The post Unternehmensweite Suche: die Verbindung von Daten und Wissen, Teil 1 appeared first on Varonis Deutsch.

What should I do now?

Below are three ways you can continue your journey to reduce data risk at your company:

1

Schedule a demo with us to see Varonis in action. We'll personalize the session to your org's data security needs and answer any questions.

2

See a sample of our Data Risk Assessment and learn the risks that could be lingering in your environment. Varonis' DRA is completely free and offers a clear path to automated remediation.

3

Follow us on LinkedIn, YouTube, and X (Twitter) for bite-sized insights on all things data security, including DSPM, threat detection, AI security, and more.

Testen Sie Varonis gratis.

Detaillierte Zusammenfassung Ihrer Datensicherheitsrisiken
Umsetzbare Empfehlungen, die auf Ihre Bedürfnisse zugeschnitten sind
Ohne Bedingungen und Auflagen

Weiter lesen

Varonis bewältigt Hunderte von Anwendungsfällen und ist damit die ultimative Plattform, um Datenschutzverletzungen zu stoppen und Compliance sicherzustellen.

verstehen-und-anwenden-des-modells-der-gemeinsamen-verantwortung-in-ihrer-organisation
Verstehen und Anwenden des Modells der gemeinsamen Verantwortung in Ihrer Organisation
Um erhebliche Sicherheitslücken und Risiken für sensible Daten zu vermeiden, müssen Unternehmen verstehen, wie das Modell der gemeinsamen Verantwortung funktioniert, das viele SaaS-Anbieter verwenden.
datanywhere-ab-sofort-für-bis-zu-fünf-nutzer-kostenfrei-downloaden
DatAnywhere ab sofort für bis zu fünf Nutzer kostenfrei downloaden
Wir haben es bereits letzte Woche angekündigt… und inzwischen steht DatAnywhere zum kostenlosen Download für bis zu 5 Nutzer zur Verfügung. DatAnywhere verwandelt die Filesharing-Infrastruktur eines Unternehmens in eine private...
hacker-tales:-mit-einem-kleinen-unfall-fing-alles-an,-teil-2
HACKER TALES: MIT EINEM KLEINEN UNFALL FING ALLES AN, Teil 2
von David Gibson Im ersten Teil unseres Blogbeitrags hatte sich unser Autor noch ganz unschuldig auf die Suche nach seinen verlorenen Daten gemacht und dabei Dinge gesehen, die er eigentlich...
varonis-datenschutzplattform-im-gartner-2017-market-guide-für-datenzentrische-audit--und-schutzlösungen-gelistet
Varonis Datenschutzplattform im Gartner 2017 Market Guide für Datenzentrische Audit- und Schutzlösungen gelistet
2005 hatte unser Gründer die Vision, eine Lösung für den Schutz von Daten zu schaffen, von denen Organisationen die größten Mengen aber das geringste Wissen haben – Dateien und E-Mails. Aufbauend...