Was wird angezeigt?
|
|
Seiten |
News |
Dateien |
Personen |
Apps & Links (im Launchpad) |
Plugins (z.B. Befragungen) |
---|---|---|---|---|---|---|---|
Titel |
Vollständiges Wort |
||||||
Präfix |
|||||||
Inhalt |
Vollständiges Wort |
Profilfelder |
|||||
Präfix |
|||||||
Metadaten |
- |
Beschreibung |
Teaser |
- |
- |
Beschreibung |
- |
Vollständiges Wort |
|||||||
Präfix |
|||||||
Datum |
- |
Titel: Bezieht sich auf den Namen einer Seite, eines News-Beitrags oder einer Datei.
Inhalt: Bezieht sich auf den Inhalt einer Seite, eines News-Beitrags oder einer Datei.
Metadaten: Bezieht sich auf Informationen, die nicht zum eigentlichen Inhalt eines News-Beitrags oder einer Seite gehören. Zum Beispiel der Teasertext für einen News-Beitrag und das Beschreibungsfeld für Seiten.
Beschreibung: Bezieht sich auf zusätzliche Informationen, die Einblick in den Kontext einer Seite geben. Die Beschreibung ist nur für Seiten verfügbar und wird in den Suchergebnissen angezeigt.
Teaser: Bezieht sich auf zusätzliche Informationen, die Einblick darin geben, welches Ziel ein News-Beitrag verfolgt. Teaser sind nur für News-Beiträge verfügbar.
Vollständiges Wort: Bezieht sich auf eine exakte Wortübereinstimmung. Zum Beispiel: Wenn Nutzer nach „Staffbase“ suchen, werden in den Suchergebnissen Inhalte angezeigt, die genau dem Wort „Staffbase“ entsprechen.
Präfix: Bezieht sich auf den vorangestellten Wortabgleich. Zum Beispiel: Wenn Nutzer nach „Staff“ suchen, werden in den Suchergebnissen Inhalte angezeigt, die mit dem Präfix „Staff“ übereinstimmen, wie etwa „Staffbase“.
Profilfeld: Bezieht sich auf System- und benutzerdefinierte Profilfelder, die von einem Administrator in den Studio-Einstellungen erstellt wurden.
Datenverarbeitung während der Indexierung
Während der Indexierung werden Daten verarbeitet, um das spätere Abrufen von Informationen zu erleichtern.
Bei der Indexierung analysiert die Suche den Text nach folgenden Kriterien:
- Groß- & Kleinschreibung: Alle Zeichen werden als Kleinbuchstaben betrachtet. Zum Beispiel werden die Begriffe “Arm” und “arm” als gleichwertig angesehen.
- ASCII-Zeichen: Bei der Indexierung werden alphabetische, numerische und symbolische Zeichen, die nicht im Unicode-Block „Basis-Lateinisch“ (den ersten 127 ASCII-Zeichen) enthalten sind, in ihr ASCII-Äquivalent umgewandelt, sofern ein solches existiert. Die Indexierung wandelt zum Beispiel à in a um.
- Sprachanalysator: Die Sprachanalysatoren werden auf den Inhalt und den Teasertext in News-Beiträgen und den Inhalt und die Beschreibung in Seiten angewendet. Ihr Ziel ist es, Sprachtexte nach den folgenden Punkten zu analysieren:
- Stoppwörter: Stoppwörter sind häufig verwendete Wörter in einer Sprache, die in der Regel bei Suchanfragen oder Textanalysen ignoriert werden, da sie als unwichtig für die Bedeutung eines Satzes gelten. Diese Wörter sind oft kurz und kommen häufig in einer Sprache vor, enthalten aber nur wenige spezifische Informationen über den Inhalt, wie z. B. „der“, „und“, „ist“, „in“, „von“ und „zu“.
- Stemming (Stammformreduktion): Beim Stemming werden Suffixe von Wörtern entfernt, um eine gemeinsame sprachliche Basis zu erhalten. Dies hilft dabei, Variationen eines Wortes zu gruppieren, die Dimensionalität der Daten zu reduzieren und die Effizienz der Textverarbeitung und -analyse zu verbessern.
- Sonderzeichen: Sonderzeichen wie !"#$%&'()*+,-./:;<=>?@[]^_`{|}~§° werden durch ein Leerzeichen ersetzt.
Wie werden Inhalte gerankt?
Staffbase verwendet einen Algorithmus für die Volltextsuche, der eine Kombination aus folgenden Kriterien darstellt:
- Begriffshäufigkeit: Die Anzahl, wie oft ein bestimmtes Wort (Begriff) in einem Dokument vorkommt
- Inverse Dokumenthäufigkeit: Die Wichtigkeit eines in einem Text verwendeten Begriffs unter Berücksichtigung der Begriffshäufigkeit und der Dokumenthäufigkeit
- Dokumentlänge: Die Länge eines Dokuments im Vergleich zur durchschnittlichen Länge aller Dokumente
Der Algorithmus berechnet einen Relevanz-Score für jedes Stichwort in der Suchanfrage. Die endgültige Punktzahl ergibt sich aus der Summe aller Relevanz-Scores.
Zusätzlich wendet Staffbase Boosts an, je nachdem, wo die Informationen übereinstimmen. Diese Boosts sind Multiplikationsfaktoren des Relevanz-Scores, wenn das Stichwort mit dem Inhalt übereinstimmt:
- Titel: x 3
- Seitenbeschreibung: x 2
Bei News-Beiträgen und Seiten wendet Staffbase Boosts an, um die neuesten Nachrichten zu priorisieren, was zu einem endgültigen Relevanz-Score führt:
- Heute oder gestern veröffentlicht: +15
- Diese oder letzte Woche veröffentlicht: +10
- Diesen oder letzten Monat veröffentlicht: +5
Die Ergebnisse werden so angeordnet, dass die relevantesten Ergebnisse ganz oben angezeigt werden.
Sie können auch die Dropdown-Menüs verwenden, um Ihre Suchergebnisse zu sortieren, z. B. nach Datum oder alphabetisch..
Kommentare
0 Kommentare
Bitte melden Sie sich an, um einen Kommentar zu hinterlassen.