indexed search
Aus TYPO3 Extensions Index (T3X)
Inhaltsverzeichnis |
[Bearbeiten] Beschreibung
Indexed Search Engine implementiert eine Volltextsuche. Die Extension besteht aus zwei Komponenten:
[Bearbeiten] Indexing Engine
Diese Komponente erstellt einen Index aller Wörter, die auf einer TYPO3-Website vorkommen. Dabei werden die einzelnen Seiten so indiziert, wie sie im Frontend erscheinen; hierzu greift die Engine auf den Cache zurück. Je nach dem, wo und wie häufig ein Wort auf einer Seite vorkommt, werden die Fundstellen unterschiedlich gewichtet, damit bei Suchanfragen möglichst relevante Ergebnisse geliefert werden können. Sobald eine Seite erstmals durch einen regulären Besucher im Frontend aufgerufen wird (Aufrufe von Backend Usern werden nicht berücksichtigt), wird sie in den Cache geschrieben und zugleich indiziert; um eine komplette Website sofort zu indexieren, kann crawler, ks_cacheall oder cwt_cacheall eingesetzt werden.
Features:
- Gewichtung abhängig von HTML-Tags:
- Prio 1 = <title>
- Prio 2 = <meta-keywords>
- Prio 3 = <meta-description>
- Prio 4 = <body>
- Indexierung von Download-Dokumenten (sofern die entsprechenden Tools auf dem Server installiert sind):
- PDF (Xpdf)
- ZIP (unzip)
- Word (catdoc (Linux) bzw. catdoc (Win))
- Excel (xlhtml)
- PowerPoint (xlhtml)
- RTF (UnRTF)
- Gewichtung nach Häufigkeit
- NICHT case-sensitiv
- Suche kann auf Teilbäume beschränkt werden, in dem Sektionen gebildet werden (plugin.tx_indexedsearch._DEFAULT_PI_VARS.sections - vgl. Ebner 2009, R19.5)
- einzelne Seiten können über die Seiteneigenschaften von der Suche ausgeschlossen werden
- einzelne Seitenbereiche können über Subpart-Markierungen im HTML-Template gezielt von der Indexierung ausgeschlossen werden (<!--TYPO3SEARCH_begin--> bzw. <!--TYPO3SEARCH_end-->)
[Bearbeiten] Suchformular & Trefferliste
Das Suchformular erlaubt es den Website-Besuchern, eine Volltextsuche auf einer TYPO3-Website durchzuführen. Das Formular wird in Form eines Plug-ins in eine Seite eingebaut. Es bietet einen Einfache Suche, eine Erweiterte Suche und eine Trefferliste. Die Suchanfrage werden an den Index gerichtet (nicht direkt an die Datenbank), so das die Trefferliste die Fundstellen nach Seiten (und nicht etwa nach Datenbanktabellen) auflisten kann.
Features:
- Einfache Suche (nur Suchbegriff)
- Erweiterte Suche (konfigurierbar)
- exakte Suche, Suche nach Wortteilen, Suche nach ähnlichen Begriffen, Phrasensuche
- Verknüpfung von Suchbegriffen über AND, OR, NOT
- Phrasen können für eine exakte Übereinstimmung in Anführungszeichen gesetzt werden
- Einschränkung des Suchbereichs auf PDF-Dateien, Word-Dateien, TYPO3-Seiten möglich
- unterstützt Mehrsprachigkeit (Einschränkung der Suche auf eine bestimmte Sprachvariante falls gewünscht)
- Einschränkung der Suche auf bestimmte Bereiche der Website möglich
- nach diversen kriterien sortierbare Trefferliste
- Berücksichtigt Zugriffsrechte von Frontend Usern: Treffer auf passwortgeschützten Seiten werden nur angezeigt, wenn der Benutzer die entsprechenden Rechte hat und eingeloggt ist.
Rules: * Only words with 2 or more characters are accepted * Max 200 chars total * Space is used to split words, "" can be used to search for a whole string (not indexed search then) * AND, OR and NOT are prefix words, overruling the default operator * +/|/- equals AND, OR and NOT as operators. * All search words are converted to lowercase.
[Bearbeiten] Kritik
Nachteile der Indexed Search sind:
- Führt bei grossen Websites zu einer Verlangsamung des Page Renderings und hat deshalb den Ruf eines Performance-Killers (insbesondere bei grösseren Websites)
- Nur Seiten, welche gecached werden können, werden indexiert/durchsucht.
[Bearbeiten] Screenshots
[Bearbeiten] Literatur
- Ripfel 2008, Kap. 8.5, S. 599-605.
- Alexander Ebner, Patrick Lobacher. "Indexierte Suche mit TYPO3: indexed_search richtig konfigurieren und nutzen". T3N Nr. 11 (2008), S. 86-88.
- Ebner 2009, Kap. 19, S. 277-290.
[Bearbeiten] Links
-
indexed_search in TYPO3 Forge
- Video-Tutorial von Wolfgang Wagner
- Tutorial (T3NET)
- Tutorial (undkonsorten)
- Forum (typo3forum.net)
- Forum (typo3.net)
[Bearbeiten] Siehe auch
[Bearbeiten] Erweiterungen
- cb_indexedsearch_autocomplete - Autocomplete- bzw. Suggest-Mechanismus
- ch_is_templates - HTML-Templates und Bugfixes
- doc_indexed_search - Dokumentation (wird automatisch mitinstalliert)
- dvdg_indexedsearch_patch - Patch gegen Indexierungsprobleme
- fhm_extended_search - Modifikation für das Extension-Paket der Fachhochschule Mainz (fmh_)
- indexed_search_mysql - Performance-Optimierung für indexed_search
- macina_searchbox - Formular für die Suchanfrage
- nr_indexedsearch_patch - Patch gegen Indexierungsprobleme
- ods_autocomplete - Auto-Complete
[Bearbeiten] Alternativen
- mnogosearch
- no_indexed_search
- powersearch - auf Apache Lucene basierende Volltextsuche für Datenbankinhalte und Dokumente
