1. Foren
  2. » Kommentare
  3. » Wirtschaft
  4. » Alle Kommentare zum Artikel
  5. » Apache-Suchmaschine Solr 1.4…

Platzbedarf ? Formate ?

Anzeige
  1. Thema

Neues Thema Ansicht wechseln


  1. Platzbedarf ? Formate ?

    Autor Siga9876 11.11.09 - 11:04

    Welche Formate können indiziert werden ?

    Wichtig bei sowas ist der Platzbedarf. Bei einem Inversen Index auf alles kommt man (unkomprimiert) wohl 1:1 D.h. 100 Mbyte HTML oder PDF oder txt o.ä. kommen auf ähnlich viel "Suchdaten" auch wenn die ursprungsformate recht viel "Luft"(Kram nach dem nicht gesucht wird) enthalten.
    Für größere Archive war das früher etwas kritisch. inzwischen ist es vielleicht egal.

    Aber wer sowas nutzen will, interessiert sich schon dafür, ob man z.b. selfhtml o.ä. für im handy-browser durchsuchbar machen kann und dafür den doppelten platz einrechnen muss.
    Für EReader mit vielen Büchern wäre es auch nicht uninteressant.

    Speziell wenn man z.b. Kataloge o.ä. dort ablegt/sammelt.

  2. Solr auf Handies und eBook-Readern?

    Autor schrat 11.11.09 - 11:20

    Hab ich etwas verpasst oder läuft der Application Server Apache Tomcat (die Umgebung für Solr) tatsächlich auch auf Handies und eBook-Readern?



    1 mal bearbeitet, zuletzt am 11.11.09 11:21 durch schrat.

  3. Re: Solr auf Handies und eBook-Readern?

    Autor Species8372 11.11.09 - 11:48

    Formate: http://lucene.apache.org/tika/formats.html

    Üblicherweise wird eher mehr Platz für den Index als die eigentlichen Daten benötigt.
    Am Handy könnte man natürlich schon suchen, wenn man über einen Browser auf seine eigene Suchmaschinen-Seite, die im Netz hängt, surft.

  4. Re: Platzbedarf ? Formate ?

    Autor Siga9876 11.11.09 - 11:59

    lucene/plucene usw. gabs früher auch "standalone" ohne Tomcat.

    Für Tomcat ist es laut golem-Text ja auch "nur" ein Applet wobei man vermuten/abschätzen muss, das es kein java-applet im Browser gemeint ist, was aber durch php/python/... später eher auszuschliessen ist.

    Vielleicht gibts inzwischen Suchmaschinen. Früher war das nicht ganz so einfach. Für EReader würde es Sinn machen.
    Man könnte die Indexe/Indizes ja auch am PC erstellen (clevers Stemming wäre auch so eine Aufgabe für den PC) und pro Buch/Dokument in den Reader schieben.
    Und ein normaler Buch-index überschreitet vielen ihre Fähigkeiten. Ich hatte wenigstens immer welche was bei Vorlesungsscripten sehr sinnig war.
    Und normale Indizes/Indexe wie in Lehrbüchern oder Gelben Seiten sind für Kataloge oder andere Dokumente evtl. nicht ganz so geeignet wie eine Volltext-suche.

Neues Thema Ansicht wechseln


Entschuldigung, nur registrierte Benutzer dürfen in diesem Forum schreiben. Klicken Sie hier um sich einzuloggen


Meistgelesen
  1. Libreoffice

    "Wir wollen Nutzer in die ODF-Welt ziehen"

  2. Browser

    Kauft Facebook Opera?

  3. Datenschutz

    Neue EU-Regeln zu Cookies treten in Kraft

  4. Blackberry

    RIM plant Massenentlassungen

  5. Samsung Galaxy S3

    Siri braucht sich nicht zu fürchten


Meistkommentiert
  1. Kommentare: 170 | letzter Beitrag 15:54 Uhr

  2. Kommentare: 94 | letzter Beitrag 26.05. 19:45

  3. Kommentare: 75 | letzter Beitrag 19:49 Uhr

  4. Kommentare: 70 | letzter Beitrag 18:56 Uhr

  5. Kommentare: 60 | letzter Beitrag 20:11 Uhr

Mehr



Haben wir etwas übersehen?

E-Mail an news@golem.de


Lockheed Martin: US-Soldaten in Afghanistan bekommen Exoskelett
Lockheed Martin
US-Soldaten in Afghanistan bekommen Exoskelett

Lockheed Martin hat eine neue Version des Exoskeletts Hulc vorgestellt, das es einem Menschen ermöglicht, schwere Lasten zu heben und zu tragen. Der Hersteller will das System im Spätsommer testen und, wenn alles gutgeht, danach an US-Soldaten in Afghanistan ausliefern.

  1. Rüstung Ramsch-Technik aus China in US-Waffensystemen

Project Glass: Videoaufnahme mit der Google-Brille
Project Glass
Videoaufnahme mit der Google-Brille

Immer wieder zeigt Google seine Project Glass genannten Datenbrillen, ohne aber bislang konkrete Ankündigungen zu machen. Neben zahlreichen Fotos, die mit der Brille gemacht wurden, stellte Google nun auch ein erstes Video, das mit der Brille aufgenommen wurde, ins Netz.

  1. Gedämpfte Erwartungen Google-Brille mit reduziertem Interface
  2. Google-Brille Ein Blick, ein Foto
  3. Project Glass Googles Datenbrille auch für Fehlsichtige

PGP vs. Geheimdienste: "PGP ist weiterhin sicher"
PGP vs. Geheimdienste
"PGP ist weiterhin sicher"

Symantec hat sich zu den Aussagen der Bundesregierung geäußert, nach denen Geheimdienste in der Lage seien, SSH oder PGP zu knacken oder zu umgehen. Mathematisch gesehen sei kein wirksamer Angriff bekannt.

  1. Bundesregierung Deutsche Geheimdienste können PGP entschlüsseln
  2. Mobilfunk Achtung, Eltern lesen mit!
  3. Überwachungskameras Aldi-Manager zoomten Kundinnen unter den Rock

  1. Renesas: Chiphersteller will ein Drittel der Beschäftigten loswerden
    Renesas
    Chiphersteller will ein Drittel der Beschäftigten loswerden

    Renesas ist nach Elpida der zweite schwer angeschlagene japanische Chiphersteller. Renesas, das Hitachi, Mitsubishi Electric und NEC gehört, macht Verlust und will seine größte Fabrik verkaufen.

  2. Blackberry: RIM plant Massenentlassungen
    Blackberry
    RIM plant Massenentlassungen

    RIM soll in den kommenden Tagen erneut einen massiven Stellenabbau ankündigen. "Ich habe herausgefunden, welche Teile ich in meinem Puzzle nicht mehr benötige", sagte Firmenchef Thorsten Heins.

  3. Browser: Kauft Facebook Opera?
    Browser
    Kauft Facebook Opera?

    Ein britisches Blog will erfahren haben, dass Facebook den norwegischen Browserhersteller Opera Software kaufen will. Beide Unternehmen wollen sich dazu nicht äußern.


  1. 15:41

  2. 13:23

  3. 14:48

  4. 14:29

  5. 14:24

  6. 12:30

  7. 12:23

  8. 18:49